Tópico 5: Análise Exploratória de Dados (AED)

A Análise Exploratória de Dados, vulgarmente conhecida como AED, engloba a tarefa essencial de realizar exames iniciais aos dados para revelar tendências, identificar irregularidades, validar hipóteses e escrutinar pressupostos subjacentes através da utilização de métricas resumidas e representações visuais (Patil, 2018).

Canva Images

A AED é utilizada para analisar grandes quantidades de dados (Big Data), ajudando os processos de tomada de decisão implementados em empresas, agências governamentais e organizações internacionais. Existem três tipos de AED:

i) Univariada: Este método analisa uma variável, ou coluna de dados, de cada vez

ii) Multivariada: Analisa múltiplas variáveis, explorando as suas relações

iii) Bivariada: O tipo mais usual de AED multivariada, analisando a relação de apenas duas variáveis

Sugestão: Normalmente, é melhor realizar primeiro uma AED univariada em cada componente da AED multivariada antes de realizar uma AED multivariada (Seltman, 2018). 

Um exemplo simples de código do primeiro passo da EAD

import pandas as pd
import numpy as np
import seaborn as sns

data = pd.read_csv(“C:/Users/User/Desktop/Folder/something.csv”)

Implementação da recolha de dados: o exemplo do abacate