A Análise Exploratória de Dados é uma das principais fases da estrutura de um projecto de Data Science. Contribui para uma diminuição das dimensões do conjunto de dados, tornando o problema menos complexo, e ainda a levar menos tempo a efectuar o treino dos modelos de machine learning, num passo subsequente. Além disso, a Análise Exploratória de Dados é uma actividade fundamental para termos uma primeira noção do tipo de dados que temos à nossa disposição.
Assim, os principais objectivos desta análise são:
- Maximizar os insights no conjunto de dados
- Relevar estruturas e padrões características do conjunto de dados
- Detectar anomalias e outliers
- Extrair e seleccionar variáveis mais importantes
- Avaliar premissas existentes (e.g., intuições de negócio actuais)
- Preparar todo o conjunto de dados para um modelo mais simples e com capacidade preditiva e explicativa elevada