O que é Análise Exploratória de Dados


A biblioteca Pandas do Python oferece uma ampla variedade de funções para conduzir a AED de maneira eficiente e efetiva. Às vezes, você pode querer executar operações apenas em colunas de um determinado tipo de dados. Por exemplo, você pode querer https://tripleten.com.br/ calcular medidas estatísticas como média, mediana, etc., apenas em colunas numéricas. Nestes casos, você pode filtrar as colunas com base em seus tipos de dados. Outra etapa importante na AED é a exploração dos valores únicos em seus dados.

O teste de estatística nos diz quantos desvios-padrão do centro devemos ir para determinar a área de probabilidade também conhecida como região crítica. Uma ferramenta de visualização de dados comumente usada para mostrar correlação entre duas variáveis. Conhecida como uma função de distribuição cumulativa empírica e uma função de distribuição cumulativa (Cumulative Distribution Function -CDF) são basicamente a mesma coisa. Isso significa que nossa variável não difere de uma distribuição normal, ou seja, nossa variável segue uma distribuição normal. Estes programas permitem-nos abrir os dados e criar diversos gráficos para começar a ter uma ideia de como é a informação que recebemos.

Para que serve a análise de dados

As maiores similaridades são encontradas entre abacaxi e ananás, laranja pêra e tangerina e entre laranja Bahia, limão verde e limão doce. A similaridade entre os abacates, entre as mangas, entre as bananas e entre a ata e a condessa também era esperada devido a proximidade botânica. A maçã vermelha é mais próxima de abacaxi e ananás do que da maçã branca, isto deve ter ocorrido por que a composição das maçãs diferem acentuadamente em fósforo e ferro. O grupo dos abacates diferem dos demais devido ao alto teor de lipídios e calorias. A finalidade da padronização e escalonamento dos dados originais é expressar cada observação em termos de variações inerentes ao sistema (autoescalonamento). Curso destinado a profissionais de marketing, operações, tecnologia, RH, finanças e outras áreas que buscam conhecimento introdutório em data science.

análise exploratória de dados

Criar visualizações com o PyGWalker é tão simples quanto arrastar e soltar suas variáveis. Por exemplo, para criar um gráfico de barras de vendas por região, você arrastaria a coluna “Vendas” para o eixo X e a coluna “Região” para o eixo Y. O PyGWalker também permite que você selecione o tipo de marca desejado análise exploratória de dados ou deixe-o em modo automático para que a ferramenta possa selecionar o tipo de gráfico mais adequado para você. Este arquivo markdown abrirá uma ferramenta interativa de visualização de dados que se parece muito com o Tableau. A parte esquerda da interface exibe as variáveis em seu conjunto de dados.

Quais são os tipos de análise de dados mais comuns?

No caso de uma distribuição normal padrão, ela combina nosso valor de estrela Z, tamanho e desvio padrão da amostra. Podemos ver no gráfico abaixo, que a base de dados onde os não sobreviventes aos acidente e que eram homens, possui mais outliers que nos demais grupos de pessoas. No geral, tanto a media de idade quanto o desvio padrão são bem similares em ambos os casos.

Ao fazer este processo, pode-se dizer que está sendo realizada uma Análise Exploratória de Dados (AED). A AED é um importante processo do trabalho do cientista de dados e serve para extrair informações de negócios. Como seria exaustivo responder todas as perguntas aqui, continuaremos a utilizar diferentes ferramentas para entender as perguntas feitas anteriormente. Vemos no dataset qual variável se encaixa melhor em cada classificação, remetemos novamente ao quadro anterior, e utilizamos a função glimpse() para entender como o R reconhece as variáveis. Essa ferramenta de análise de dados é um software estatístico utilizado em pesquisa acadêmica e científica, especialmente em disciplinas como psicologia, sociologia, economia e saúde. Agora, você só precisa apresentar as relações que você fez com os resultados obtidos de sua pesquisa.


Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *