Curso oferecido pelo Kaggle
Tendo a pandas instalado (pip install pandas
) o importamos em um script da seguinte forma:
import pandas as pd
Na pandas há 2 estruturas básicas de dados:
Um dataframe é o análogo a uma matriz tradicional (tabela) de programação, já a serie é análoga a um vetor (lista).
Vamos criar um dataframe simples, onde visualizaremos as respostas (sim ou não) para duas perguntas (A e B):
respostas = pd.DataFrame({'Sim': [50, 21], 'Não': [131, 2]})
Teremos uma tabela da seguinte forma:
<aside>
💬 Note que estamos passando um dicionário (dict) para a função DataFrame
</aside>
<aside> 💬 Por padrão a pandas cria índices (index) a partir de 0, assim como pode ser visto na primeira coluna da tabela
</aside>
Podemos modificar os índices padrões da pandas com o argumento index
na função DataFrame
: