Curso oferecido pelo Kaggle



Criando, Lendo e Escrevendo

Tendo a pandas instalado (pip install pandas) o importamos em um script da seguinte forma:

import pandas as pd

Estruturas de dados

Na pandas há 2 estruturas básicas de dados:

  1. Dataframes
  2. Series

Um dataframe é o análogo a uma matriz tradicional (tabela) de programação, já a serie é análoga a um vetor (lista).

Dataframes

Vamos criar um dataframe simples, onde visualizaremos as respostas (sim ou não) para duas perguntas (A e B):

respostas = pd.DataFrame({'Sim': [50, 21], 'Não': [131, 2]})

Teremos uma tabela da seguinte forma:

<aside> 💬 Note que estamos passando um dicionário (dict) para a função DataFrame

</aside>

<aside> 💬 Por padrão a pandas cria índices (index) a partir de 0, assim como pode ser visto na primeira coluna da tabela

</aside>

Podemos modificar os índices padrões da pandas com o argumento index na função DataFrame: