Comando Pandas: df.pivot() – Cria uma tabela pivot a partir de um DataFrame.

O Pandas é uma biblioteca poderosa para manipulação e análise de dados em Python, oferecendo uma ampla gama de funcionalidades que facilitam o trabalho com DataFrames. Um dos métodos mais úteis para a reorganização de dados é o df.pivot(), que permite criar tabelas dinâmicas a partir de um DataFrame existente. Neste artigo, iremos explorar como funciona o comando df.pivot() e apresentar alguns exemplos práticos para ilustrar sua aplicação.

Entendendo o Comando df.pivot() no Pandas para Tabelas Dinâmicas

O método df.pivot() é utilizado para reestruturar um DataFrame, transformando colunas em índices ou vice-versa. Ele permite que você crie uma nova tabela onde os valores em uma coluna se tornam as colunas da nova tabela, enquanto os valores em outra coluna se tornam os índices. Este método é particularmente útil quando se deseja resumir dados categóricos e analisar a relação entre diferentes variáveis. A estrutura básica do comando exige três argumentos principais: index, columns e values. O argumento index define a coluna que se tornará o índice da nova tabela, columns especifica a coluna que se tornará as colunas da tabela pivot, e values indica os dados que preencherão as células da nova tabela.

Exemplos Práticos de Uso do df.pivot() em DataFrames

Para ilustrar o uso do df.pivot(), consideremos um DataFrame simples que contém informações sobre vendas de produtos em diferentes regiões. Suponha que temos o seguinte DataFrame:

import pandas as pd

data = {
    'Região': ['Norte', 'Sul', 'Leste', 'Oeste', 'Norte', 'Sul'],
    'Produto': ['A', 'A', 'B', 'B', 'B', 'A'],
    'Vendas': [100, 200, 150, 300, 250, 100]
}

df = pd.DataFrame(data)

Com este DataFrame, podemos criar uma tabela pivot que mostra as vendas de cada produto por região. O comando seria:

tabela_pivot = df.pivot(index='Região', columns='Produto', values='Vendas')

Isso resultaria em uma tabela com as regiões como índices e os produtos como colunas, preenchida com os valores de vendas correspondentes. Essa reorganização permite uma visualização mais clara e rápida das vendas por produto em cada região, facilitando análises e decisões de negócio.

O método df.pivot() do Pandas é uma ferramenta essencial para qualquer analista de dados que busca reorganizar e resumir informações de maneira eficaz. Sua capacidade de transformar um DataFrame em uma tabela dinâmica permite que os usuários analisem dados complexos de forma mais intuitiva. Através dos exemplos apresentados, é possível perceber a versatilidade dessa função, que pode ser aplicada em diversos contextos analíticos. Ao dominar o df.pivot(), você estará melhor preparado para extrair insights valiosos de conjuntos de dados.

Leia mais