Python: como fazer um Dataframe com pandas

Em princípio, como fazer um DataFrame com pandas é uma das principais dúvidas que surgem para quem está iniciando com programação em Python. A fim de esclarecer este tópico, neste post vou abordar este assunto e, consequentemente, te ajudar a ter informações importantes sobre como construir teu próprio DataFrame.

Python: como fazer um Dataframe com pandas
Como fazer um DataFrame com pandas em Python

Para quem não conhece a biblioteca PANDAS, ela é simplesmente uma das libraries mais usadas em Python. Ela contem ferramentas de estrutura de dados, as famosas data structures e ferramentas de manipulação de dados que possibilitam, de forma rápida e fácil, fazer a limpeza e análise dos dados. pandas, normalmente, é usada em conjunto com bibliotecas analíticas e de computação numérica como NumPy, SciPy, statsmodels e scikit-learn. Uma das nuances de pandas é que ela trabalha com dados tabulares ou heterogêneos.

Estrutura de dados do pandas (Series e Dataframe)

pandas possui duas estruturas principais, que são as Series e DataFrame. Estas duas estruturas são capazes de solucionar quase tudo, pois fornecem bases sólidas e são fáceis de usar para a maioria das nossas aplicações.

Pandas Series

Uma Series nada mais é do que um objeto uni-dimensional ou vetor ou matriz de uma dimensão que contem valores e o índice associado ao respectivo valor. Por exemplo:

[in]: ser =  pd.Series([5, 2, 7, 10, 1])
[in]: ser

[out]:
    0   5
    1   2
    2   7
    3   10
    4   1

Outra forma de criar uma Series é através de um dicionário. Por exemplo:

[in]:
dic1 = {'A': 5, 'B': 2, 'C': 7, 'D': 10, 'E': 1}
ser3 =  pd.Series(dic1)

[out]:
    ser3
    A   5
    B   2
    C   7
    D   10
    E   1

Pandas DataFrames

Um DataFrames representa uma tabela de dados caracterizada por colunas e linhas ordenadas. Cada coluna pode ter um tipo de valor (númerico, string, booleano etc.). As colunas e linhas no DataFrames possuem índices e são entendidos como um dicionário de Series que compartilham o mesmo índice.

Existem diferentes maneiras de se construir um DataFrames, uma delas é a ideia do dicionário, assim um DataFrames pode ser construído desta forma:

data = {'pronomes': ['eu', 'tu', 'ele', 'nos', 'vos', 'eles'],
        'qtdd': [30, 21, 28, 11, 1, 25],
        'txt': [5, 7, 6, 7, 9, 5]}
df = pd.DataFrame(data)

[out]:
        pronomes  qtdd  txt
    0   eu        30    5
    1   tu        21    7
    2   ele       28    6
    3   nos       11    7
    4   vos       1     9
    5   eles      25    5

Outra forma de construir o DataFrames é passando as colunas:

df2 = pd.DataFrame(data, columns=['pronomes', 'txt', 'qtdd'])

Neste caso, o que aconteceria é a inversão da posição de ‘txt’ e ‘qtdd’, quando comparado ao df.

Os índices também podem ser alterados:

df2 = pd.DataFrame(data, columns=['pronomes', 'txt', 'qtdd'], index=['um', 'dois', 'tres', 'quatro', 'cinco', 'seis'])

Encontre aqui vagas e bolsas de Mestrado e Doutorado

Fundamentalmente, para você ter um direcionamento na sua Carreira Acadêmica é primordial saber e conhecer as oportunidades desse futuro que te espera. Sendo assim, preparei para você algumas oportunidades para ter acompanhamento, tanto para mestrado como para doutorado.

– Vagas e bolsas para Mestrado março de 2023

– Vagas e bolsas para Doutorado março de 2023


    Leave A Comment