Em princípio, como fazer um DataFrame com pandas é uma das principais dúvidas que surgem para quem está iniciando com programação em Python. A fim de esclarecer este tópico, neste post vou abordar este assunto e, consequentemente, te ajudar a ter informações importantes sobre como construir teu próprio DataFrame.
Para quem não conhece a biblioteca PANDAS, ela é simplesmente uma das libraries mais usadas em Python. Ela contem ferramentas de estrutura de dados, as famosas data structures e ferramentas de manipulação de dados que possibilitam, de forma rápida e fácil, fazer a limpeza e análise dos dados. pandas, normalmente, é usada em conjunto com bibliotecas analíticas e de computação numérica como NumPy, SciPy, statsmodels e scikit-learn. Uma das nuances de pandas é que ela trabalha com dados tabulares ou heterogêneos.
Estrutura de dados do pandas (Series e Dataframe)
pandas possui duas estruturas principais, que são as Series e DataFrame. Estas duas estruturas são capazes de solucionar quase tudo, pois fornecem bases sólidas e são fáceis de usar para a maioria das nossas aplicações.
Pandas Series
Uma Series nada mais é do que um objeto uni-dimensional ou vetor ou matriz de uma dimensão que contem valores e o índice associado ao respectivo valor. Por exemplo:
[in]: ser = pd.Series([5, 2, 7, 10, 1])
[in]: ser
[out]:
0 5
1 2
2 7
3 10
4 1
Outra forma de criar uma Series é através de um dicionário. Por exemplo:
[in]:
dic1 = {'A': 5, 'B': 2, 'C': 7, 'D': 10, 'E': 1}
ser3 = pd.Series(dic1)
[out]:
ser3
A 5
B 2
C 7
D 10
E 1
Pandas DataFrames
Um DataFrames representa uma tabela de dados caracterizada por colunas e linhas ordenadas. Cada coluna pode ter um tipo de valor (númerico, string, booleano etc.). As colunas e linhas no DataFrames possuem índices e são entendidos como um dicionário de Series que compartilham o mesmo índice.
Existem diferentes maneiras de se construir um DataFrames, uma delas é a ideia do dicionário, assim um DataFrames pode ser construído desta forma:
data = {'pronomes': ['eu', 'tu', 'ele', 'nos', 'vos', 'eles'],
'qtdd': [30, 21, 28, 11, 1, 25],
'txt': [5, 7, 6, 7, 9, 5]}
df = pd.DataFrame(data)
[out]:
pronomes qtdd txt
0 eu 30 5
1 tu 21 7
2 ele 28 6
3 nos 11 7
4 vos 1 9
5 eles 25 5
Outra forma de construir o DataFrames é passando as colunas:
df2 = pd.DataFrame(data, columns=['pronomes', 'txt', 'qtdd'])
Neste caso, o que aconteceria é a inversão da posição de ‘txt’ e ‘qtdd’, quando comparado ao df.
Os índices também podem ser alterados:
df2 = pd.DataFrame(data, columns=['pronomes', 'txt', 'qtdd'], index=['um', 'dois', 'tres', 'quatro', 'cinco', 'seis'])
Encontre aqui vagas e bolsas de Mestrado e Doutorado
Fundamentalmente, para você ter um direcionamento na sua Carreira Acadêmica é primordial saber e conhecer as oportunidades desse futuro que te espera. Sendo assim, preparei para você algumas oportunidades para ter acompanhamento, tanto para mestrado como para doutorado.
– Vagas e bolsas para Mestrado março de 2023
– Vagas e bolsas para Doutorado março de 2023
Quer turbinar teu trabalho acadêmico?
Já fiz Mestrado, Doutorado, Pós-Doutorado e participei de diversas bancas. Ajudo alunos de graduação, pós-graduação, mestrado, doutorado e profissionais a melhorar seus estudos aplicando Data Science.
Quer saber como posso te ajudar a melhorar teu trabalho acadêmico… Clique Aqui e não perca esta oportunidade!
Quer saber como turbinar o Excel… Clique Aqui e saiba mais!
Quer esclarecer alguma dúvida sobre apresentações, TCC, Mestrado, Doutorado ou Carreira Acadêmica?
Entre em contato pelo formulário abaixo e vamos fazer o planejamento do teu trabalho… não perca esta oportunidade!