Frequentemente, precisamos fazer uma tabela no MS Excel, onde concentramos dados de diferentes arquivos ou fontes. Os dados podem ter origem diferente do MS Excel e por isso estarem com […]
Tag: Datasets
Série temporal
Série Temporal Antes de tudo, no dia-a-dia, não só na vida acadêmica e no cotidiano, nos deparados com medições do tempo ou com algo que mesmo indiretamente esteja relacionado ao […]
Revisão Bibliográfica Sistemática
Revisão Bibliográfica Sistemática (RBS) tem por objetivo fazer uma discussão intensiva sobre um tópico ou tema específico. Para este fim recorre-se uma revisão da literatura científica (artigos), sobre o tópico, […]
Python para iniciantes e visualização de dados
Python para iniciantes e visualização de dados tem o objetivo de preencher uma lacuna existente na formação acadêmica e profissional de todos aqueles que precisam fazer apresentações de dados ou resultados em suas atividades.
Como fazer um Gráfico de diferenças Dumbbell
Em primeiro lugar, Gráfico Dumbbell ou gráfico de diferenças é uma variação do Gráfico Lollipop e nós, frequentemente, podemos usá-lo como uma alternativa ao gráfico de barras clasterizado. Também pode-se […]
Como instalar Zotero no Linux Peppermint 11
Este post mostrará como instalar Zotero no Linux Peppermint 11. Em primeiro lugar, originalmente, a instalação roda no Ubuntu 20.04, mas eu uso o Peppermint 11 e funcionou muito bem. […]
Como controlar os limites de um gráfico usando seaborn e matplotlib
Olá pessoas, neste post tu aprenderás como controlar os limites de um gráfico scatterplot usando a biblioteca seaborn e matplotlib. É muito importante poder controlar os limites de um gráfico […]
Adição de ruído para diminuir overfitting
Treinar um modelo com uma quantidade de dados que seja muito pequena ou que não represente o todo, pode fazer com que o modelo memorize todas as amostras de treino, isso é chamado overfitting e fará com que o modelo perca robustez e tenha uma performance baixa.
Visualização de dados: comparações, proporções, tamanhos e quantidades
Começo este post perguntando, com um gráfico de correlação ou de pontos é possível ter noção da proporção, tamanho ou quantidade das grandezas envolvidas? Vai pensando aí… Vou exemplificar, mostrando […]
Como fazer Heatmap ou mapa de calor em Python usando seaborn e imshow
Segundo a definição mais usada, um mapa de calor ou como comumente é usado, heatmap, é uma técnica de visualização de dados que mostra a magnitude de um fenômeno em […]
Como criar uma base de dados com Python
Encontrar Bases de dados confiáveis, acessíveis e que tenham aderência as necessidades de quem trabalha com análise de dados é um desafio, tanto para quem está iniciando, quanto para quem tem muito tempo de experiência. Nesse post mostro como gerar uma base de dados, que servirá para diversos projetos, a partir de uma base pré-existente.
Geopandas – using multiple layers to enhance the map visualization
Mesmo usando os comandos e procedimentos certos, nem sempre se consegue obter os melhores mapas com a riqueza de detalhes que o projeto exige. Por isso é importante usar certos […]