Skip to content

Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021

License

Notifications You must be signed in to change notification settings

strawndri/imersao-dados-2021

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🤿| Imersão Dados 2021

Licença Status

Índice

Sobre o projeto

Neste Imersão, proporcionada pela Alura em 2021, foram realizadas cinco aulas usando Python e Machine Learning para explorar o universo de descoberta de fármacos. Neste estudo, tivemos a participação do Guilherme Silveira, do Thiago Gonçalves Santos e da Vanessa Leiko Oikawa Cardoso.

Aprendizagens

  • O que é Pandas e como usá-lo para descobrir insights a partir de conjuntos de dados;
  • Plotagem de gráficos de pizza e de colunas;
  • Plotagem e estilização de gráficos com Seaborn e MatplotLib;
  • Recursos de seleção e tratamento de dados;
  • Aplicação de histograma para visualizar a média de genes;
  • Método describe, do Pandas, para obter a descrição estatística dos dados;
  • Compreensão do boxplot e técnicas para tratar outliers;
  • Cruzamento de informações dos dados, analisando relações entre colunas;
  • Relacionamento inicial entre dados de experimentos e tipos genéticos;
  • Utilização do gráfico de dispersão para investigar relações entre genes;
  • Correlação e discussão sobre causalidade;
  • Mapa de calor;
  • Combinação de bases de dados com merge;
  • Análise de relação entre base de dados experimentais e resultados;
  • Modelo de Machine Learning para classificação de compostos;
  • Utilização da biblioteca Scikit-Learn;
  • Regressão logística;
  • Árvore de decisão;
  • O que é overfitting.

Como acessar o projeto?

Os projetos estão separados em 5 partes, todas organizadas no Google Colaboratory, logo, para acessá-las, clique nos links abaixo:

Tecnologias utilizadas

  • Google Colaboratory: Ambiente de notebook interativo baseado na nuvem;
  • Python: Linguagem de programação;
  • Pandas: Biblioteca para manipulação e análise de dados;
  • MatplotLib: Biblioteca para criação de gráficos e visualizações;
  • Seaborn: Biblioteca de visualização de dados baseada no MatplotLib;
  • Scikit-Learn: Biblioteca de aprendizado de máquina em Python.

Licença

Este projeto está licenciado sob a Licença MIT. Consulte o arquivo LICENSE para obter mais informações sobre os termos de licenciamento.


✨ Feito com carinho por Andrieli Gonçalves.

About

Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published