Neste Imersão, proporcionada pela Alura em 2021, foram realizadas cinco aulas usando Python e Machine Learning para explorar o universo de descoberta de fármacos. Neste estudo, tivemos a participação do Guilherme Silveira, do Thiago Gonçalves Santos e da Vanessa Leiko Oikawa Cardoso.
- O que é Pandas e como usá-lo para descobrir insights a partir de conjuntos de dados;
- Plotagem de gráficos de pizza e de colunas;
- Plotagem e estilização de gráficos com Seaborn e MatplotLib;
- Recursos de seleção e tratamento de dados;
- Aplicação de histograma para visualizar a média de genes;
- Método
describe
, do Pandas, para obter a descrição estatística dos dados; - Compreensão do
boxplot
e técnicas para tratar outliers; - Cruzamento de informações dos dados, analisando relações entre colunas;
- Relacionamento inicial entre dados de experimentos e tipos genéticos;
- Utilização do gráfico de dispersão para investigar relações entre genes;
- Correlação e discussão sobre causalidade;
- Mapa de calor;
- Combinação de bases de dados com
merge
; - Análise de relação entre base de dados experimentais e resultados;
- Modelo de Machine Learning para classificação de compostos;
- Utilização da biblioteca Scikit-Learn;
- Regressão logística;
- Árvore de decisão;
- O que é overfitting.
Os projetos estão separados em 5 partes, todas organizadas no Google Colaboratory, logo, para acessá-las, clique nos links abaixo:
- Google Colaboratory: Ambiente de notebook interativo baseado na nuvem;
- Python: Linguagem de programação;
- Pandas: Biblioteca para manipulação e análise de dados;
- MatplotLib: Biblioteca para criação de gráficos e visualizações;
- Seaborn: Biblioteca de visualização de dados baseada no MatplotLib;
- Scikit-Learn: Biblioteca de aprendizado de máquina em Python.
Este projeto está licenciado sob a Licença MIT. Consulte o arquivo LICENSE
para obter mais informações sobre os termos de licenciamento.
✨ Feito com carinho por Andrieli Gonçalves.