Esse é meu projeto do Challenge de Data Science promovido pela Alura, em maio de 2022. Esse é um projeto onde as entregas são semanais e cada semana é usada para um lote de entregas no modelo de sprints.
O challenge consiste em analisar os dados de um operadora fictícia de planos de voz e internert e resolver um problema: diminuir o churn rate (ou taxa de evasão) dos clientes.
ANÁLISE DE CHURN RATE
Solicitante: Alura Voz
Objetivo: Reduzir a taxa de evasão dos clientes
Material para análise: Os dados disponibizados pela empresa estão no formato json e compreendem toda a base de clientes.
Observação: Na vida real, os dados desse estudo são fornecidos pelo Massachusetts Instituite of Technology (MIT). Todo o dataset está inglês.
Execução de tarefas: As taregas do projeto são liberadas no Trello pela Alura toda semana. O desenvolvimento do projeto segue a metodologia ágil.
SEMANA 01
Na primeira semana, as entregas do projeto foram baseadas em uma #EDA, passando pelo processo de #ETL dos dados e fazendo as primeiras considerações.
Nessa etapa também fiz uma tradução dos dados para pt-br e já padronizei os dados binários em formatos que lá na frente possibilida o estudo com modelos de #machinelearning.
Todas as atividades executadas estão documentadas no notebook.
SEMANA 02
Na segunda semana, a ideia foi fazer uma análise visual dos dados, gerando gráficos com boas práticas de #datavisualization. O foco dessa visualização foi na variável target do projeto - o churn rate.
Todas as atividades executadas estão documentadas no notebook.
SEMANA 03
Na terceira semana, entrei na área de Machine Learning, avaliando e aplicando o balanceamento na variável target, aplicando 3 modelos de Machine Learning, escolhendo e otimizando o melhor modelo.
Essa foi a etapa de conclusão do projeto onde pude validar as hipóteses e sugerir ações para redução da taxa de evasão de clientes.
Todas as atividades executadas estão documentadas no notebook.