Esse desafio consiste em desenvolver e aplicar habilidades de Ciência de dados como explorar, tratar e modelar os dados, focando na otimização de cada um dos modelos com a finalidade de obter o melhor resultado para a tomada de decisão.
O desafio terá 4 semanas divididos em:
- 📌 Semana 1 - limpeza dos dados trazidos de uma API ✔️
- 📌 Semana 2 - Explorando os dados: vendo as informações por uma outra perspectiva ✔️
- 📌 Semana 3 e 4 - Exterminando o futuro: Criando modelos de ML 🛠️
Mais detalhes do processo aqui
Realizar o entendimento inicial dos dados, quantas colunas e registros, com qual tipo de dados estamos trabalhando e se existem registros null/na.
- Entender quais informações o conjunto de dados possui ✔️
- Analisar quais os tipos de dados ✔️
- Verificar quais são as inconsistências nos dados ✔️
- Corrigir as inconsistências nos dados ✔️
- Traduzir as colunas
- Criar coluna de contas diárias ✔️
Mais detalhes do processo aqui
Mais detalhes do processo aqui
Realizar a exploração dos dados em principal foco a nova variável Churn, buscando correlações e distribuições com as outras variáveis.
- Analisar a variável target: Churn ✔️
- Foi verificado a distribuição da variável cancelouPlano, observamos que é uma porcentagem menor dos casos que os clientes cancelam o plano, porém ainda é necessário uma análise das correlações.
- Visualizar a distribuição da variável target: Churn ✔️
- Veriiquei a relação da distribuição com as variáveis mais correlacionadas no heatmap: mesesContrato e totalServicosMensalmente
- Veriiquei a relação da distribuição com as variáveis mais correlacionadas no heatmap: mesesContrato e totalServicosMensalmente
- Criar visualizações relevantes em relação ao Churn ✔️
- Analisar a correlação das variáveis ✔️
Conclusão:
- Idosos tem uma alta taxa de cancelamento
- Pessoas que não tem segurança online tem cancelado mais
- Pessoas sem backup online tem cancelado mais
- Pessoas que não tem suporte tem cancelado mais
- Pessoas com contratos mensais tem mais chance de cancelar o plano e cancelam nos primeiros meses
- As pessoas que cancelam pagam mensalmente entre 70-100 reais
- Pessoas com conta eletrônica tem uma alta taxa de cancelamento
Logo, clientes novos tem mais tendência de cancelar o seu plano comparado com clientes antigos. Os clientes com menos serviços (Segurança Online, suporte e backup) tem mais chances de cancelar, provavelmente porque o plano "deixa a desejar" nesses pontos, dificultando o uso.
As pessoas preferem o pagamento eletrônico, porém a maioria das pessoas que cancelam utilizam a conta eletrônica e tem o contato mensal. Verificamos que os clientes que pagam entre 70-100 mensalmente tem mais chances de cancelar o plano (seria interessante verificar planos de desconto pensando na permanencia dos proximos clientes).
Mais detalhes do processo aqui