Bem vinda(o) a Análise de Churn Rate😊

Churn Rate

Previsão de evasão de clientes, com tratamento e análises de dados, e criação e avaliação de modelo de Machine Learning.

🪧 Vitrine.Dev	Minha Vitrine
✨ Nome	Churn Rate
🏷️ Tecnologias	Python, Data Science, Machine Learning, Storytelling, Análise Churn Rate
🚀 URL	https://github.com/KaueAbbe/Challenge_ChurnRate/tree/main
🔥 Desafio	https://www.alura.com.br/challenges/data-science

Detalhes do projeto

Objetivo do Challenge: Predição de Churn Rate 🤔

Eu atuo como cientista de dados pela operadora de telecomunicações Alura Voz. Na reunião inicial com as pessoas responsáveis pela área de vendas da empresa, foi explicada a importância de se reduzir a Taxa de Evasão de Clientes, conhecido como Churn Rate. Basicamente, o Churn Rate indica o quanto a empresa perdeu de receita ou clientes em um período de tempo.

Eu sugeri, como passo inicial, a identificação de clientes que teriam uma maior chance de deixar a empresa. Para isso, expliquei que é interessante investigar algumas características de clientes ou dos planos de clientes para tentar CLASSIFICAR estas pessoas como potenciais candidatas a deixar a empresa ou não.

Assim, solicitei o conjunto de dados para começar a explorar, tratar e modelar a partir de agora. Em seguida, o foco será na otimização de cada um dos modelos com a finalidade de obter o melhor resultado para a tomada de decisão da Alura Voz.

Resumos das Etapas

Tratamento dos Dados

Realizei tratamento dos dados. Este processo contou as etapas de leitura dos dados, obtenção de informações básicas do dataset, buscando inconsistênicias como valores duplicados e faltantes. Correções foram feitas nas inconsitências encontradas. Como se trata de uma empresa brasileira foi feita a tradução dos dados do inglês para o português. Também alterei tipos de dados e criei o gasto diário do cliente. Salvei os dados tratados para utilizar no processo de análise exploratória.

Leitura, organização e compreensão dos dados
Análise de tipo de dados
Procura e correção das inconsistências
Tradução de colunas e valores
Criação de novo arquivo json para uso futuro

Análise Exploratória e Explanatória

Realizei análises estatísticas descritivas e inferenciais que resultaram em análises de features para dois grupos de clientes: evasores e remanescentes. Fazendo essa análise bivariada, destaquei as diferenças dos grupos em cada feature que apresentou diferença significativa pós teste de hipótese. Criei gráficos que expõem as diferenças entre os grupos, passando por features como idade do cliente, tipo de contrato, forma de pagamento, produtos usados, gastos dos clientes. E baseado nas análises sugeri como alternativa realizar um Marketing focado no público mais velho, que incentive a troca de serviços, como trocar a internet de DSL por fibra ótica, obtenção da assinatura de TV ou Streaming. Também incentivar a troca do tipo de contrato de mensal para anual, ou criar o tipo semestral. Esses incentivos podem ser feitos a partir de descontos por um período de tempo maior que 3 meses, já que bastante cliente evade com 2 meses e em sua maioria gastam mais que os remanescentes.

Análise da variável target, visualização da distribuição
Análise de dados qualitativos e quantitativos
Análise bivariada entre grupos evasores e não evasores
Data visualization
Testes de hipóteses
Storytelling

Criação do Modelo Classificação

Realizei a criação de um modelo de classificação que classifica com 81% de Recall os clientes em evasores ou não evasores. Inicei o processo com pré-processamento dos dados, fazendo encoding, balanceamento e normalizando. Separei os dados para treinar, testar e validar o modelo. Foi criado baseline e utilizado FeatureImportances para determinar quais features importam na classificação. Seis modelos de classificação foram treinados e testados, utilizando Recall e métrica de Bussines como fator de decisão. Após, dois modelos passaram pelo processo de otimização por Hiperparâmetros, e o melhor modelo foi verificado com 81% de Recall e 6% de perda clientes evasores.

Pré-Processamento dos Dados
Sepração dados treino, teste e validação
Definição de Recall e Métrica de Bussines para avaliação
Criação de um modelo Dummy e LogisticRegresion como Baseline
Criação de seis modelos de machine learning
Otimização por Hiperparâmetros do melhor modelo

Quais bibliotecas usei durante o Challenge?

Tratamento: Pandas 🐼|
Análise Exploratória: Pandas, Numpy, scipy, StatsModels, Plotly |
Criação do Modelo: Pandas, Numpy, Sklearn, YellowBrick, Pickle, seaborn, matplotlib |

Autor 🚀

Feito com 💙 por Kaue Hermann Abbehausen 👋🏽

1.Cientista de Dados

Formado em Física na Universidade Federal de Uberlândia

Mestre em Física Estatística na Universidade de Brasília

Name		Name	Last commit message	Last commit date
Latest commit History 78 Commits
1.Tratamento de Dados		1.Tratamento de Dados
2.Análise Exploratória		2.Análise Exploratória
3.Modelo Machine Learning		3.Modelo Machine Learning
README.md		README.md
Telco-Customer-Churn-Corrigido.json		Telco-Customer-Churn-Corrigido.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Bem vinda(o) a Análise de Churn Rate😊

Churn Rate

Detalhes do projeto

Objetivo do Challenge: Predição de Churn Rate 🤔

Resumos das Etapas

Tratamento dos Dados

Análise Exploratória e Explanatória

Criação do Modelo Classificação

Quais bibliotecas usei durante o Challenge?

Autor 🚀

Feito com 💙 por Kaue Hermann Abbehausen 👋🏽

1.Cientista de Dados

Formado em Física na Universidade Federal de Uberlândia

Mestre em Física Estatística na Universidade de Brasília

Entre em contato por

About

Releases

Packages

Languages

KaueAbbe/Analise_ChurnRate

Folders and files

Latest commit

History

Repository files navigation

Bem vinda(o) a Análise de Churn Rate😊

Churn Rate

Detalhes do projeto

Objetivo do Challenge: Predição de Churn Rate 🤔

Resumos das Etapas

Tratamento dos Dados

Análise Exploratória e Explanatória

Criação do Modelo Classificação

Quais bibliotecas usei durante o Challenge?

Autor 🚀

Feito com 💙 por Kaue Hermann Abbehausen 👋🏽 1.Cientista de Dados Formado em Física na Universidade Federal de Uberlândia Mestre em Física Estatística na Universidade de Brasília

Entre em contato por

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Feito com 💙 por Kaue Hermann Abbehausen 👋🏽

1.Cientista de Dados

Formado em Física na Universidade Federal de Uberlândia

Mestre em Física Estatística na Universidade de Brasília

Packages