customerID
: número de identificação único de cada clienteChurn
: se o cliente deixou ou não a empresagender
: gênero (masculino e feminino)SeniorCitizen
: informação sobre um cliente ter ou não idade igual ou maior que 65 anosPartner
: se o cliente possui ou não um parceiro ou parceiraDependents
: se o cliente possui ou não dependentestenure
: meses de contrato do clientePhoneService
: assinatura de serviço telefônicoMultipleLines
: assinatura de mais de uma linha de telefoneInternetService
: assinatura de um provedor internetOnlineSecurity
: assinatura adicional de segurança onlineOnlineBackup
: assinatura adicional de backup onlineDeviceProtection
: assinatura adicional de proteção no dispositivoTechSupport
: assinatura adicional de suporte técnico, menos tempo de esperaStreamingTV
: assinatura de TV a caboStreamingMovies
: assinatura de streaming de filmesContract
: tipo de contratoPaperlessBilling
: se o cliente prefere receber online a faturaPaymentMethod
: forma de pagamentoCharges.Monthly
: total de todos os serviços do cliente por mêsCharges.Total
: total gasto pelo cliente
A Alura Voz é uma empresa de telecomunicação que nos contratou para atuar como cientistas de dados na equipe de vendas. Logo na primeira semana, a liderança nos informa que é muito necessário realizar um estudo quanto ao Churn da empresa. É explicado que o churn indica se um cliente cancelou ou não o contrato com a empresa, e também que, nos casos de perda do cliente a empresa também perde faturamento, o que ocasiona prejuizos na receita final.
Desse modo, nossa liderança informa que temos 4 semanas para buscar uma alternativa que possa minimizar a saída de clientes e nos entrega um conjunto de dados da Alura Voz que contém diversas informações sobre os clientes e também informa se eles deixaram ou não a empresa.
Sabemos que, antes de pensar em qualquer alternativa, é preciso entender as informações que recebemos e, após uma pequena reunião, concluímos que na primeira semana nós nos dedicaríamos a entender o banco de dados, descobrir os tipos de dados, verificar a existencia de valores incoerentos e corrigi-los caso seja necessário.
Ao observar a Base de dados da Alura Voz, verificamos que essa é uma base disponibilizada via API em formato JSON com várias camandas de dados.
Junnto a esses dados também foi disponibilizado o dicionário dos dados que nele contém todas as informações sobre as colunas do banco de dados.
Nela, além da informação se o cliente deixou ou não a empresa, também contém:
Cliente:
gender
: gênero (masculino e feminino)SeniorCitizen
: informação sobre um cliente ter ou não idade igual ou maior que 65 anosPartner
: se o cliente possui ou não um parceiro ou parceiraDependents
: se o cliente possui ou não dependentes
Serviço de telefonia
tenure
: meses de contrato do clientePhoneService
: assinatura de serviço telefônicoMultipleLines
: assisnatura de mais de uma linha de telefone
Serviço de internet
InternetService
: assinatura de um provedor internetOnlineSecurity
: assinatura adicional de segurança onlineOnlineBackup
: assinatura adicional de backup onlineDeviceProtection
: assinatura adicional de proteção no dispositivoTechSupport
: assinatura adicional de suporte técnico, menos tempo de esperaStreamingTV
: assinatura de TV a caboStreamingMovies
: assinatura de streaming de filmes
Contrato
Contract
: tipo de contratoPaperlessBilling
: se o cliente prefere receber online a faturaPaymentMethod
: forma de pagamentoCharges.Monthly
: total de todos os serviços do cliente por mêsCharges.Total
: total gasto pelo cliente
Tendo essas informações entendemos nossos dados e, assim, podemos realizar uma análise mais técnica, buscando entender JSON, os dados e realizar o tratamento deles.
Todo o desenvolvimento feito na nossa 1° semana pode ser observado no notebook semana 1.
#alura #alurachallengedatascience1