Use este identificador para citar ou linkar para este item: https://ric.cps.sp.gov.br/handle/123456789/22152
Título: Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn
Título(s) alternativo(s): Comparative study of machine learning algorithms in Spark for Churn prediction
Autor(es): LEITE, Renan Sant'Ana Cerqueira
Orientador(es): DEZANI, Henrique
DEZANI, Adriana Alvarenga
Outro(s) contribuidor(es): SIMONATO, Adriano Luís
FONSECA, Everthon Silva
Tipo documental: Artigo científico
Palavras-chave: Machine learning;Algoritmos;Clientes - Fidelização;Empresas de prestação de serviços
Data do documento: 22-Jun-2023
Editor: 121
Referência Bibliográfica: LEITE, Renan Sant'Ana Cerqueira. Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn. 2023. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Informática para Negócios) – Faculdade de Tecnologia de São José do Rio Preto, São José do Rio Preto, 2023.
Resumo: Este projeto apresenta um estudo comparativo de algoritmos de Machine Learning no Spark para a previsão de Churn em empresas de serviços. O Churn, ou taxa de cancelamento de clientes, é um desafio significativo para empresas que buscam estudar como manter a fidelidade de seus clientes. Neste trabalho, foram explorados, analisados e avaliados diferentes algoritmos de Machine Learning, como Regressão Linear, Árvore de Decisão, Random Forest e Gradient Boosting, onde a métrica utilizada para a avaliação de todos os algoritmos foi a BinaryClassificationEvaluator, utilizando a plataforma do Spark, juntamente com o Python, por meio do Google Colab. A coleta dos dados foi realizada através do Kaggle, uma plataforma online de ciência de dados que oferece diversas bases de dados gratuitas voltadas para estudos e desenvolvimentos. Os resultados revelaram que determinados algoritmos apresentaram desempenho superior na previsão do que outros, oferecendo insights valiosos para empresas na adoção de estratégias de retenção de clientes. Este estudo contribui para a aplicação de técnicas de Machine Learning para previsões Churn, oferecendo visões comparativas dos algoritmos no contexto do Spark, possibilitando futuras pesquisas para otimização desses modelos.
This project presents a comparative study of Machine Learning algorithms in Spark for Churn prediction in service companies. Churn, or customer cancellation rate, is a significant challenge for companies seeking to understand how to maintain customer loyalty. In this work, different Machine Learning algorithms such as Linear Regression, Decision Tree, Random Forest, and Gradient Boosting were explored, analyzed, and evaluated. The evaluation metric used for all algorithms was the BinaryClassificationEvaluator, utilizing the Spark platform along with Python through Google Colab. Data collection was performed through Kaggle, an online data science platform that provides various free datasets for studies and developments. The results revealed that certain algorithms outperformed others in prediction, offering valuable insights for companies in adopting customer retention strategies. This study contributes to the application of Machine Learning techniques for Churn prediction, providing comparative views of the algorithms in the Spark context and enabling future research for model optimization.
URI: https://ric.cps.sp.gov.br/handle/123456789/22152
Aparece nas coleções:Trabalhos de Conclusão de Curso

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
informaticanegocios_2023_1_renansantanacerqueiraleite_estudocomparativodealgoritmosdemachine.pdf
  Restricted Access
1.25 MBAdobe PDFVisualizar/Abrir    Solictar uma cópia


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.