Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/22152
Title: Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn
Other Titles: Comparative study of machine learning algorithms in Spark for Churn prediction
Authors: LEITE, Renan Sant'Ana Cerqueira
Advisor: DEZANI, Henrique
DEZANI, Adriana Alvarenga
Other contributor: SIMONATO, Adriano Luís
FONSECA, Everthon Silva
type of document: Artigo científico
Keywords: Machine learning;Algoritmos;Clientes - Fidelização;Empresas de prestação de serviços
Issue Date: 22-Jun-2023
Publisher: 121
Citation: LEITE, Renan Sant'Ana Cerqueira. Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn. 2023. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Informática para Negócios) – Faculdade de Tecnologia de São José do Rio Preto, São José do Rio Preto, 2023.
Abstract: Este projeto apresenta um estudo comparativo de algoritmos de Machine Learning no Spark para a previsão de Churn em empresas de serviços. O Churn, ou taxa de cancelamento de clientes, é um desafio significativo para empresas que buscam estudar como manter a fidelidade de seus clientes. Neste trabalho, foram explorados, analisados e avaliados diferentes algoritmos de Machine Learning, como Regressão Linear, Árvore de Decisão, Random Forest e Gradient Boosting, onde a métrica utilizada para a avaliação de todos os algoritmos foi a BinaryClassificationEvaluator, utilizando a plataforma do Spark, juntamente com o Python, por meio do Google Colab. A coleta dos dados foi realizada através do Kaggle, uma plataforma online de ciência de dados que oferece diversas bases de dados gratuitas voltadas para estudos e desenvolvimentos. Os resultados revelaram que determinados algoritmos apresentaram desempenho superior na previsão do que outros, oferecendo insights valiosos para empresas na adoção de estratégias de retenção de clientes. Este estudo contribui para a aplicação de técnicas de Machine Learning para previsões Churn, oferecendo visões comparativas dos algoritmos no contexto do Spark, possibilitando futuras pesquisas para otimização desses modelos.
This project presents a comparative study of Machine Learning algorithms in Spark for Churn prediction in service companies. Churn, or customer cancellation rate, is a significant challenge for companies seeking to understand how to maintain customer loyalty. In this work, different Machine Learning algorithms such as Linear Regression, Decision Tree, Random Forest, and Gradient Boosting were explored, analyzed, and evaluated. The evaluation metric used for all algorithms was the BinaryClassificationEvaluator, utilizing the Spark platform along with Python through Google Colab. Data collection was performed through Kaggle, an online data science platform that provides various free datasets for studies and developments. The results revealed that certain algorithms outperformed others in prediction, offering valuable insights for companies in adopting customer retention strategies. This study contributes to the application of Machine Learning techniques for Churn prediction, providing comparative views of the algorithms in the Spark context and enabling future research for model optimization.
URI: https://ric.cps.sp.gov.br/handle/123456789/22152
Appears in Collections:Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
informaticanegocios_2023_1_renansantanacerqueiraleite_estudocomparativodealgoritmosdemachine.pdf
  Restricted Access
1.25 MBAdobe PDFView/Open Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.