Please use this identifier to cite or link to this item:
https://ric.cps.sp.gov.br/handle/123456789/22152
Title: | Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn |
Other Titles: | Comparative study of machine learning algorithms in Spark for Churn prediction |
Authors: | LEITE, Renan Sant'Ana Cerqueira |
Advisor: | DEZANI, Henrique DEZANI, Adriana Alvarenga |
Other contributor: | SIMONATO, Adriano Luís FONSECA, Everthon Silva |
type of document: | Artigo científico |
Keywords: | Machine learning;Algoritmos;Clientes - Fidelização;Empresas de prestação de serviços |
Issue Date: | 22-Jun-2023 |
Publisher: | 121 |
Citation: | LEITE, Renan Sant'Ana Cerqueira. Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn. 2023. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Informática para Negócios) – Faculdade de Tecnologia de São José do Rio Preto, São José do Rio Preto, 2023. |
Abstract: | Este projeto apresenta um estudo comparativo de algoritmos de Machine Learning no Spark para a previsão de Churn em empresas de serviços. O Churn, ou taxa de cancelamento de clientes, é um desafio
significativo para empresas que buscam estudar como manter a fidelidade de seus clientes. Neste trabalho, foram explorados, analisados e avaliados diferentes algoritmos de Machine Learning, como Regressão Linear, Árvore de Decisão, Random Forest e Gradient Boosting, onde a métrica utilizada para a avaliação de todos os algoritmos foi a BinaryClassificationEvaluator, utilizando a plataforma do Spark, juntamente com o Python, por meio do Google Colab. A coleta dos dados foi realizada através do Kaggle, uma plataforma online de ciência de dados que oferece diversas bases de dados gratuitas voltadas para estudos e desenvolvimentos. Os resultados revelaram que determinados algoritmos apresentaram desempenho superior na previsão do que outros, oferecendo insights valiosos para empresas na adoção de estratégias de retenção de clientes. Este estudo contribui para a aplicação de técnicas de Machine Learning para previsões Churn, oferecendo visões comparativas dos algoritmos no contexto do Spark, possibilitando futuras pesquisas para otimização desses modelos. This project presents a comparative study of Machine Learning algorithms in Spark for Churn prediction in service companies. Churn, or customer cancellation rate, is a significant challenge for companies seeking to understand how to maintain customer loyalty. In this work, different Machine Learning algorithms such as Linear Regression, Decision Tree, Random Forest, and Gradient Boosting were explored, analyzed, and evaluated. The evaluation metric used for all algorithms was the BinaryClassificationEvaluator, utilizing the Spark platform along with Python through Google Colab. Data collection was performed through Kaggle, an online data science platform that provides various free datasets for studies and developments. The results revealed that certain algorithms outperformed others in prediction, offering valuable insights for companies in adopting customer retention strategies. This study contributes to the application of Machine Learning techniques for Churn prediction, providing comparative views of the algorithms in the Spark context and enabling future research for model optimization. |
URI: | https://ric.cps.sp.gov.br/handle/123456789/22152 |
Appears in Collections: | Trabalhos de Conclusão de Curso |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
informaticanegocios_2023_1_renansantanacerqueiraleite_estudocomparativodealgoritmosdemachine.pdf Restricted Access | 1.25 MB | Adobe PDF | View/Open Request a copy |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.