Use este identificador para citar ou linkar para este item:
https://ric.cps.sp.gov.br/handle/123456789/22152
Título: | Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn |
Título(s) alternativo(s): | Comparative study of machine learning algorithms in Spark for Churn prediction |
Autor(es): | LEITE, Renan Sant'Ana Cerqueira |
Orientador(es): | DEZANI, Henrique DEZANI, Adriana Alvarenga |
Outro(s) contribuidor(es): | SIMONATO, Adriano Luís FONSECA, Everthon Silva |
Tipo documental: | Artigo científico |
Palavras-chave: | Machine learning;Algoritmos;Clientes - Fidelização;Empresas de prestação de serviços |
Data do documento: | 22-Jun-2023 |
Editor: | 121 |
Referência Bibliográfica: | LEITE, Renan Sant'Ana Cerqueira. Estudo comparativo de algoritmos de machine learning no Spark para a previsão de Churn. 2023. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Informática para Negócios) – Faculdade de Tecnologia de São José do Rio Preto, São José do Rio Preto, 2023. |
Resumo: | Este projeto apresenta um estudo comparativo de algoritmos de Machine Learning no Spark para a previsão de Churn em empresas de serviços. O Churn, ou taxa de cancelamento de clientes, é um desafio
significativo para empresas que buscam estudar como manter a fidelidade de seus clientes. Neste trabalho, foram explorados, analisados e avaliados diferentes algoritmos de Machine Learning, como Regressão Linear, Árvore de Decisão, Random Forest e Gradient Boosting, onde a métrica utilizada para a avaliação de todos os algoritmos foi a BinaryClassificationEvaluator, utilizando a plataforma do Spark, juntamente com o Python, por meio do Google Colab. A coleta dos dados foi realizada através do Kaggle, uma plataforma online de ciência de dados que oferece diversas bases de dados gratuitas voltadas para estudos e desenvolvimentos. Os resultados revelaram que determinados algoritmos apresentaram desempenho superior na previsão do que outros, oferecendo insights valiosos para empresas na adoção de estratégias de retenção de clientes. Este estudo contribui para a aplicação de técnicas de Machine Learning para previsões Churn, oferecendo visões comparativas dos algoritmos no contexto do Spark, possibilitando futuras pesquisas para otimização desses modelos. This project presents a comparative study of Machine Learning algorithms in Spark for Churn prediction in service companies. Churn, or customer cancellation rate, is a significant challenge for companies seeking to understand how to maintain customer loyalty. In this work, different Machine Learning algorithms such as Linear Regression, Decision Tree, Random Forest, and Gradient Boosting were explored, analyzed, and evaluated. The evaluation metric used for all algorithms was the BinaryClassificationEvaluator, utilizing the Spark platform along with Python through Google Colab. Data collection was performed through Kaggle, an online data science platform that provides various free datasets for studies and developments. The results revealed that certain algorithms outperformed others in prediction, offering valuable insights for companies in adopting customer retention strategies. This study contributes to the application of Machine Learning techniques for Churn prediction, providing comparative views of the algorithms in the Spark context and enabling future research for model optimization. |
URI: | https://ric.cps.sp.gov.br/handle/123456789/22152 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
informaticanegocios_2023_1_renansantanacerqueiraleite_estudocomparativodealgoritmosdemachine.pdf Restricted Access | 1.25 MB | Adobe PDF | Visualizar/Abrir Solictar uma cópia |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.