Use este identificador para citar ou linkar para este item: https://ric.cps.sp.gov.br/handle/123456789/44663
Título: Além das métricas: análise de comportamento preditivo na seleção de modelos de machine learning para o risco de diabetes.
Título(s) alternativo(s): Beyond metrics: predictive behavior analysis in machine learning model selection for diabetes risk.
Autor(es): PIRES, Guilherme Ozores
VIEIRA, Gustavo Pereira
Orientador(es): VILLANI, Leonardo
Outro(s) contribuidor(es): VILLANI, Leonardo
CÓ, Cristina dos Santos
ARAÚJO, Roberto de Oliveira
Tipo documental: Monografia
Palavras-chave: Processamento de dados;Diabetes mellitus
Data do documento: Jun-2025
Editor: 129
Referência Bibliográfica: PIRES, Guilherme Ozores; VIEIRA, Gustavo Pereira. Além das métricas: análise de comportamento preditivo na seleção de modelos de machine learning para o risco de diabetes, 2025. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Praia Grande, Praia Grande, 2025.
Resumo: "O Diabetes Mellitus tipo 2 é uma doença crônica com prevalência crescente, representando um significativo desafio para a saúde pública. A detecção precoce é um fator crucial para a prevenção de complicações graves e, neste contexto, o objetivo deste trabalho foi desenvolver e avaliar um modelo preditivo de aprendizado de máquina para identificar indivíduos de alto risco, utilizando o dataset PIMA Indians Diabetes como estudo de caso. A metodologia envolveu um rigoroso pipeline de pré-processamento, seguido da avaliação de nove algoritmos através de métricas quantitativas (AUC, Recall), otimização de limiar e, de forma decisiva, uma validação qualitativa com perfis clínicos sintéticos. Os resultados demonstraram que a análise de plausibilidade foi indispensável para desqualificar algoritmos com altas métricas que apresentaram comportamentos de risco, como o Gradient Boosting. Este processo consagrou o modelo Random Forest como a solução superior, por apresentar o melhor equilíbrio entre performance quantitativa e um comportamento preditivo seguro e coerente. Conclui-se que a validação de comportamento clínico é uma etapa indispensável no desenvolvimento de ferramentas de IA responsáveis para a saúde, superando a avaliação baseada unicamente em métricas estatísticas. "
Type 2 Diabetes Mellitus is a chronic disease with a growing prevalence, representing a significant public health challenge. Early detection is a crucial factor in preventing severe complications, and in this context, the objective of this work was to develop and evaluate a predictive machine learning model to identify individuals at high risk, using the PIMA Indians Diabetes dataset as a case study. The methodology involved a rigorous preprocessing pipeline, followed by the evaluation of nine algorithms through quantitative metrics (AUC, Recall), threshold optimization, and, decisively, a qualitative validation with synthetic clinical profiles. The results showed that, although several models had high metric performance, the plausibility analysis was indispensable for disqualifying algorithms with high-risk behaviors, such as Gradient Boosting. This process established the Random Forest model as the superior solution, presenting the best balance between quantitative performance and safe, coherent predictive behavior. It is concluded that the validation of clinical behavior is a fundamental behavior. It is concluded that the validation of clinical behavior is a fundamental step for the development of responsible AI tools for healthcare, surpassing evaluations based solely on statistical metrics.
URI: https://ric.cps.sp.gov.br/handle/123456789/44663
Aparece nas coleções:Trabalhos de Conclusão de Curso

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ads_2025_1_guilhermepires_alemdasmetricas.pdf
  Restricted Access
6.17 MBAdobe PDFVisualizar/Abrir    Solictar uma cópia


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.