Please use this identifier to cite or link to this item:
https://ric.cps.sp.gov.br/handle/123456789/44663Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | VILLANI, Leonardo | - |
| dc.contributor.author | PIRES, Guilherme Ozores | - |
| dc.contributor.author | VIEIRA, Gustavo Pereira | - |
| dc.contributor.other | VILLANI, Leonardo | - |
| dc.contributor.other | CÓ, Cristina dos Santos | - |
| dc.contributor.other | ARAÚJO, Roberto de Oliveira | - |
| dc.date.accessioned | 2026-05-21T17:41:03Z | - |
| dc.date.available | 2026-05-21T17:41:03Z | - |
| dc.date.issued | 2025-06 | - |
| dc.identifier.citation | PIRES, Guilherme Ozores; VIEIRA, Gustavo Pereira. Além das métricas: análise de comportamento preditivo na seleção de modelos de machine learning para o risco de diabetes, 2025. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Praia Grande, Praia Grande, 2025. | pt_BR |
| dc.identifier.uri | https://ric.cps.sp.gov.br/handle/123456789/44663 | - |
| dc.description.abstract | "O Diabetes Mellitus tipo 2 é uma doença crônica com prevalência crescente, representando um significativo desafio para a saúde pública. A detecção precoce é um fator crucial para a prevenção de complicações graves e, neste contexto, o objetivo deste trabalho foi desenvolver e avaliar um modelo preditivo de aprendizado de máquina para identificar indivíduos de alto risco, utilizando o dataset PIMA Indians Diabetes como estudo de caso. A metodologia envolveu um rigoroso pipeline de pré-processamento, seguido da avaliação de nove algoritmos através de métricas quantitativas (AUC, Recall), otimização de limiar e, de forma decisiva, uma validação qualitativa com perfis clínicos sintéticos. Os resultados demonstraram que a análise de plausibilidade foi indispensável para desqualificar algoritmos com altas métricas que apresentaram comportamentos de risco, como o Gradient Boosting. Este processo consagrou o modelo Random Forest como a solução superior, por apresentar o melhor equilíbrio entre performance quantitativa e um comportamento preditivo seguro e coerente. Conclui-se que a validação de comportamento clínico é uma etapa indispensável no desenvolvimento de ferramentas de IA responsáveis para a saúde, superando a avaliação baseada unicamente em métricas estatísticas. " | pt_BR |
| dc.description.abstract | Type 2 Diabetes Mellitus is a chronic disease with a growing prevalence, representing a significant public health challenge. Early detection is a crucial factor in preventing severe complications, and in this context, the objective of this work was to develop and evaluate a predictive machine learning model to identify individuals at high risk, using the PIMA Indians Diabetes dataset as a case study. The methodology involved a rigorous preprocessing pipeline, followed by the evaluation of nine algorithms through quantitative metrics (AUC, Recall), threshold optimization, and, decisively, a qualitative validation with synthetic clinical profiles. The results showed that, although several models had high metric performance, the plausibility analysis was indispensable for disqualifying algorithms with high-risk behaviors, such as Gradient Boosting. This process established the Random Forest model as the superior solution, presenting the best balance between quantitative performance and safe, coherent predictive behavior. It is concluded that the validation of clinical behavior is a fundamental behavior. It is concluded that the validation of clinical behavior is a fundamental step for the development of responsible AI tools for healthcare, surpassing evaluations based solely on statistical metrics. | pt_BR |
| dc.description.sponsorship | Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas | pt_BR |
| dc.language.iso | pt_BR | pt_BR |
| dc.publisher | 129 | pt_BR |
| dc.subject | Processamento de dados | pt_BR |
| dc.subject | Diabetes mellitus | pt_BR |
| dc.subject.other | Gestão e Negócios | pt_BR |
| dc.title | Além das métricas: análise de comportamento preditivo na seleção de modelos de machine learning para o risco de diabetes. | pt_BR |
| dc.title.alternative | Beyond metrics: predictive behavior analysis in machine learning model selection for diabetes risk. | pt_BR |
| dc.type | Monografia | pt_BR |
| dcterms.type | - | pt_BR |
| Appears in Collections: | Trabalhos de Conclusão de Curso | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| ads_2025_1_guilhermepires_alemdasmetricas.pdf Restricted Access | 6.17 MB | Adobe PDF | View/Open Request a copy |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.