Use este identificador para citar ou linkar para este item:
https://ric.cps.sp.gov.br/handle/123456789/39880| Título: | Estimativa de produtividade na cana de açúcar com base em dados NDVI – Índice de Vegetação por Diferença Normalizada |
| Título(s) alternativo(s): | Sugarcane productivity estimate based on NDVI data – Normalized Difference Vegetation Index |
| Autor(es): | PRADO, Marcus Vinicius de Oliveira |
| Orientador(es): | OTOBONI, Carlos Eduardo de Mendonça FISCHER, Hannes |
| Outro(s) contribuidor(es): | LOURENÇO, Patrick Pratis dos Santos |
| Tipo documental: | Artigo Científico |
| Palavras-chave: | Cana-de-açúcar;Sensoriamento remoto;Produtividade |
| Data do documento: | 12-Nov-2025 |
| Editor: | 259 |
| Referência Bibliográfica: | LOURENÇO, Patrick Pratis dos; PRADO, Marcus Vinicius de Oliveira. Estimativa de produtividade na cana de açúcar com base em dados NDVI – Índice de Vegetação por Diferença Normalizada, 2025. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Mecanização em Agricultura de Precisão) - Faculdade de Tecnologia FATEC Shunji Nishimura (Pompéia), Pompéia, 2025. |
| Resumo: | A estimativa antecipada da produtividade da cana-de-açúcar (TCH) é uma ferramenta estratégica crucial para o planejamento logístico e tomada de decisão no setor sucroenergético. Contudo, a complexidade dos dados de sensoriamento remoto, especialmente séries temporais de índices de vegetação, apresenta desafios significativos como a alta dimensionalidade. Diante disso, o presente trabalho realizou um estudo exploratório para avaliar um fluxo de trabalho de mineração de dados (Orange) para a predição da TCH, focando na otimização de atributos temporais de NDVI e SAVI através da Análise de Componentes Principais (PCA). Utilizando um conjunto de dados de campo extremamente restrito (N=11) do cultivar RB975242 no município de Parapuã - SP, o fluxo aplicou a PCA para reduzir 64 atributos temporais a 4 componentes principais, que explicaram 92,6% da variância. Em uma validação cruzada Leave-One-Out (LOOCV), o modelo de Regressão Linear Múltipla (MLR) alcançou métricas de desempenho aparentemente excepcionais (R² = 0.965; CVRMSE = 4,47%; RMSE = 4.93). No entanto, uma análise crítica da metodologia revelou uma severa falta de robustez. Testes de sensibilidade demonstraram que o desempenho do modelo é altamente instável e dependente do conjunto exato de atributos, caracterizando um forte indício de superajuste (overfitting), exacerbado pelo tamanho limitado da amostra. Conclui-se que, embora o fluxo (PCA + MLR) demonstre potencial teórico, o modelo gerado carece de capacidade de generalização e não pode ser considerado uma ferramenta preditiva confiável. O principal resultado deste estudo serve como um alerta sobre os riscos críticos do overfitting na aplicação de machine learning em datasets agrícolas com amostragem insuficiente, reforçando a necessidade indispensável de validação em bancos de dados substancialmente maiores. |
| URI: | https://ric.cps.sp.gov.br/handle/123456789/39880 |
| Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| mecanizacaoemagriculturadeprecisao_2025_2_marcusprado_estimativadeprodutividadenacana.pdf Restricted Access | 604.53 kB | Adobe PDF | Visualizar/Abrir Solictar uma cópia |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.