Please use this identifier to cite or link to this item:
https://ric.cps.sp.gov.br/handle/123456789/44176| Title: | Explicabilidade na classificação de imagens com VGG16: um estudo com Grad-CAM e mapas de calor |
| Other Titles: | Explainability in image classification with VGG16: a study with Grad-CAM and heatmaps |
| Authors: | MARQUES, David SAKAGUCHI, Marcos Hideki |
| Advisor: | FAVAN, João Ricardo DUARTE, Maurício |
| type of document: | Artigo Científico |
| Keywords: | Tomate;Doenças de plantas;Diagnóstico por imagem;Deep learning |
| Issue Date: | 14-Nov-2024 |
| Publisher: | 259 |
| Citation: | MARQUES, David; SAKAGUCHI, Marcos Hideki. Explicabilidade na classificação de imagens com VGG16: um estudo com Grad-CAM e mapas de calor, 2024. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Big Data no Agronegócio) - Faculdade de Tecnologia FATEC Shunji Nishimura (Pompéia), Pompéia, 2024. |
| Abstract: | Este trabalho tem como foco a utilização do VGG16, aliado à técnica de Grad-CAM para demonstrar uma das formas de explicar o caminho que o modelo percorre, e quais características são levadas em consideração para a decisão de sua resposta, sendo aplicado à identificação de doenças em tomateiros. O principal objetivo foi avaliar visualmente as decisões do modelo de classificação, gerando heatmaps que demonstram quais regiões das imagens foram mais determinantes para a predição. O foco na área de ativação é uma ótima pauta pois muito se utiliza desses modelos, mas não se sabe exatamente o que acontece internamente. Foi utilizado o Grad-CAM como uma técnica que permite identificar as áreas específicas de uma imagem que mais influenciam a decisão do modelo, oferecendo de forma visual sobre como a rede convolucional está processando as informações. Ao aplicar essa abordagem treinando o modelo, foi obtido uma acurácia de 70% em cima dos dados de teste. A partir da geração dos mapas de calor, foi possível observar que o modelo utilizou de características importantes como a superfície das folhas referindo-se aos danos do patógeno como principal enfoque, mas também, foi utilizado mais de outros elementos para fazer a classificação. Assim, a análise dos resultados visa demonstrar que modelos complexos como o VGG16 podem ser compreendidos de forma intuitiva, se for aliado com ferramentas auxiliares, como por exemplo a CAM, o que promove maior confiança no uso de inteligência artificial para fins práticos. |
| URI: | https://ric.cps.sp.gov.br/handle/123456789/44176 |
| Appears in Collections: | Trabalhos de Conclusão de Curso |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| bigdata_2024_2_davidmarques_explicabilidadenaclassificacaodeimagens.pdf | 579.88 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.