Use este identificador para citar ou linkar para este item:
http://www.monografias.ufop.br/handle/35400000/8375
Título: | Classificação de glaucoma em imagens de fundo de olho. |
Autor(es): | Celestino, Arthur Henrique Santos |
Orientador(es): | Silva, Pedro Henrique Lopes |
Membros da banca: | Nascimento, Guilherme Augusto Anício Drummond do Pinto, Luan Patrik Silva Silva, Pedro Henrique Lopes |
Palavras-chave: | Inteligência artificial Glaucoma Redes neurais convolucionais |
Data do documento: | 2025 |
Referência: | CELESTINO, Arthur Henrique Santos. Classificação de glaucoma em imagens de fundo de olho. 2025. 61 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025. |
Resumo: | O glaucoma é uma das principais causas de cegueira irreversível no mundo, caracterizado pelo dano progressivo ao nervo óptico. O diagnóstico precoce é essencial para minimizar os impactos da doença, e a Inteligência Artificial tem se mostrado uma ferramenta importante nesse contexto. Este trabalho apresenta uma análise exploratória de diferentes arquiteturas de redes neurais, incluindo redes convolucionais e modelos baseados em transformers, para a classificação de imagens de fundo de olho com glaucoma, utilizando a base de dados Standardized Multi-Channel Dataset for Glaucoma. Um dos focos principais é avaliar o impacto da combinação das previsões através de esquemas de votação para mitigar erros de modelos individuais e aprimorar o desempenho geral. Inicialmente, foram avaliados os modelos pré-treinados ResNet-50, VGG-19 e EfficientNet-B0, além do Vision Transformer (ViT) e MaxViT. Os experimentos demonstraram que a ResNet-50 (acurácia de 87,23%) e a VGG-19 (acurácia de 86,04%) obtiveram resultados consistentes, mas com recall inferior. A EfficientNet-B0 apresentou desempenho significativamente menor (acurácia de 69,96%), sendo considerada demasiadamente simples para a tarefa. Entre os transformers, o MaxViT destacou-se com o maior recall (93,20%), característica crucial para a detecção de casos positivos. O ViT obteve um desempenho mais equilibrado (acurácia de 87,99%, recall de 82,44%).Os esquemas de votação, especialmente a votação por média, demonstraram ser uma abordagem com um desempenho geral superior e mais equilibrado, com acurácia de 89,45%. |
Resumo em outra língua: | Glaucoma is one of the leading causes of irreversible blindness worldwide, characterized by the progressive damage to the optic nerve. Early diagnosis is essential to minimize the disease’s impact, and Artificial Intelligence has proven to be an important tool in this context. This work presents an exploratory analysis of different neural network architectures, including convolutional networks and transformer-based models, for the classification of fundus images with glaucoma using the Standardized Multi-Channel Dataset for Glaucoma dataset. One of the main focuses is to evaluate the impact of combining predictions through voting schemes in order to mitigate individual model errors and improve overall performance. Initially, pre-trained models such as ResNet-50, VGG-19, and EfficientNet-B0 were assessed, along with Vision Transformer (ViT) and MaxViT. The experiments showed that ResNet-50 (accuracy of 87.23%) and VGG-19 (accuracy of 86.04%) achieved consistent results, though with lower recall. EfficientNet-B0 presented significantly lower performance (accuracy of 69.96%), being considered too simple for the task. Among the transformers, MaxViT stood out with the highest recall (93.20%), a crucial characteristic for the detection of positive cases. The ViT achieved a more balanced performance (accuracy of 87.99%, recall of 82.44%). The voting schemes, especially soft voting, demonstrated superior and more balanced overall performance, with an accuracy of 89.45%. |
URI: | http://www.monografias.ufop.br/handle/35400000/8375 |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MONOGRAFIA_ClassificaçãoGlaucomaImagens.pdf | 8,86 MB | Adobe PDF | Visualizar/Abrir |
Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.