Use este identificador para citar ou linkar para este item:
http://www.monografias.ufop.br/handle/35400000/7629
Título: | Aprendizagem federada e incerteza preditiva : uma abordagem para classificação de câncer colorretal. |
Autor(es): | Costa, Arthur Negrão de Faria Martins da |
Orientador(es): | Silva, Pedro Henrique Lopes Silva, Guilherme Augusto Lopes |
Membros da banca: | Silva, Pedro Henrique Lopes Silva, Guilherme Augusto Lopes Guidoni, Daniel Ludovico Rezende, Marcos Felipe Pontes |
Palavras-chave: | Inteligência artificial Aprendizado federado Algoritmos de aprendizado de máquina Reto - câncer |
Data do documento: | 2025 |
Referência: | COSTA, Arthur Negrão de Faria Martins da. Aprendizagem federada e incerteza preditiva : uma abordagem para classificação de câncer colorretal. 2025. 84 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025. |
Resumo: | Câncer colorretal é um tipo de câncer que afeta a região do cólon e/ou reto e configura-se como um enorme problema de saúde pública, visto sua grande incidência e mortalidade. Em meio a este problema, a detecção utilizando Inteligência Artificial (IA) tem se mostrado como um eficaz método, dado sua capacidade de processar grandes cargas de dados e sua capacidade de detectar padrões que podem passar despercebidos pelo olhar humano. Dentro desta área, a aprendizagem federada estabelece-se como um relevante paradigma para construção e treinamento de modelos preditivos baseados em IA para auxílio em diagnósticos médicos, haja visto o não-compartilhamento dos dados (que geralmente são de natureza sensível e protegidos por lei) promovido pelo mesmo. Entretanto, clientes com dados corrompidos podem prejudicar o funcionamento da rede federada e, para mitigar este problema, foi proposta uma estratégia de drop de clientes baseada na análise da incerteza preditiva dos modelos gerados. Nos experimentos realizados, os quais contemplaram múltiplas formas de distribuição de dados, utilizou-se o dataset CRC-5000 e constatou-se que a estratégia amenizou quedas de 64 e 58 pontos percentuais de acurácia, que ocorreram nos experimentos em que não foi aplicada a estratégia proposta na arquitetura de redes neurais, sobre as distribuições Dataset Completo (DC) e Dataset Subdividido (DS), respectivamente, para menos de 1 ponto percentual e 3 pontos percentuais. Para os Vision Transformers (ViTs), os resultados foram ainda melhores, reduzindo-se quedas em acurácia de 13\% e 40\%, respectivamente, para nenhuma queda (0\%) em acurácia no ambiente DC e 3 pontos percentuais em DS. Mais detalhadamente, tais quedas decorreram de poisoning attacks baseados na randomização dos dados de entrada, os quais foram conduzidos por clientes maliciosos para treinar modelos locais que essencialmente minariam o processo de agregação da rede federada. Ademais, também foram realizados experimentos voltados à análise de performance do paradigma federado utilizando arquiteturas de redes neurais (EfficientNetB0) e ViTs (Google's Vit-Base-Patch16-224). A primeira atingiu 90\% e 88\% de acurácia para os ambientes DC e DS, enquanto que a segunda obteve 98\% e 97\% para os mesmos casos. Apesar de que uma comparação com o estado da arte seja difícil, visto que não há uma divisão treino/validação/teste padrão da base de dados, é possível afirmar que os resultados obtidos são promissores e mostraram que a proposta federada é uma válida abordagem para o problema. |
Resumo em outra língua: | Colorectal cancer is a type of cancer that affects the colon and/or rectum region and constitutes an enormous public health problem due to its high incidence and mortality. In face of this problem, detection using Artificial Intelligence (AI) has proven to be an effective method, given its ability to process large amounts of data and its capacity to detect patterns that may go unnoticed by the human eye. In this AI area, federated learning emerges as a relevant paradigm for building and training AI-based predictive models to help medical diagnosis, since it is able to protect the non-sharing policy of data (considering that medical data has a sensitive nature and is generally protected by the law). However, clients with corrupted data might harm the federated network and, to mitigate this problem, it was proposed a client drop strategy based on the uncertainty of predictions from the generated models. In the conducted experiments, which contemplated multiple kinds of data distribution, the CRC-5000 dataset was used and the results showed that the strategy softened accuracy drops that could reach up to 64 and 58 percentage points, observed in experiments with neural networks where the proposed strategy was not applied, for the distributions DC and DS, respectively, to less than 1 percentual point and 3 percentage points. For the experiments conducted with ViTs, the results were even better, reducing accuracy drops from 13% and 40%, respectively, to no drop (0%) in DC and to 3% drop in DS. In more details, such drops stemmed from Poisoning Attacks based on the randomization of input data, which was used by malicious clients to train local models that essentially undermined the aggregation process of the federated network. Additionally, experiments were conducted to assess the federated learning paradigm’s performance using neural network architectures (EfficientNetB0) and Vision Transformers architectures (Google’s Vit-Base-Patch16-224): the first one reached 90% and 88% accuracy for the DC and DS environments, while the second one reached 98% and 97% for the same cases. Although a comparison with the state of the art is difficult, given that there is no standard train/validation/test split for the dataset, it is possible to affirm that the obtained results are promising and have shown that the federated approach is a valid solution to the problem. |
URI: | http://www.monografias.ufop.br/handle/35400000/7629 |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MONOGRAFIA_AprendizagemFederadaIncerteza.pdf | 9,51 MB | Adobe PDF | Visualizar/Abrir |
Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.