Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/6460
Title: Um comparativo entre algoritmos de agrupamento semissupervisionado para particionamento de hierarquias de grupos.
Authors: Oliveira, Rafael Augusto Freitas
metadata.dc.contributor.advisor: Gertrudes, Jadson Castro
metadata.dc.contributor.referee: Ogécime, Mardochee
Felix, Josemar Coelho
Gertrudes, Jadson Castro
Keywords: Aprendizado de máquina
Aprendizado semi supervisionado
Agrupamento de dados
Medidas de qualidade para extração de grupos
Medida de qualidade baseada em rótulos
Issue Date: 2024
Citation: OLIVEIRA, Rafael Augusto Freitas. Um comparativo entre algoritmos de agrupamento semissupervisionado para particionamento de hierarquias de grupos. 2024. 42 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2024.
Abstract: Algoritmos de aprendizado semi supervisionado visam preencher lacunas existentes entre as abordagens de aprendizado supervisionada e não supervisionada. Esses algoritmos são projetados para lidar com situações em que há uma quantidade limitada de dados rotulados, mas uma vasta quantidade de dados não rotulados está disponível para treinamento. Essa abordagem híbrida busca aproveitar o melhor dos dois mundos, combinando a orientação do aprendizado supervisionado com a flexibilidade do aprendizado não supervisionado, resultando em modelos mais robustos. Este estudo tem como proposito avaliar a medida semi supervisionada baseada em rótulos, fundamentada em B³ Precision e B³ Recall, utilizada para extração ótima de grupos no framework FOSC. Observamos o desempenho e comportamento da medida de qualidade quando aplicada e diferentes tipos de árvores de hierarquia. Os testes foram aplicados tanto em dados artificiais quanto em dados reais, de diversas áreas e assuntos, contento diferentes aspectos e atributos. Os resultados foram comparados a um medida baseada em restrição. Foi possível observar que vários fatores influenciaram no desempenho dos algoritmos, e que no final, uma das métricas se provou melhor que a outra.
metadata.dc.description.abstracten: Semi-supervised learning algorithms aim to fill gaps between supervised and unsupervised learning approaches. These algorithms are designed to deal with situations where there is a limited amount of labeled data, but a vast amount of unlabeled data is available for training. This hybrid approach seeks to take advantage of the best of both worlds, combining the guidance of supervised learning with the flexibility of unsupervised learning, resulting in more robust models. The purpose of this study is to evaluate the semi-supervised label-based measure, based on B³ Precision and B³ Recall, used for optimal group extraction in the framework FOSC. We observed the performance and behavior of the quality measure when applied to different types of hierarchy trees. The tests were applied to both artificial and real data, from different areas and subjects, containing different aspects and attributes. The results were compared to a constraint-based measure. It was possible to observe that several factors influenced the performance of the algorithms, and that in the end, one of the metrics proved to be better than the other.
URI: http://www.monografias.ufop.br/handle/35400000/6460
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_ComparativoAlgoritmosAgrupamento.pdf1,61 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.