Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/7645
Title: FOSC : Uma ferramenta em Python para visualização de agrupamentos baseados em hierarquias.
Authors: Gurgel, Matheus Neto
metadata.dc.contributor.advisor: Gertrudes, Jadson Castro
metadata.dc.contributor.referee: Silva, Rodrigo César Pedrosa
Duarte, Fernando Henrique Oliveira
Gertrudes, Jadson Castro
Keywords: Aprendizado de máquina
Aprendizado não supervisionado
Aprendizado semissupervisionado
Agrupamento de dados
Visualização de dados
Issue Date: 2025
Citation: GURGEL, Matheus Neto. FOSC : uma ferramenta em Python para visualização de agrupamentos baseados em hierarquias. 2025. 46 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025.
Abstract: Os algoritmos não supervisionados e semissupervisionados transferem a tarefa de rotulação para as máquinas, inibindo a necessidade de grandes conjuntos de dados rotulados. Dentro desses algoritmos, estão os algoritmos hierárquicos, que produzem uma hierarquia de grupos, que pode ser visualizada por meio de uma árvore chamada dendrograma. A extração desses grupos é feita de maneira convencional a partir de um corte horizontal no dendrograma. No entanto, esse método não representa todas as possibilidades de formação desses grupos. O trabalho de Campello et al. (2013) – FOSC – contorna isso por meio de uma extração ótima baseada em uma métrica de estabilidade. Para visualizar esses tipos de dados, em grandes conjuntos, o dendrograma não é suficiente, pois fica ilegível. Dessa forma, este trabalho tem como objetivo desenvolver uma ferramenta de visualização para exploração desses tipos de dados, em cima da extração ótima proporcionada pelo FOSC, que contenha gráficos adequados a grandes conjuntos de dados - Silhouette-like e Alcançabilidade. Para isso, é gerado um pacote em Python, por meio de técnicas de Programação Orientada a Objetos e Engenharia de Software, e disponibilizado à comunidade, juntamente com uma documentação para consulta. Em conclusão, o framework conseguiu gerar gráficos em um grande conjunto de dados: Handl e Knowles (2007).
metadata.dc.description.abstracten: Unsupervised and semi-supervised algorithms transfer the labeling task to machines, eliminating the need for large labeled data sets. These algorithms include hierarchical algorithms, which produce a hierarchy of groups that can be visualized using a tree called a dendrogram. These groups are extracted in a conventional manner by cutting horizontally in the dendrogram. However, this method does not represent all the possibilities for forming these groups. The work of Campello et al. (2013) – FOSC – overcomes this by using optimal extraction based on a stability metric. Visualizing these types of data in large sets with a dendrogram is not adequate, as it becomes illegible. Thus, this work aims to develop a visualization tool for exploring these types of data, leveraging the optimal extraction provided by FOSC. The tool includes graphs designed for large datasets, such as the Silhouette-like Plot and the Reachability Plot. To achieve this, a Python package is developed using Object-Oriented Programming and Software Engineering principles and made available to the community, along with comprehensive documentation for reference. In conclusion, the framework was able to generate graphs in a large data set: Handl e Knowles (2007).
URI: http://www.monografias.ufop.br/handle/35400000/7645
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_FOSCFerramentaVisualização.pdf2,71 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.