Use este identificador para citar ou linkar para este item:
http://www.monografias.ufop.br/handle/35400000/7645
Título: | FOSC : Uma ferramenta em Python para visualização de agrupamentos baseados em hierarquias. |
Autor(es): | Gurgel, Matheus Neto |
Orientador(es): | Gertrudes, Jadson Castro |
Membros da banca: | Silva, Rodrigo César Pedrosa Duarte, Fernando Henrique Oliveira Gertrudes, Jadson Castro |
Palavras-chave: | Aprendizado de máquina Aprendizado não supervisionado Aprendizado semissupervisionado Agrupamento de dados Visualização de dados |
Data do documento: | 2025 |
Referência: | GURGEL, Matheus Neto. FOSC : uma ferramenta em Python para visualização de agrupamentos baseados em hierarquias. 2025. 46 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025. |
Resumo: | Os algoritmos não supervisionados e semissupervisionados transferem a tarefa de rotulação para as máquinas, inibindo a necessidade de grandes conjuntos de dados rotulados. Dentro desses algoritmos, estão os algoritmos hierárquicos, que produzem uma hierarquia de grupos, que pode ser visualizada por meio de uma árvore chamada dendrograma. A extração desses grupos é feita de maneira convencional a partir de um corte horizontal no dendrograma. No entanto, esse método não representa todas as possibilidades de formação desses grupos. O trabalho de Campello et al. (2013) – FOSC – contorna isso por meio de uma extração ótima baseada em uma métrica de estabilidade. Para visualizar esses tipos de dados, em grandes conjuntos, o dendrograma não é suficiente, pois fica ilegível. Dessa forma, este trabalho tem como objetivo desenvolver uma ferramenta de visualização para exploração desses tipos de dados, em cima da extração ótima proporcionada pelo FOSC, que contenha gráficos adequados a grandes conjuntos de dados - Silhouette-like e Alcançabilidade. Para isso, é gerado um pacote em Python, por meio de técnicas de Programação Orientada a Objetos e Engenharia de Software, e disponibilizado à comunidade, juntamente com uma documentação para consulta. Em conclusão, o framework conseguiu gerar gráficos em um grande conjunto de dados: Handl e Knowles (2007). |
Resumo em outra língua: | Unsupervised and semi-supervised algorithms transfer the labeling task to machines, eliminating the need for large labeled data sets. These algorithms include hierarchical algorithms, which produce a hierarchy of groups that can be visualized using a tree called a dendrogram. These groups are extracted in a conventional manner by cutting horizontally in the dendrogram. However, this method does not represent all the possibilities for forming these groups. The work of Campello et al. (2013) – FOSC – overcomes this by using optimal extraction based on a stability metric. Visualizing these types of data in large sets with a dendrogram is not adequate, as it becomes illegible. Thus, this work aims to develop a visualization tool for exploring these types of data, leveraging the optimal extraction provided by FOSC. The tool includes graphs designed for large datasets, such as the Silhouette-like Plot and the Reachability Plot. To achieve this, a Python package is developed using Object-Oriented Programming and Software Engineering principles and made available to the community, along with comprehensive documentation for reference. In conclusion, the framework was able to generate graphs in a large data set: Handl e Knowles (2007). |
URI: | http://www.monografias.ufop.br/handle/35400000/7645 |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MONOGRAFIA_FOSCFerramentaVisualização.pdf | 2,71 MB | Adobe PDF | Visualizar/Abrir |
Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.