Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/364
Title: Técnicas de agrupamento para bases de dados grandes.
Authors: Bernardes, Felipe Moreira
metadata.dc.contributor.advisor: Ribeiro, Eduardo da Silva
metadata.dc.contributor.referee: Ribeiro, Eduardo da Silva
Satler, Mateus Ferreira
Medeiros, Talles Henrique de
Keywords: Algoritmos
Banco de dados
Classificação - dados
Issue Date: 2017
Citation: BERNARDES, Felipe Moreira. Técnicas de agrupamento para bases de dados grandes. 2017. 83 f. Monografia (Graduação em Engenharia de Computação) – Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2017.
Abstract: O crescimento do uso de aplicações, sistemas computacionais e dos usuários vem em uma enorme crescente a cada ano. Os dados gerados por todos tomam proporções gigantescas. Com isso são necessários métodos eficientes, seguros e viáveis para que estes dados possam ser salvos e, utilizados posteriormente de maneira eficaz. Neste trabalho foi realizado o estudo de técnicas de agrupamento com bases de dados grandes, com o objetivo de medir o desempenho destas técnicas e algoritmos, que usualmente são usados em dados menores. As três bases utilizadas apresentavam, respectivamente, dados obtidos de interações reais de usuários com smartphones, smartwatches e tablets. Dados de comerciais de TV de canais indianos e internacionais, tais como fluxo espectral, tempo de saída, etc. E também dados obtidos de vídeos no canal Youtube sobre jogos onde usuários discutem sobre os mesmos, tendo como atributos áudio, vídeo e termos relacionados a estes.As bases utilizadas foram obtidas no UCI Machine Learning Repository. Os resultados presentados foram validados utilizando métodos conhecidos na literatura, como o Silhouette, matrizes de afinidades e modelos estatísticos, dando maior respaldo aos dados colhidos. O estudo dessas técnicas, algoritmos e métodos, tanto de validação, descoberta do número ideal de grupos e agrupamento em si, também foi um objetivo deste trabalho. Foram realizados testes em uma plataforma de programação que é propicia para o uso de matrizes, ajudando assim na manipulação de algoritmos utilizados. Ao final do trabalho é possível constatar como o desempenho dos algoritmos apresenta resultados piores, comparados a bases menores.
metadata.dc.description.abstracten: The growing use of applications, computer systems and users comes in a huge growing every year. The data generated by all take gigantic proportions. With this requires efficient methods, safe and viable so that these data can be saved and later used effectively. In this work the study of clustering techniques with large databases, in order to measure the performance of these techniques and algorithms that are usually used in smaller data. The three bases used showed, respectively, obtained data from real user interactions with smartphones, smartwatches and tablets. Commercial data of Indian and international TV channels such as spectral flow out of time, etc. And data from videos on the channel Youtube on games where users discuss about the same, with the audio attributes, video and related this terms. The data used were obtained from the UCI Machine Learning Repository. The results were validated using methods known in the literature as the Silhouette, affinity matrix and statistical models, providing greater support to collected data. The study of these techniques, algorithms and methods, both validation, ideal number of discovery groups and grouping itself was also a goal of this work. Tests were performed on a programming platform that is favorable for the use of matrices, thereby assisting in the handling of used algorithms. At the end of the work it is possible to see how the performance of the algorithms results are worse, compared to smaller bases.
URI: http://www.monografias.ufop.br/handle/35400000/364
metadata.dc.rights.license: Autorização concedida à Biblioteca Digital de TCC da UFOP pelo autor(a), 03/04/2017, com as seguintes condições: disponível sob Licença Creative Commons 4.0, que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.
Appears in Collections:Engenharia de Computação JMV

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_TécnicasAgrupamentoBases.pdf7,59 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons