Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/1527
Title: Computing data cubes over GPU clusters.
Authors: Silva, Lucas Henrique Moreira
metadata.dc.contributor.advisor: Lima, Joubert de Castro
metadata.dc.contributor.referee: Fortes, Reinaldo Silva
Silva, Rodrigo Rocha
Lima, Joubert de Castro
Keywords: Tecnologia OLAP
Redes de computadores
Issue Date: 2018
Citation: SILVA, Lucas Henrique Moreira. Computing data cubes over GPU clusters. 2018. 50f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2018.
Abstract: O cubo de dados é um operador relacional fundamental para sistemas de suporte à tomada de decisão, dessa forma útil para a análise de Big Data. O problema apresentando nesse trabalho é: como reduzir os tempos de resposta de consultas multidimensionais complexas? Tal problema se torna ainda mais agravado se atualizações recorrentes nos dados de entrada acontecem e se existe um grande volume de dados de alta dimensionalidade a ser analisado. A hipótese deste trabalho é que uso de clusters de dispositivos CPU-GPU acelerará consultas em cubos de dados holísticos de alta dimensão que são constantemente atualizados. A solução alternativa proposta neste trabalho, chamada de JCL-GPU-Cubing, particiona a base de dados em múltiplas representações de cubos parciais sem introduzir redundância de dados. Tais cubos parciais são usados para executar consultas em CPU ou CPU-GPU de maneira eficiente. As avaliações experimentais preliminares demonstraram que a versão baseada em clusters de CPU escala bem quando ambos os dados de entrada e o tamanho do cluster aumentam.
metadata.dc.description.abstracten: The data cube is a fundamental relational operator for decision support systems, thus very important for analytics. Unfortunately, a full data cube with all of its tuples has exponential complexity in terms of runtime and memory consumption as the dimensions increase linearly, so algorithms to reduce query response times continue under development. The problem stated in this work is: how can we reduce complex multidimensional queries response times from high dimensional data cubes? The problem is aggravated if recurrent updates occur and if there is a huge volume of high dimensional data to be managed. The hypothesis of this work is that clusters of CPU-GPU devices can speedup queries from high dimensional holistic data cubes that are updated constantly. The alternative solution presented in this work, named JCL-GPU-Cubing, partitions the base relation into multiple independent sub- cubes. These multiple sub-cubes represent a partial data cube to reduce the exponentiality and they are used to perform queries in CPU or in CPU-GPU computer architectures efficiently. The experimental evaluations using complex multidimensional queries demonstrated that the CPU cluster version scaled well when the base relation increased and the CPU-GPU version outperformed the CPU only version in certain scenarios.
URI: http://www.monografias.ufop.br/handle/35400000/1527
metadata.dc.rights.license: Autorização concedida à Biblioteca Digital de TCC’s da UFOP pelo(a) autor(a) em 19/12/2018 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_ComputingDataCubes.pdf1,07 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons