Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/5847
Título: Redução de dimensionalidade em problemas de múltiplos alvos : uma comparação entre PCA e Autoencoder.
Autor(es): Silva, Getúlio Rodrigues
Orientador(es): Gertrudes, Jadson Castro
Santana, Adrielle de Carvalho
Membros da banca: Fernandes, Philipe de Oliveira
Freire, Leonardo Macedo
Gertrudes, Jadson Castro
Santana, Adrielle de Carvalho
Palavras-chave: Multioutiput
PCA
Autoencoder
Classificação
Redução de dimensionalidade
Data do documento: 2023
Referência: SILVA, Getúlio Rodrigues. Redução de dimensionalidade em problemas de múltiplos alvos : uma comparação entre PCA e Autoencoder.. 2023. 39 f. Monografia (Graduação em Engenharia de Controle e Automação) - Escola de Minas, Universidade Federal de Ouro Preto, Ouro Preto, 2023.
Resumo: As pesquisas na área de Química Medicinal têm utilizado cada vez mais técnicas para acelerar o processo de criação e desenvolvimento de medicamentos para combater novas doenças, especialmente por conta do crescimento exponencial da tecnologia em várias áreas do conhecimento. No entanto, esse avanço também leva ao aumento da quantidade de dados e variáveis a serem analisadas, tornando as tarefas atuais longas e complexas, um problema conhecido como “maldição da dimensionalidade”. As ferramentas da inteligên- cia artificial, as técnicas de análise de dados e os modelos de predição são cada vez mais comuns na área da Química Medicinal. Diante disso, o objetivo deste trabalho é criar uma ferramenta para auxiliar os pesquisadores na redução do tempo de análise de dados de compostos bioativos. Para isso, foram utilizadas técnicas de redução de dimensionalidade de dados, como a Análise de Componentes Principais e uma Rede Neural Autoencoder, juntamente com algoritmos de aprendizado de máquina para classificação multioutput. Os resultados obtidos foram comparados, o que mostra que a Rede Neural Autoencoder conse- gue proporcionar uma melhoria na classificação dos descritores obtendo-se coeficientes de F-Measure superiores aos testes com Análise de Componentes Principais principalmente em conjuntos de dados com maiores observações obtendo score de 0,610 nos testes de descritores KR para Autoencoder e 0,553 para Análise de Componentes Principais. É pos- sível concluir que as técnicas de redução de dimensionalidade são efetivas, pois conseguem condensar informações de conjuntos extensos de dados, melhorando assim os modelos de predição.
Resumo em outra língua: Research in the field of Medicinal Chemistry has increasingly utilized techniques to ac- celerate the process of creating and developing drugs to combat new diseases, especially due to the exponential growth of technology in various areas of knowledge. However, this advancement also leads to an increase in the amount of data and variables to be analyzed, making current tasks long and complex, a problem known as the ”curse of dimension- ality”. Artificial intelligence tools, data analysis techniques, and prediction models are becoming more common in the field of medicinal chemistry. In light of this, the objec- tive of this work is to create a tool to assist researchers of new drugs in reducing the time required for analyzing data from bioactive compounds tested on biological targets. For this purpose, data dimensionality reduction techniques such as Principal Component Analysis and an Autoencoder Neural Network, along with machine learning algorithms for multioutput classification, were utilized. The obtained results were compared, show- ing that the Autoencoder Neural Network can improve the classification of descriptors, obtaining F-Measure coefficients superior to Principal Component Analysis, especially in datasets with larger observations, achieving a score of 0.610 for Autoencoder and 0.553 for Principal Component Analysis in KR descriptor tests. It can be concluded that di- mensionality reduction techniques are effective as they can condense information from extensive datasets, thus improving prediction models.
URI: http://www.monografias.ufop.br/handle/35400000/5847
Aparece nas coleções:Engenharia de Controle e Automação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_ReduçãoDimensionalidadeProblemas.pdf1,51 MBAdobe PDFVisualizar/Abrir


Este item está licenciado sob uma Licença Creative Commons Creative Commons