Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/8397
Título: Algoritmos semissupervisionados para análise de relações entre estrutura química e atividade biológica.
Autor(es): Amaro, Caio Silas de Araujo
Orientador(es): Gertrudes, Jadson Castro
Membros da banca: Pinto, Luan Patrik Silva
Ziviani, Hugo Eduardo
Gertrudes, Jadson Castro
Palavras-chave: Inteligência artificial
Aprendizado de máquina
Descoberta de fármacos
Data do documento: 2025
Referência: AMARO, Caio Silas de Araujo. Algoritmos semissupervisionados para análise de relações entre estrutura química e atividade biológica. 2025. 34 f. Monografia (Graduação em Ciência da Computação) – Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025.
Resumo: Este trabalho investiga o uso de algoritmos semissupervisionados para a análise de Relações Estrutura-Atividade (SAR), um campo crucial na descoberta de fármacos. A pesquisa aborda o desafio da escassez de dados rotulados, que é comum na Química Medicinal. O estudo avalia e compara o desempenho de duas técnicas semissupervisionadas de propagação de rótulos baseadas em grafos: o Gaussian Field Harmonic Function (GFHF) e o k-Nearest Neighbor Label Distribution Propagation (kNN-LDP). Além disso, a pesquisa explora a integração do algoritmo HDBScanSS* como uma etapa de pré-processamento para identificar e tratar ruídos e instâncias atípicas nos dados. A metodologia utiliza técnicas de aprendizado de máquina para otimizar aacuráciadosmodelos.Osresultadosdemonstramqueosmétodossemissupervisionados, especialmente quando combinados com o HDBScanSS*, podem superar abordagens puramente supervisionadas como Random Forest e Support Vector Machines (SVM) em cenários com dados limitados. Essas descobertas reforçam o potencial desses algoritmos para a descoberta de novos compostos bioativos e para o desenvolvimento de fármacos.
Resumo em outra língua: This study investigates the use of semi-supervised algorithms for the analysis of Structure-Activity Relationships (SAR), a crucial field in drug discovery. The research addresses the challenge of data scarcity, which is a common issue in Medicinal Chemistry. The work evaluates and compares the performance of two graph-based semi-supervised label propagation techniques: the Gaussian Field Harmonic Function (GFHF) and the k-Nearest Neighbor Label Distribution Propagation (kNN-LDP). Furthermore, the research explores the integration of the HDBScanSS* algorithm as a preprocessing step to identify and handle noise and outlier instances in the data. The methodology employs machine learning techniques to optimize the models’ accuracy. The results demonstrate that semi-supervised methods, particularly when combined with HDBScanSS*, can outperform purely supervised approaches such as Random Forest and Support Vector Machines (SVM) in scenarios with limited data. These findings highlight the potential of these algorithms for the discovery of new bioactive compounds and for drug development.
URI: http://www.monografias.ufop.br/handle/35400000/8397
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_AlgoritmosSemissupervisionadosAnálise_TCC.pdf2,72 MBAdobe PDFVisualizar/Abrir


Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.