Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/3078
Title: Avaliação de técnicas de aprendizado supervisionado no auxílio a diagnósticos médicos.
Authors: Santos, Yago José Araújo dos
metadata.dc.contributor.advisor: Ferreira, Anderson Almeida
metadata.dc.contributor.referee: Ferreira, Anderson Almeida
Cámara Chávez, Guillermo
Espiridião, Luciano Vilas Boas
Keywords: Algoritmos de computador
Classificação
Doenças transmissíveis
Doenças parasitarias
Processamento de linguagem natural - computação
Aprendizado do computador
Issue Date: 2021
Citation: SANTOS, Yago José Araújo dos. Avaliação de técnicas de aprendizado supervisionado no auxílio a diagnósticos médicos. 2021. 83 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2021.
Abstract: Os registros médicos eletrônicos apresentam um rico conjunto de dados em forma de texto livre, ou seja, dados não estruturados. A fim de organizar esses dados em representações lógicas e possibilitar comparações automáticas entre eles, este trabalho tem por objetivo avaliar soluções já existentes e implementar novos métodos que possam ser aplicados na concepção de um software médico. Esses métodos devem ser capazes de analisar um conjunto de registros médicos, contendo dados coletados no processo de anamnese no idioma Português do Brasil e, a partir de então, gerar sugestões de diagnósticos, de forma a agilizar o procedimento e auxiliar os profissionais de saúde no processo de tomada de decisão. Os métodos sujeitos à avaliação, bem como os que foram implementados, fazem uso dos recursos de algoritmos de Processamento de Linguagem Natural com agregação da ontologia médica DeCS e de conjuntos de regras pré-definidas para os processos de recuperação de informação, classificação de palavras e classificação de frases, sendo que esses dois últimos processos possuem como pilar o método de classificação estabelecido pela gramática da Língua Portuguesa. O software resultante da integração desses métodos faz uso também de classificadores no processo de identificação de doenças. Com isso, foi possível produzir dois modelos de classificação, em que o primeiro alcançou uma precisão e um score F1 de 62,38% e 65,38% respectivamente, em análises com bases de dados que possuíam configurações diferentes, mas inseridas no mesmo contexto de análise, e um segundo modelo que atingiu 70,55% de precisão e 70,76% de score F1 ao analisar informações em bases de dados mescladas. Então, o objetivo experimental deste trabalho é avaliar e implementar métodos com base no estudo sobre as aplicações de técnicas computacionais, inseridas nos campos de aprendizado de máquina e de recuperação de informação, a fim de, futuramente, aplicá-los na concepção de um software capaz de auxiliar no processo de diagnósticos médicos, bem como servir de referencial para futuras pesquisas acadêmicas no sentido de aprimorar os recursos desenvolvidos.
metadata.dc.description.abstracten: Electronic medical records present a rich set of data in the form of free text, that is, unstructured data. In order to organize this data into logical representations and enable automatic comparisons between them, this work aims to evaluate existing solutions and implement new methods that can be applied in the design of a medical software. These methods must be able to analyze a set of medical records, containing data collected in the anamnesis process in the Brazilian Portuguese language and, from then on, generate diagnostic suggestions, in order to streamline the procedure and assist health professionals in the process. decision-making process. The methods subject to evaluation, as well as those that have been implemented, make use of the resources of Natural Language Processing algorithms with aggregation of the medical ontology DeCS and sets of predefined rules for the processes of information retrieval, word classification and sentence classification, and these last two processes have as a pillar the classification method established by the grammar of the Portuguese language. The software resulting from the integration of these methods also makes use of classifiers in the disease identification process. With that, it was possible to produce two classification models, in which the first reached an accuracy and a F1 score of 62,38% and 65,38% respectively, in analyzes with databases that had different configurations , but inserted in the same analysis context, and a second model that reached 70,55% accuracy and 70,76% score F1 when analyzing information in merged databases. So, the experimental objective of this work is to evaluate and implement methods based on the study of the applications of computational techniques, inserted in the fields of machine learning and information retrieval, in order, in the future, to apply them in the design of a software capable of assisting in the medical diagnosis process, as well as serving as a reference for future academic research in order to improve the resources developed.
URI: http://www.monografias.ufop.br/handle/35400000/3078
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_AvaliaçãoTécnicasAprendizado.pdf4,36 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons