Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/8660
Registro completo de metadados
Campo Dublin CoreValorIdioma
dc.contributor.advisorYared, Glauco Ferreira Gazelpt_BR
dc.contributor.authorMarotta, Leonardo Castro Souza-
dc.date.accessioned2026-01-12T18:33:21Z-
dc.date.available2026-01-12T18:33:21Z-
dc.date.issued2025pt_BR
dc.identifier.citationMAROTTA, Leonardo Castro Souza. Aplicação do modelo oculto de Markov e da rede neural convolucional em um sistema de reconhecimento de fala automático. 2025. 97 f. Monografia (Graduação em Engenharia Elétrica) - Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2025.pt_BR
dc.identifier.urihttp://www.monografias.ufop.br/handle/35400000/8660-
dc.description.abstractO presente trabalho aborda a utilização das técnicas de Modelos Ocultos de Markov (HMM, do inglês Hidden Markov Models) e aprendizagem profunda através de Redes Neurais Convolucionais (CNN, do inglês Convolutional Neural Network) aplicadas em sistemas de reconhecimento de fala. Foi desenvolvido um sistema de reconhecimento de comandos de fala dependente do locutor, onde serão avaliadas duas bases gravadas pelo mesmo locutor. Ambas as técnicas utilizadas partem do princípio de treinamento do mo delo em cima das bases e depois a etapa de testes no reconhecimento através da extração de características. Para que estes sistemas tenham um reconhecimento assertivo, os mo delos criados devem ser minimamente impactados por ruídos externos, o que depende em parte do pré-processamento e também da obtenção de modelos acústicos robustos. Para tal, neste trabalho é feita a remoção de silêncio a fim de aprimorar o reconhecimento com base na extração de características. Os resultados demonstraram que, enquanto o modelo CNN apresentou desempenho satisfatório com acurácia média entre 93% e 98%, o HMMobteve resultados superiores, alcançando acurácia média de 99% nas bases testa das, evidenciando maior capacidade de generalização e resistência a ruídos. Essas métricas confirmam a efetividade do aprendizado profundo na tarefa de reconhecimento automá tico de fala, especialmente em contextos de variação temporal e de pré-processamento otimizado.pt_BR
dc.language.isopt_BRpt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectProcessos de Markovpt_BR
dc.subjectSistemas de processamento da falapt_BR
dc.subjectRedes Neurais Convolucionaispt_BR
dc.subjectProcessamento de sinaispt_BR
dc.titleAplicação do modelo oculto de Markov e da rede neural convolucional em um sistema de reconhecimento de fala automático.pt_BR
dc.typeTCC-Graduaçãopt_BR
dc.rights.licenseEste trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1).pt_BR
dc.contributor.refereeYared, Glauco Ferreira Gazelpt_BR
dc.contributor.refereeAssis, Gilda Aparecida dept_BR
dc.contributor.refereeTiago, Marcelo Moreirapt_BR
dc.description.abstractenThis paper addresses the use of Hidden Markov Model (HMM) and deep learning tech niques through convolutional neural networks (CNN) applied to speech recognition sys tems. A speaker-dependent speech command recognition system were developed, where two databases recorded by the same speaker will be evaluated. Both techniques used are based on the principle of training the model on the databases and then the recognition testing stage through feature extraction. For these systems to have assertive recognition, the models created must be minimally impacted by external noise, which depends in part on preprocessing and also on obtaining robust acoustic models. To this end, this work removes noise and silence cutouts in order to improve recognition based on feature extraction. The results demonstrated that, while the CNN model performed satisfacto rily with average accuracy between 93% and 98%, the HMM achieved superior results, achieving an average accuracy of 99% on the tested datasets, demonstrating greater gener alization capacity and resistance to noise. These metrics confirm the effectiveness of deep learning in automatic speech recognition, especially in contexts with temporal variation and optimized preprocessing.pt_BR
dc.contributor.authorID15.1.8038pt_BR
Aparece nas coleções:Engenharia Elétrica - JMV

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_AplicaçãoModeloOculto.pdf4,09 MBAdobe PDFVisualizar/Abrir


Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.