Aplicação do modelo oculto de Markov e da rede neural convolucional em um sistema de reconhecimento de fala automático.

Marotta, Leonardo Castro Souza

Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/8660

Registro completo de metadados

Campo Dublin Core	Valor	Idioma
dc.contributor.advisor	Yared, Glauco Ferreira Gazel	pt_BR
dc.contributor.author	Marotta, Leonardo Castro Souza	-
dc.date.accessioned	2026-01-12T18:33:21Z	-
dc.date.available	2026-01-12T18:33:21Z	-
dc.date.issued	2025	pt_BR
dc.identifier.citation	MAROTTA, Leonardo Castro Souza. Aplicação do modelo oculto de Markov e da rede neural convolucional em um sistema de reconhecimento de fala automático. 2025. 97 f. Monografia (Graduação em Engenharia Elétrica) - Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2025.	pt_BR
dc.identifier.uri	http://www.monografias.ufop.br/handle/35400000/8660	-
dc.description.abstract	O presente trabalho aborda a utilização das técnicas de Modelos Ocultos de Markov (HMM, do inglês Hidden Markov Models) e aprendizagem profunda através de Redes Neurais Convolucionais (CNN, do inglês Convolutional Neural Network) aplicadas em sistemas de reconhecimento de fala. Foi desenvolvido um sistema de reconhecimento de comandos de fala dependente do locutor, onde serão avaliadas duas bases gravadas pelo mesmo locutor. Ambas as técnicas utilizadas partem do princípio de treinamento do mo delo em cima das bases e depois a etapa de testes no reconhecimento através da extração de características. Para que estes sistemas tenham um reconhecimento assertivo, os mo delos criados devem ser minimamente impactados por ruídos externos, o que depende em parte do pré-processamento e também da obtenção de modelos acústicos robustos. Para tal, neste trabalho é feita a remoção de silêncio a fim de aprimorar o reconhecimento com base na extração de características. Os resultados demonstraram que, enquanto o modelo CNN apresentou desempenho satisfatório com acurácia média entre 93% e 98%, o HMMobteve resultados superiores, alcançando acurácia média de 99% nas bases testa das, evidenciando maior capacidade de generalização e resistência a ruídos. Essas métricas confirmam a efetividade do aprendizado profundo na tarefa de reconhecimento automá tico de fala, especialmente em contextos de variação temporal e de pré-processamento otimizado.	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Processos de Markov	pt_BR
dc.subject	Sistemas de processamento da fala	pt_BR
dc.subject	Redes Neurais Convolucionais	pt_BR
dc.subject	Processamento de sinais	pt_BR
dc.title	Aplicação do modelo oculto de Markov e da rede neural convolucional em um sistema de reconhecimento de fala automático.	pt_BR
dc.type	TCC-Graduação	pt_BR
dc.rights.license	Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1).	pt_BR
dc.contributor.referee	Yared, Glauco Ferreira Gazel	pt_BR
dc.contributor.referee	Assis, Gilda Aparecida de	pt_BR
dc.contributor.referee	Tiago, Marcelo Moreira	pt_BR
dc.description.abstracten	This paper addresses the use of Hidden Markov Model (HMM) and deep learning tech niques through convolutional neural networks (CNN) applied to speech recognition sys tems. A speaker-dependent speech command recognition system were developed, where two databases recorded by the same speaker will be evaluated. Both techniques used are based on the principle of training the model on the databases and then the recognition testing stage through feature extraction. For these systems to have assertive recognition, the models created must be minimally impacted by external noise, which depends in part on preprocessing and also on obtaining robust acoustic models. To this end, this work removes noise and silence cutouts in order to improve recognition based on feature extraction. The results demonstrated that, while the CNN model performed satisfacto rily with average accuracy between 93% and 98%, the HMM achieved superior results, achieving an average accuracy of 99% on the tested datasets, demonstrating greater gener alization capacity and resistance to noise. These metrics confirm the effectiveness of deep learning in automatic speech recognition, especially in contexts with temporal variation and optimized preprocessing.	pt_BR
dc.contributor.authorID	15.1.8038	pt_BR
Aparece nas coleções:	Engenharia Elétrica - JMV

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
MONOGRAFIA_AplicaçãoModeloOculto.pdf		4,09 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas