Por favor, use este identificador para citar o enlazar este ítem:
http://www.monografias.ufop.br/handle/35400000/8660| Título : | Aplicação do modelo oculto de Markov e da rede neural convolucional em um sistema de reconhecimento de fala automático. |
| Autor : | Marotta, Leonardo Castro Souza |
| metadata.dc.contributor.advisor: | Yared, Glauco Ferreira Gazel |
| metadata.dc.contributor.referee: | Yared, Glauco Ferreira Gazel Assis, Gilda Aparecida de Tiago, Marcelo Moreira |
| Palabras clave : | Aprendizado do computador Processos de Markov Sistemas de processamento da fala Redes Neurais Convolucionais Processamento de sinais |
| Fecha de publicación : | 2025 |
| Citación : | MAROTTA, Leonardo Castro Souza. Aplicação do modelo oculto de Markov e da rede neural convolucional em um sistema de reconhecimento de fala automático. 2025. 97 f. Monografia (Graduação em Engenharia Elétrica) - Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2025. |
| Resumen : | O presente trabalho aborda a utilização das técnicas de Modelos Ocultos de Markov (HMM, do inglês Hidden Markov Models) e aprendizagem profunda através de Redes Neurais Convolucionais (CNN, do inglês Convolutional Neural Network) aplicadas em sistemas de reconhecimento de fala. Foi desenvolvido um sistema de reconhecimento de comandos de fala dependente do locutor, onde serão avaliadas duas bases gravadas pelo mesmo locutor. Ambas as técnicas utilizadas partem do princípio de treinamento do mo delo em cima das bases e depois a etapa de testes no reconhecimento através da extração de características. Para que estes sistemas tenham um reconhecimento assertivo, os mo delos criados devem ser minimamente impactados por ruídos externos, o que depende em parte do pré-processamento e também da obtenção de modelos acústicos robustos. Para tal, neste trabalho é feita a remoção de silêncio a fim de aprimorar o reconhecimento com base na extração de características. Os resultados demonstraram que, enquanto o modelo CNN apresentou desempenho satisfatório com acurácia média entre 93% e 98%, o HMMobteve resultados superiores, alcançando acurácia média de 99% nas bases testa das, evidenciando maior capacidade de generalização e resistência a ruídos. Essas métricas confirmam a efetividade do aprendizado profundo na tarefa de reconhecimento automá tico de fala, especialmente em contextos de variação temporal e de pré-processamento otimizado. |
| metadata.dc.description.abstracten: | This paper addresses the use of Hidden Markov Model (HMM) and deep learning tech niques through convolutional neural networks (CNN) applied to speech recognition sys tems. A speaker-dependent speech command recognition system were developed, where two databases recorded by the same speaker will be evaluated. Both techniques used are based on the principle of training the model on the databases and then the recognition testing stage through feature extraction. For these systems to have assertive recognition, the models created must be minimally impacted by external noise, which depends in part on preprocessing and also on obtaining robust acoustic models. To this end, this work removes noise and silence cutouts in order to improve recognition based on feature extraction. The results demonstrated that, while the CNN model performed satisfacto rily with average accuracy between 93% and 98%, the HMM achieved superior results, achieving an average accuracy of 99% on the tested datasets, demonstrating greater gener alization capacity and resistance to noise. These metrics confirm the effectiveness of deep learning in automatic speech recognition, especially in contexts with temporal variation and optimized preprocessing. |
| URI : | http://www.monografias.ufop.br/handle/35400000/8660 |
| metadata.dc.rights.license: | Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1). |
| Aparece en las colecciones: | Engenharia Elétrica - JMV |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| MONOGRAFIA_AplicaçãoModeloOculto.pdf | 4,09 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
