Use este identificador para citar ou linkar para este item:
http://www.monografias.ufop.br/handle/35400000/5295
Registro completo de metadados
Campo Dublin Core | Valor | Idioma |
---|---|---|
dc.contributor.advisor | Cámara Chávez, Guillermo | pt_BR |
dc.contributor.author | Reis, Mateus Pevidor | - |
dc.date.accessioned | 2023-04-03T13:42:40Z | - |
dc.date.available | 2023-04-03T13:42:40Z | - |
dc.date.issued | 2023 | pt_BR |
dc.identifier.citation | REIS, Mateus Pevidor. Reconhecimento de pessoas através da biometria da face e da orelha. 2023. 64 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2023 | pt_BR |
dc.identifier.uri | http://www.monografias.ufop.br/handle/35400000/5295 | - |
dc.description.abstract | A biometria refere-se aos métodos automatizados de identificação de indivíduos com base em suas características físicas ou comportamentais únicas. Essas características podem incluir impressões digitais, características faciais, padrões de íris, impressões de voz e até traços comportamentais, como ritmo de digitação ou a forma de andar. Os sistemas de identificação biométrica funcionam capturando essas características únicas e comparando-as com um banco de dados pré-existente de características conhecidas para autenticar a identidade do indivíduo. Os métodos biométricos tornaram-se cada vez mais populares nos últimos anos devido à sua capacidade de identificar indivíduos com precisão e segurança com base nessas características. Diferentes métodos de extração de características são utilizados nessa área, tais como Histograma de Gradientes Orientados - Histogram of Oriented Gradients (HOG), Support Vector Machine (SVM) e Rede Neural Convolucional - Convolutional Neural Network (CNN), como também o avanço recente na visão computacional, os Vision Transformer (ViT). Portanto, neste trabalho é explorado o uso de deep learning, utilizando como extratores de características CNNs e ViTs com o objetivo de realizar o reconhecimento de indivíduos a partir de imagens de sua face e orelha. São propostos dois modelos que fazem o uso de três classificadores distintos, sendo um para classificar o indivíduo a partir da face, outro para classificá-lo a partir da orelha, e um último, este sendo um Multi-layer Perceptron (MLP), para combinar os resultados dos anteriores em uma única classificação. Um dos modelos, utilizando CNNs como extrator de características, e o outro utilizando ViTs. Para testar a eficácia das composição dos modelos, foram conduzidos experimentos computacionais, utilizando diferentes conjuntos de dados que foram obtidos tanto em ambientes controlados quanto em ambientes não controlados. Os conjuntos de dados obtidos em ambiente controlado usados nesses experimentos incluem os conjuntos de dados AMI Ear e FEI Face, enquanto os conjuntos de dados obtidos em ambiente não controlado incluem os conjuntos de dados VGGFace-Ear e LFW Face. As amostras dos conjuntos de dados de faces e de orelhas foram pareados um a um, gerando uma base de dados sintética, de modo que pares de faces e orelhas componham um indivíduo. Quando treinado com o conjunto de dados controlados, o modelo baseado em CNNs obteve a acurácia de 100%, e também de 100% quando treinado com o conjunto de dados não controlados. O modelo baseado em ViTs, treinado apenas no conjunto de dados não controlados, obteve acurácia de 100% no conjunto de dados controlados. Diante dos resultados obtidos, foi possível concluir que a combinação dos resultados de múltiplos modelos por meio de uma rede neural é uma prática válida, além de que o uso de ViTs pode trazer melhores resultados em relação ao uso de CNNs. | pt_BR |
dc.language.iso | pt_BR | pt_BR |
dc.subject | Biometria | pt_BR |
dc.subject | Identificação | pt_BR |
dc.subject | Redes neurais - computação | pt_BR |
dc.subject | Reconhecimento facial | pt_BR |
dc.title | Reconhecimento de pessoas através da biometria da face e da orelha. | pt_BR |
dc.type | TCC-Graduação | pt_BR |
dc.contributor.referee | Cámara Chávez, Guillermo | pt_BR |
dc.contributor.referee | Queiroz, Rafael Alves Bonfim de | pt_BR |
dc.contributor.referee | Silva, Pedro Henrique Lopes | pt_BR |
dc.description.abstracten | Biometrics refers to automated methods for individual identification based on their unique physical or behavioral characteristics. These characteristics may include fingerprints, facial characteristics, iris patterns, voice impressions and even behavioral traits, such as typing rhythm or walking manner. Identification systems work by capturing these unique characteristics and comparing them with a pre existing database of known characteristics to authenticate the individual’s identity. Biometric methods have become more popular on the past years due to their capacity of identify individuals with accuracy and security based on those characteristics. Different feature extraction methods are used in this area, such as Histograma de Gradientes Orientados - Histogram of Oriented Gradients (HOG), Support Vector Machine (SVM), and Rede Neural Convolucional - Convolutional Neural Network (CNN), aswell as the recent computational vision advance, Vision Transformer (ViT). Therefore, this work explores the use of deep learning, using CNNs e ViTs as feature extractors, in order to perform individual recognition based on their face and ear. Two models are proposed that make use of three distinct classifiers, one for facial recognition, other for ear recognition, and the last, as a Multi-layer Perceptron (MLP), for combining the results of the later two into a unique classification. One of the models, using CNNs as a feature extractor, and the other using ViTs. In order to test the efficiency of the models’ composition, computational experiments were conducted using different datasets with data that were obtained in both constrained and unconstrained environments. The constrained datasets used in the experiments include the AMI Ear dataset and the FEI Face dataset, while the unconstrained datasets include the VGGFace-Ear and the LFW datasets. The samples of the ear and face datasets were paired one by one, generating a synthetic database, so that ear and face pairs make up a subject. When trained with the constrained datasets, the CNN-based model achieved 100% accuracy, and also 100% accuracy when trained with the unconstrained datasets. The ViT-based model, trained only on the unconstrained dataset, achieved 100% accuracy. In view of the obtained results, it was possible to conclude that the combination of results of multiple models by using a neural network is a valid practice, in addition to the fact that the use of ViTs can bring better results in comparison to the use of CNNs. | pt_BR |
dc.contributor.authorID | 19.1.4007 | pt_BR |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MONOGRAFIA_ReconhecimentoPessoasBiometria.pdf | 5,17 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciado sob uma Licença Creative Commons