Use este identificador para citar ou linkar para este item:
http://www.monografias.ufop.br/handle/35400000/7742
Título: | Estratégias de segmentação estrutural para melhoria no reconhecimento de páginas em contextos de baixo contraste visual. |
Autor(es): | Bernardo, Joelington de Almeida |
Orientador(es): | Silva, Saul Emanuel Delabrida Adachi, Bruno Hideki |
Membros da banca: | Cámara Chávez, Guillermo Bianchi, Andrea Gomes Campos Silva, Saul Emanuel Delabrida |
Palavras-chave: | Identificação de páginas Realidade aumentada Pré-processamento de imagem Orb Sift Brisk |
Data do documento: | 2025 |
Referência: | BERNARDO, Joelington de Almeida. Estratégias de segmentação estrutural para melhoria no reconhecimento de páginas em contextos de baixo contraste visual. 2025. 53 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025. |
Resumo: | Este trabalho propõe estratégias de segmentação estrutural para aprimorar o reconhecimento de páginas de livros em contextos de baixo contraste visual, visando integrar tecnologias como Rea- lidade Aumentada (RA) sem a necessidade de modificações físicas nos materiais. A abordagem utiliza técnicas de pré-processamento de imagem, como limiarização global, adaptativa e método Canny, combinadas a operações morfológicas (erosão, dilatação), para gerar impressões digitais únicas das páginas. Foram implementados e avaliados algoritmos de detecção de características (ORB, SIFT e BRISK) em um banco de dados Segmonto com 4.425 imagens selecionadas de páginas de livros com layouts diferentes, testando eficiência, precisão e robustez a ruídos. Os resultados demonstraram ganhos significativos: o pré-processamento reduziu o tempo de busca em até 96% (SIFT com limiarização adaptativa) e teve ganho de espaço de até 80%, dependendo do método. O ORB destacou-se em velocidade, enquanto o SIFT apresentou maior precisão em cenários complexos. Conclui-se que a segmentação estrutural e o pré-processamento são fundamentais para viabilizar sistemas de identificação em tempo real, especialmente em materiais educacionais. Trabalhos futuros podem explorar ajustes de parâmetros, integração com modelos de predição e testes com outros algoritmos para ampliar a robustez em ambientes adversos. |
Resumo em outra língua: | This work proposes structural segmentation strategies to improve book page recognition in low visual contrast contexts, aiming to integrate technologies such as Augmented Reality (AR) without the need for physical modifications to the materials. The approach uses image preprocessing techniques, such as global and adaptive thresholding and the Canny method, combined with morphological operations (erosion, dilation), to generate unique fingerprints of the pages. Feature detection algorithms (ORB, SIFT and BRISK) were implemented and evaluated on a Segmonto database with 4,425 selected images of book pages with different layouts, testing efficiency, accuracy and robustness to noise. The results demonstrated significant gains: preprocessing reduced search time by up to 96% (SIFT with adaptive thresholding) and had space gains of up to 80%, depending on the method. ORB stood out in speed, while SIFT showed greater accuracy in complex scenarios. It is concluded that structural segmentation and preprocessing are essential to enable real-time identification systems, especially in educational materials. Future work can explore parameter adjustments, integration with prediction models and tests with other algorithms to increase robustness in adverse environments. |
URI: | http://www.monografias.ufop.br/handle/35400000/7742 |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MONOGRAFIA_EstrategiasSegmentaçãoEstrutural.pdf | 16,74 MB | Adobe PDF | Visualizar/Abrir |
Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.