Use este identificador para citar ou linkar para este item:
http://www.monografias.ufop.br/handle/35400000/7062
Título: | Um estudo sobre dataset distillation |
Título(s) alternativo(s): | Um estudo sobre destilação do conjunto de dados |
Autor(es): | Paixao, Igor Santiago Almeida |
Orientador(es): | Silva, Pedro Henrique Lopes |
Membros da banca: | Silva, Guilherme Augusto Lopes Pinto, Luan Patrik Silva Silva, Pedro Henrique Lopes |
Palavras-chave: | Redes neurais Aprendizado profundo Classificação de dados |
Data do documento: | 2024 |
Referência: | PAIXAO, Igor Santiago Almeida. Um estudo sobre aataset Ddstillation. 2024. 82 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2024. |
Resumo: | Dataset Distilation (DD) é uma técnica utilizada para gerar um conjunto de dados sintéticos, condensado e informativo, capaz de substituir o conjunto de dados original no treinamento de modelos de aprendizado de máquina. Este estudo explora a aplicação de técnicas de DD em um novo domínio, utilizando o conjunto de dados PathMNIST para avaliar o desempenho desses métodos. Nossa abordagem foca na comparação de duas técnicas consolidadas, Dataset Distillation by Gradient Matching (DD-GM) e Dataset Distillation by Automatic Training Trajectories (ATT) aplicadas à esse conjunto de dados. Os resultados demonstram a viabilidade das técnicas de DD em tarefas complexas de imagens médicas, fornecendo insights sobre a eficácia dessas abordagens em novos contextos. Além disso, este trabalho apresenta uma avaliação abrangente de ambos os métodos, destacando seus pontos fortes e limitações, e contribuindo com descobertas importantes para a aplicação de DD em conjuntos de dados mais desafiadores e específicos. |
Resumo em outra língua: | Dataset Distilation (DD) is a technique used to generate a synthetic, condensed and informative dataset capable of replacing the original dataset when training machine learning models. This study explores the application of DD techniques in a new domain, using the PathMNIST dataset to evaluate the performance of these methods. Our approach focuses on comparing two consolidated techniques, Dataset Distillation by Gradient Matching (DD-GM) and Dataset Distillation by Automatic Training Trajectories (ATT) applied to this dataset. The results demonstrate the applicability of Dataset Distilation (DD) techniques to complex medical imaging tasks, providing insights into the efficiency of these approaches in new contexts. In addition, this paper presents a comprehensive evaluation of both methods, highlighting their strengths and limitations, and contributing important findings for the application of DD to more challenging and specific datasets |
URI: | http://www.monografias.ufop.br/handle/35400000/7062 |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MONOGRAFIA_EstudoDatasetDistillation.pdf | 4,56 MB | Adobe PDF | Visualizar/Abrir |
Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.