Use este identificador para citar ou linkar para este item:
http://www.monografias.ufop.br/handle/35400000/4816
Registro completo de metadados
Campo Dublin Core | Valor | Idioma |
---|---|---|
dc.contributor.advisor | Neves, Davi das Chagas | pt_BR |
dc.contributor.author | Costa, Thales Alexandre Martins Lopes da | - |
dc.date.accessioned | 2022-11-17T11:30:44Z | - |
dc.date.available | 2022-11-17T11:30:44Z | - |
dc.date.issued | 2022 | pt_BR |
dc.identifier.citation | COSTA, Thales Alexandre Martins Lopes da. Implementação de métodos de aprendizagem por reforço para a resolução do problema CartPole. 2022. 39 f. Monografia (Graduação em Engenharia de Produção) - Escola de Minas, Universidade Federal de Ouro Preto, Ouro Preto, 2022. | pt_BR |
dc.identifier.uri | http://www.monografias.ufop.br/handle/35400000/4816 | - |
dc.description.abstract | Neste trabalho procura-se demonstrar o conceito de aprendizagem por reforço e como ele, aliado a algoritmos de Machine Learning, pode ser utilizado para resolver o problema do pêndulo invertido. De tal forma, para alcançar este objetivo, serão implementados quatro algoritmos: Q-Learning, Escalada, REINFORCE e Deep Q Network. Estes algoritmos serão desenvolvidos na linguagem Python e seus resultados demonstrados. Observou-se que todos os algoritmos foram capazes de solucionar o problema do pêndulo - alguns sendo mais eficientes que os outros. Os algoritmos se provaram extremamente úteis para a resolução de problemas complexos e que podem ser aproveitados em diversas áres de pesquisa. | pt_BR |
dc.language.iso | pt_BR | pt_BR |
dc.subject | Aprendizagem por reforço | pt_BR |
dc.subject | Aprendizado do computador - aprendizagem por reforço | pt_BR |
dc.subject | Aprendizado do computador | pt_BR |
dc.subject | Inteligência artificial - CartPole | pt_BR |
dc.title | Implementação de métodos de aprendizagem por reforço para a resolução do problema CartPole. | pt_BR |
dc.type | TCC-Graduação | pt_BR |
dc.contributor.referee | Guimarães, Irce Fernandes Gomes | pt_BR |
dc.contributor.referee | Murta, Jorge Luiz Brescia | pt_BR |
dc.contributor.referee | Neves, Davi das Chagas | pt_BR |
dc.description.abstracten | This work aims to demonstrate the concept of reinforcement learning and how it, with the help of machine learning algorithms, can be used to solve the inverted pendulum problem. In this way, in order to reach this goal, four algorithms will be implemented: Q-Learning, Hill Climbing, REINFORCE and Deep Q Network. These algorithms will be developed in Python and its results demonstrated. It was observed that all of the algorithms were capable of solving the pendulum problem - with some being more efficient than others. These algorithms have proved to be extremely useful in solving complex problems that may be utilized within many fields of study. | pt_BR |
dc.contributor.authorID | 19.1.1358 | pt_BR |
Aparece nas coleções: | Engenharia de Produção - OP |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MONOGRAFIA_ImplementaçãoMétodosAprendizagem.pdf | 817,46 kB | Adobe PDF | Visualizar/Abrir |
Este item está licenciado sob uma Licença Creative Commons