Implementação de métodos de aprendizagem por reforço para a resolução do problema CartPole.

Costa, Thales Alexandre Martins Lopes da

Por favor, use este identificador para citar o enlazar este ítem: http://www.monografias.ufop.br/handle/35400000/4816

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	Neves, Davi das Chagas	pt_BR
dc.contributor.author	Costa, Thales Alexandre Martins Lopes da	-
dc.date.accessioned	2022-11-17T11:30:44Z	-
dc.date.available	2022-11-17T11:30:44Z	-
dc.date.issued	2022	pt_BR
dc.identifier.citation	COSTA, Thales Alexandre Martins Lopes da. Implementação de métodos de aprendizagem por reforço para a resolução do problema CartPole. 2022. 39 f. Monografia (Graduação em Engenharia de Produção) - Escola de Minas, Universidade Federal de Ouro Preto, Ouro Preto, 2022.	pt_BR
dc.identifier.uri	http://www.monografias.ufop.br/handle/35400000/4816	-
dc.description.abstract	Neste trabalho procura-se demonstrar o conceito de aprendizagem por reforço e como ele, aliado a algoritmos de Machine Learning, pode ser utilizado para resolver o problema do pêndulo invertido. De tal forma, para alcançar este objetivo, serão implementados quatro algoritmos: Q-Learning, Escalada, REINFORCE e Deep Q Network. Estes algoritmos serão desenvolvidos na linguagem Python e seus resultados demonstrados. Observou-se que todos os algoritmos foram capazes de solucionar o problema do pêndulo - alguns sendo mais eficientes que os outros. Os algoritmos se provaram extremamente úteis para a resolução de problemas complexos e que podem ser aproveitados em diversas áres de pesquisa.	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.subject	Aprendizagem por reforço	pt_BR
dc.subject	Aprendizado do computador - aprendizagem por reforço	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Inteligência artificial - CartPole	pt_BR
dc.title	Implementação de métodos de aprendizagem por reforço para a resolução do problema CartPole.	pt_BR
dc.type	TCC-Graduação	pt_BR
dc.contributor.referee	Guimarães, Irce Fernandes Gomes	pt_BR
dc.contributor.referee	Murta, Jorge Luiz Brescia	pt_BR
dc.contributor.referee	Neves, Davi das Chagas	pt_BR
dc.description.abstracten	This work aims to demonstrate the concept of reinforcement learning and how it, with the help of machine learning algorithms, can be used to solve the inverted pendulum problem. In this way, in order to reach this goal, four algorithms will be implemented: Q-Learning, Hill Climbing, REINFORCE and Deep Q Network. These algorithms will be developed in Python and its results demonstrated. It was observed that all of the algorithms were capable of solving the pendulum problem - with some being more efficient than others. These algorithms have proved to be extremely useful in solving complex problems that may be utilized within many fields of study.	pt_BR
dc.contributor.authorID	19.1.1358	pt_BR
Aparece en las colecciones:	Engenharia de Produção - OP

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
MONOGRAFIA_ImplementaçãoMétodosAprendizagem.pdf		817,46 kB	Adobe PDF	Visualizar/Abrir

Mostrar el registro sencillo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons