Oligopólio e o algoritmo Q-Learning.

Brito, Xaider Gomes

Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/7758

Título:	Oligopólio e o algoritmo Q-Learning.
Autor(es):	Brito, Xaider Gomes
Orientador(es):	Barrenechea, Martin Harry Vargas
Membros da banca:	Barrenechea, Martin Harry Vargas Torres, Carlos Eduardo da Gama Attílio, Luccas Assis
Palavras-chave:	Algorítmos computacionais Aprendizado do computador Linguagem de programação - computadores Economia NetLogo - linguagem de programação de computador
Data do documento:	2025
Referência:	BRITO, Xaider Gomes. Oligopólio e o algoritmo Q-learning. 2025. 71 f. Monografia (Graduação em Ciências Econômicas) – Instituto de Ciências Sociais Aplicadas, Universidade Federal de Ouro Preto, Mariana, 2025.
Resumo:	Este trabalho investiga os comportamentos estratégicos emergentes em mercados oligo- polistas simulados por meio de modelagem baseada em agentes (MBA) e algoritmos de aprendizado por reforço, com foco no Q-learning. Utilizando a plataforma NetLogo, foram simuladas frmas autônomas que competem em um ambiente com demanda linear e cus- tos marginais nulos, tomando decisões adaptativas baseadas em recompensas. O estudo busca compreender se, ao longo do tempo, os agentes tendem a convergir para o equilíbrio de Cournot, formar colusões tácitas ou adotar comportamentos instáveis. As simulações foram conduzidas com variações paramétricas sistemáticas e analisadas estatisticamente no ambiente R. Os resultados mostram que a confguração do ambiente e os parâmetros de aprendizagem — como número de agentes e taxa de exploração — infuenciam forte- mente os padrões emergentes, oscilando entre regimes cooperativos e não cooperativos. A pesquisa contribui para o debate sobre racionalidade limitada em economia industrial, mostrando como algoritmos de aprendizado podem replicar dinâmicas reais de mercado.
Resumo em outra língua:	This work investigates the emergence of strategic behavior in simulated oligopolistic markets through agent-based modeling (ABM) and reinforcement learning algorithms, focusing on Q-learning. Using the NetLogo platform, autonomous frms were simula- ted competing in an environment with linear demand and zero marginal costs, adapting their production strategies over time based on endogenous rewards. The study aims to understand whether agents tend to converge toward Cournot equilibrium, develop tacit collusion, or exhibit unstable and non-strategic behaviors. Simulations were carried out with systematic parametric variations and the results were analyzed statistically using R. The fndings show that both the environment confguration and the learning para- meters—such as the number of agents and the exploration rate—strongly infuence the emergent patterns, which fuctuate between cooperative and non-cooperative regimes. This research contributes to the debate on bounded rationality in industrial economics by showing how learning algorithms can replicate real-world market dynamics.
URI:	http://www.monografias.ufop.br/handle/35400000/7758
Licença:	Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1).
Aparece nas coleções:	Ciências Econômicas

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
MONOGRAFIA_OligopólioAlgoritimoQlearning.pdf		1,1 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas