Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/7758
Title: Oligopólio e o algoritmo Q-Learning.
Authors: Brito, Xaider Gomes
metadata.dc.contributor.advisor: Barrenechea, Martin Harry Vargas
metadata.dc.contributor.referee: Barrenechea, Martin Harry Vargas
Torres, Carlos Eduardo da Gama
Attílio, Luccas Assis
Keywords: Algorítmos computacionais
Aprendizado do computador
Linguagem de programação - computadores
Economia
NetLogo - linguagem de programação de computador
Issue Date: 2025
Citation: BRITO, Xaider Gomes. Oligopólio e o algoritmo Q-learning. 2025. 71 f. Monografia (Graduação em Ciências Econômicas) – Instituto de Ciências Sociais Aplicadas, Universidade Federal de Ouro Preto, Mariana, 2025.
Abstract: Este trabalho investiga os comportamentos estratégicos emergentes em mercados oligo- polistas simulados por meio de modelagem baseada em agentes (MBA) e algoritmos de aprendizado por reforço, com foco no Q-learning. Utilizando a plataforma NetLogo, foram simuladas frmas autônomas que competem em um ambiente com demanda linear e cus- tos marginais nulos, tomando decisões adaptativas baseadas em recompensas. O estudo busca compreender se, ao longo do tempo, os agentes tendem a convergir para o equilíbrio de Cournot, formar colusões tácitas ou adotar comportamentos instáveis. As simulações foram conduzidas com variações paramétricas sistemáticas e analisadas estatisticamente no ambiente R. Os resultados mostram que a confguração do ambiente e os parâmetros de aprendizagem — como número de agentes e taxa de exploração — infuenciam forte- mente os padrões emergentes, oscilando entre regimes cooperativos e não cooperativos. A pesquisa contribui para o debate sobre racionalidade limitada em economia industrial, mostrando como algoritmos de aprendizado podem replicar dinâmicas reais de mercado.
metadata.dc.description.abstracten: This work investigates the emergence of strategic behavior in simulated oligopolistic markets through agent-based modeling (ABM) and reinforcement learning algorithms, focusing on Q-learning. Using the NetLogo platform, autonomous frms were simula- ted competing in an environment with linear demand and zero marginal costs, adapting their production strategies over time based on endogenous rewards. The study aims to understand whether agents tend to converge toward Cournot equilibrium, develop tacit collusion, or exhibit unstable and non-strategic behaviors. Simulations were carried out with systematic parametric variations and the results were analyzed statistically using R. The fndings show that both the environment confguration and the learning para- meters—such as the number of agents and the exploration rate—strongly infuence the emergent patterns, which fuctuate between cooperative and non-cooperative regimes. This research contributes to the debate on bounded rationality in industrial economics by showing how learning algorithms can replicate real-world market dynamics.
URI: http://www.monografias.ufop.br/handle/35400000/7758
metadata.dc.rights.license: Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1).
Appears in Collections:Ciências Econômicas

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_OligopólioAlgoritimoQlearning.pdf1,1 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.