Por favor, use este identificador para citar o enlazar este ítem:
http://www.monografias.ufop.br/handle/35400000/7758
Título : | Oligopólio e o algoritmo Q-Learning. |
Autor : | Brito, Xaider Gomes |
metadata.dc.contributor.advisor: | Barrenechea, Martin Harry Vargas |
metadata.dc.contributor.referee: | Barrenechea, Martin Harry Vargas Torres, Carlos Eduardo da Gama Attílio, Luccas Assis |
Palabras clave : | Algorítmos computacionais Aprendizado do computador Linguagem de programação - computadores Economia NetLogo - linguagem de programação de computador |
Fecha de publicación : | 2025 |
Citación : | BRITO, Xaider Gomes. Oligopólio e o algoritmo Q-learning. 2025. 71 f. Monografia (Graduação em Ciências Econômicas) – Instituto de Ciências Sociais Aplicadas, Universidade Federal de Ouro Preto, Mariana, 2025. |
Resumen : | Este trabalho investiga os comportamentos estratégicos emergentes em mercados oligo- polistas simulados por meio de modelagem baseada em agentes (MBA) e algoritmos de aprendizado por reforço, com foco no Q-learning. Utilizando a plataforma NetLogo, foram simuladas frmas autônomas que competem em um ambiente com demanda linear e cus- tos marginais nulos, tomando decisões adaptativas baseadas em recompensas. O estudo busca compreender se, ao longo do tempo, os agentes tendem a convergir para o equilíbrio de Cournot, formar colusões tácitas ou adotar comportamentos instáveis. As simulações foram conduzidas com variações paramétricas sistemáticas e analisadas estatisticamente no ambiente R. Os resultados mostram que a confguração do ambiente e os parâmetros de aprendizagem — como número de agentes e taxa de exploração — infuenciam forte- mente os padrões emergentes, oscilando entre regimes cooperativos e não cooperativos. A pesquisa contribui para o debate sobre racionalidade limitada em economia industrial, mostrando como algoritmos de aprendizado podem replicar dinâmicas reais de mercado. |
metadata.dc.description.abstracten: | This work investigates the emergence of strategic behavior in simulated oligopolistic markets through agent-based modeling (ABM) and reinforcement learning algorithms, focusing on Q-learning. Using the NetLogo platform, autonomous frms were simula- ted competing in an environment with linear demand and zero marginal costs, adapting their production strategies over time based on endogenous rewards. The study aims to understand whether agents tend to converge toward Cournot equilibrium, develop tacit collusion, or exhibit unstable and non-strategic behaviors. Simulations were carried out with systematic parametric variations and the results were analyzed statistically using R. The fndings show that both the environment confguration and the learning para- meters—such as the number of agents and the exploration rate—strongly infuence the emergent patterns, which fuctuate between cooperative and non-cooperative regimes. This research contributes to the debate on bounded rationality in industrial economics by showing how learning algorithms can replicate real-world market dynamics. |
URI : | http://www.monografias.ufop.br/handle/35400000/7758 |
metadata.dc.rights.license: | Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1). |
Aparece en las colecciones: | Ciências Econômicas |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
MONOGRAFIA_OligopólioAlgoritimoQlearning.pdf | 1,1 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.