Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira

Moraes, Lucas Gabriel Bassan de

Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira

dc.contributor.advisor1	Cardoso, Claudio Antonio
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/0332061570052918
dc.contributor.author	Moraes, Lucas Gabriel Bassan de
dc.date.accessioned	2025-12-15T19:17:07Z
dc.date.issued	2025-12-28
dc.description.abstract	Markov chains and Reinforcement Learning methods have emerged as promising tools for modeling complex stochastic systems, especially in financial environments characterized by uncertainty and volatility. In this context, the present work proposes the joint application of these approaches to the pricing and forecasting of financial assets, using Petrobras (PETR4) and Vale (VALE3) stocks as case studies. The developed model integrates the probabilistic dynamics of discrete-time Markov chains with the adaptive capabilities of the Q-Learning algorithm through reinforcement learning, enabling the agent to adjust its buy and sell decisions based on the defined accumulated rewards. The methodology was implemented in the Python programming language and evaluated using the Root Mean Squared Error (RMSE) metric, comparing the simulated results with the real values of each asset over predefined periods and algorithm-defined parameters. The obtained results demonstrated that the model is capable of consistently representing the evolution of asset prices, showing better performance over shorter training horizons depending on the asset. This behavior reinforces the potential of integrating stochastic techniques and machine learning methods for financial forecasting in emerging markets.	eng
dc.description.resumo	As cadeias de Markov e os métodos de Aprendizado por Reforço têm se destacado como ferramentas promissoras para a modelagem de sistemas estocásticos complexos, especialmente em ambientes financeiros marcados por incertezas e volatilidade. Nesse contexto, este trabalho propõe a aplicação conjunta dessas abordagens na precificação e previsão de ativos financeiros, utilizando como estudo de caso as ações da Petrobras (PETR4) e da Vale (VALE3). O modelo desenvolvido integra a dinâmica probabilística das cadeias de Markov em tempo discreto com a capacidade adaptativa do algoritmo Q-Learning pela aprendizagem por reforço, permitindo ao agente ajustar suas decisões de compra e venda com base nas recompensas acumuladas definidas. A metodologia foi implementada em linguagem Python e avaliada com base na métrica Raiz Quadrada do Erro Médio (RMSE), comparando os resultados simulados com os valores reais de cada ativo em períodos estabelecidos e parâmetros definidos pelo algoritmo. Os resultados obtidos demonstraram que o modelo é capaz de representar de forma consistente a evolução do preço dos ativos, apresentando melhor desempenho em horizontes de treinamento mais curtos, dependendo do ativo. Esse comportamento reforça o potencial da integração entre técnicas estocásticas e aprendizado de máquina para previsão financeira em mercados emergentes.
dc.identifier.citation	MORAES, Lucas Gabriel Bassan de. Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia Física) – Universidade Federal de São Carlos, Campus São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23230.	*
dc.identifier.uri	https://hdl.handle.net/20.500.14289/23230
dc.language.iso	por
dc.publisher	Universidade Federal de São Carlos
dc.publisher.address	Campus São Carlos
dc.publisher.course	Engenharia Física - EFi
dc.publisher.initials	UFSCar
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subject	Cadeias de Markov
dc.subject	Aprendizado por Reforço
dc.subject	Q-Learning
dc.subject	Precificação de Ativos
dc.subject	Previsão Financeira
dc.subject.cnpq	CIENCIAS SOCIAIS APLICADAS::ECONOMIA
dc.subject.ods	9. Indústria, Inovação e Infraestrutura
dc.title	Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira
dc.title.alternative	Asset pricing using Markov chains and reinforcement learning: a possible approach for financial forecasting	eng
dc.type	TCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: TCC_Lucas_Bassan_2025.pdf
Tamanho:: 7.95 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

TCC