Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira

dc.contributor.advisor1Cardoso, Claudio Antonio
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0332061570052918
dc.contributor.authorMoraes, Lucas Gabriel Bassan de
dc.date.accessioned2025-12-15T19:17:07Z
dc.date.issued2025-12-28
dc.description.abstractMarkov chains and Reinforcement Learning methods have emerged as promising tools for modeling complex stochastic systems, especially in financial environments characterized by uncertainty and volatility. In this context, the present work proposes the joint application of these approaches to the pricing and forecasting of financial assets, using Petrobras (PETR4) and Vale (VALE3) stocks as case studies. The developed model integrates the probabilistic dynamics of discrete-time Markov chains with the adaptive capabilities of the Q-Learning algorithm through reinforcement learning, enabling the agent to adjust its buy and sell decisions based on the defined accumulated rewards. The methodology was implemented in the Python programming language and evaluated using the Root Mean Squared Error (RMSE) metric, comparing the simulated results with the real values of each asset over predefined periods and algorithm-defined parameters. The obtained results demonstrated that the model is capable of consistently representing the evolution of asset prices, showing better performance over shorter training horizons depending on the asset. This behavior reinforces the potential of integrating stochastic techniques and machine learning methods for financial forecasting in emerging markets.eng
dc.description.resumoAs cadeias de Markov e os métodos de Aprendizado por Reforço têm se destacado como ferramentas promissoras para a modelagem de sistemas estocásticos complexos, especialmente em ambientes financeiros marcados por incertezas e volatilidade. Nesse contexto, este trabalho propõe a aplicação conjunta dessas abordagens na precificação e previsão de ativos financeiros, utilizando como estudo de caso as ações da Petrobras (PETR4) e da Vale (VALE3). O modelo desenvolvido integra a dinâmica probabilística das cadeias de Markov em tempo discreto com a capacidade adaptativa do algoritmo Q-Learning pela aprendizagem por reforço, permitindo ao agente ajustar suas decisões de compra e venda com base nas recompensas acumuladas definidas. A metodologia foi implementada em linguagem Python e avaliada com base na métrica Raiz Quadrada do Erro Médio (RMSE), comparando os resultados simulados com os valores reais de cada ativo em períodos estabelecidos e parâmetros definidos pelo algoritmo. Os resultados obtidos demonstraram que o modelo é capaz de representar de forma consistente a evolução do preço dos ativos, apresentando melhor desempenho em horizontes de treinamento mais curtos, dependendo do ativo. Esse comportamento reforça o potencial da integração entre técnicas estocásticas e aprendizado de máquina para previsão financeira em mercados emergentes.
dc.identifier.citationMORAES, Lucas Gabriel Bassan de. Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia Física) – Universidade Federal de São Carlos, Campus São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23230.*
dc.identifier.urihttps://hdl.handle.net/20.500.14289/23230
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.courseEngenharia Física - EFi
dc.publisher.initialsUFSCar
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectCadeias de Markov
dc.subjectAprendizado por Reforço
dc.subjectQ-Learning
dc.subjectPrecificação de Ativos
dc.subjectPrevisão Financeira
dc.subject.cnpqCIENCIAS SOCIAIS APLICADAS::ECONOMIA
dc.subject.ods9. Indústria, Inovação e Infraestrutura
dc.titlePrecificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira
dc.title.alternativeAsset pricing using Markov chains and reinforcement learning: a possible approach for financial forecastingeng
dc.typeTCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC_Lucas_Bassan_2025.pdf
Tamanho:
7.95 MB
Formato:
Adobe Portable Document Format

Coleções