Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira
| dc.contributor.advisor1 | Cardoso, Claudio Antonio | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0332061570052918 | |
| dc.contributor.author | Moraes, Lucas Gabriel Bassan de | |
| dc.date.accessioned | 2025-12-15T19:17:07Z | |
| dc.date.issued | 2025-12-28 | |
| dc.description.abstract | Markov chains and Reinforcement Learning methods have emerged as promising tools for modeling complex stochastic systems, especially in financial environments characterized by uncertainty and volatility. In this context, the present work proposes the joint application of these approaches to the pricing and forecasting of financial assets, using Petrobras (PETR4) and Vale (VALE3) stocks as case studies. The developed model integrates the probabilistic dynamics of discrete-time Markov chains with the adaptive capabilities of the Q-Learning algorithm through reinforcement learning, enabling the agent to adjust its buy and sell decisions based on the defined accumulated rewards. The methodology was implemented in the Python programming language and evaluated using the Root Mean Squared Error (RMSE) metric, comparing the simulated results with the real values of each asset over predefined periods and algorithm-defined parameters. The obtained results demonstrated that the model is capable of consistently representing the evolution of asset prices, showing better performance over shorter training horizons depending on the asset. This behavior reinforces the potential of integrating stochastic techniques and machine learning methods for financial forecasting in emerging markets. | eng |
| dc.description.resumo | As cadeias de Markov e os métodos de Aprendizado por Reforço têm se destacado como ferramentas promissoras para a modelagem de sistemas estocásticos complexos, especialmente em ambientes financeiros marcados por incertezas e volatilidade. Nesse contexto, este trabalho propõe a aplicação conjunta dessas abordagens na precificação e previsão de ativos financeiros, utilizando como estudo de caso as ações da Petrobras (PETR4) e da Vale (VALE3). O modelo desenvolvido integra a dinâmica probabilística das cadeias de Markov em tempo discreto com a capacidade adaptativa do algoritmo Q-Learning pela aprendizagem por reforço, permitindo ao agente ajustar suas decisões de compra e venda com base nas recompensas acumuladas definidas. A metodologia foi implementada em linguagem Python e avaliada com base na métrica Raiz Quadrada do Erro Médio (RMSE), comparando os resultados simulados com os valores reais de cada ativo em períodos estabelecidos e parâmetros definidos pelo algoritmo. Os resultados obtidos demonstraram que o modelo é capaz de representar de forma consistente a evolução do preço dos ativos, apresentando melhor desempenho em horizontes de treinamento mais curtos, dependendo do ativo. Esse comportamento reforça o potencial da integração entre técnicas estocásticas e aprendizado de máquina para previsão financeira em mercados emergentes. | |
| dc.identifier.citation | MORAES, Lucas Gabriel Bassan de. Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia Física) – Universidade Federal de São Carlos, Campus São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23230. | * |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/23230 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Campus São Carlos | |
| dc.publisher.course | Engenharia Física - EFi | |
| dc.publisher.initials | UFSCar | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Cadeias de Markov | |
| dc.subject | Aprendizado por Reforço | |
| dc.subject | Q-Learning | |
| dc.subject | Precificação de Ativos | |
| dc.subject | Previsão Financeira | |
| dc.subject.cnpq | CIENCIAS SOCIAIS APLICADAS::ECONOMIA | |
| dc.subject.ods | 9. Indústria, Inovação e Infraestrutura | |
| dc.title | Precificação de ativos utilizando cadeias de Markov e aprendizagem por reforço: uma possível abordagem para previsão financeira | |
| dc.title.alternative | Asset pricing using Markov chains and reinforcement learning: a possible approach for financial forecasting | eng |
| dc.type | TCC |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCC_Lucas_Bassan_2025.pdf
- Tamanho:
- 7.95 MB
- Formato:
- Adobe Portable Document Format