Mostrar el registro sencillo del ítem
Enriquecendo a previsão de séries temporais usando informação textual
dc.contributor.author | Cruz, Lord Flaubert Steve Ataucuri | |
dc.date.accessioned | 2021-05-13T13:33:44Z | |
dc.date.available | 2021-05-13T13:33:44Z | |
dc.date.issued | 2021-02-25 | |
dc.identifier.citation | CRUZ, Lord Flaubert Steve Ataucuri. Enriquecendo a previsão de séries temporais usando informação textual. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14258. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/14258 | |
dc.description.abstract | The ability to extract knowledge and forecast stock trends is crucial to mitigate investors' risks and uncertainties in the market. The stock trend is affected by non-linearity, complexity, noise, and especially the surrounding events. External factors such as daily news became one of the investors' primary resources for making decisions about buying or selling assets. However, this kind of information appears very fast. There are thousands of news generated by numerous web sources, taking a long time to analyze them, which can cost millions of dollars losses for investors due to a late decision. Recent contextual language models have transformed the area of natural language processing. However, classification models that use news that influence stock values need to deal with the unlabeled, class imbalance, and dissimilar texts. Recent studies show that the prediction of time series substantially improves by considering external information. This work proposes a hybrid methodology with three phases, one for news mining, a model for representation compact features, and the forecast model of time series, which merge for a more accurate prediction of prices. Initially, a small corpus is built using as support the time series. After that, we label the corpus based on semi-supervised learning to assign labels to other unlabeled news. In the second phase, the mining model with a classifier is used, whose output is concatenated with time series features, so the compact model representation extracts new features in a latent space. Finally, we predicted future prices with this fused knowledge. In a case study with Bitcoin cryptocurrency, the proposed methodology achieved a 1.62% decrease in the mean absolute percentage error. | eng |
dc.description.sponsorship | Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) | por |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Análise de sentimento para séries temporais | por |
dc.subject | Enriquecendo as séries temporais | por |
dc.subject | Computação financeiras | por |
dc.subject | Previsão de séries temporais | por |
dc.subject | Previsão com aprendizado profundo | por |
dc.subject | Previsão de séries temporais com lstm | por |
dc.subject | Sentiment analysis for time series | eng |
dc.subject | Enrich time series | eng |
dc.subject | Computational finance | eng |
dc.subject | Time series forecasting | eng |
dc.subject | Deep learning forecasting | eng |
dc.subject | lstm time series forecasting | eng |
dc.title | Enriquecendo a previsão de séries temporais usando informação textual | por |
dc.title.alternative | Enriching time series forecasting using textual information | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Silva, Diego Furtado | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/7662777934692986 | por |
dc.description.resumo | A capacidade de extrair conhecimento e prever tendências de ações é crucial para mitigar os riscos e incertezas dos investidores no mercado. A tendência das ações é afetada pela não linearidade, complexidade, ruído e especialmente, eventos do entorno. Fatores externos, como notícias diárias, tornaram-se um dos principais recursos dos investidores para a tomada de decisões sobre a compra ou venda de ativos. Porém, essas notícias acontecem muito rápido, são milhares de notícias geradas por diferentes sítios web, demorando muito para serem analisadas, o que pode custar milhões de dólares em perdas para seus investidores devido a uma decisão tardia. Abordagens recentes baseadas em modelos de linguagem contextuais transformaram a área de processamento de linguagem natural. No entanto, os modelos de classificação que usam notícias que influenciam as ações lidam com textos não rotulados, desbalanceados e dissimilares. Estudos recentes mostram que a previsão de séries temporais melhora substancialmente ao considerar informações externas. Este trabalho propõe uma metodologia híbrida em três fases, uma para a mineração de notícias, um modelo de representação de características compactas e uma para a previsão de séries temporais, que se fundem para uma previsão mais precisa dos preços. Inicialmente é construído um corpus pequeno a partir da serie temporal. Após isso, utiliza-se uma rotulação baseada em aprendizado semissupervisionado para atribuir rótulos às demais notícias. Na segunda fase, é realizado o processo de mineração de textos com um classificador de novas notícias, cuja saída é alinhada as características da serie temporal, para que o modelo de representação compactada extraia novas características num espaço latente. Finalmente, realizamos a predição dos preços futuros com este conhecimento fundido. Em um estudo de caso com a cripto-moeda Bitcoin, a metodologia proposta alcançou uma diminuição de 1.62% no porcentagem de erro médio absoluto. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | por |
dc.description.sponsorshipId | CNPq: 49096/2018-6 | por |
dc.description.sponsorshipId | CAPES: Código de Financiamento 001 | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/1425203651680429 | por |