Algoritmos para seleção de variáveis em modelos Markovianos ocultos não-homogêneos

dc.contributor.advisor1Zuanetti, Daiane
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8352484284929824por
dc.contributor.advisor1orcidhttps://orcid.org/0000-0003-1591-959Xpor
dc.contributor.authorSabillón Lee, Gustavo Alexis
dc.contributor.authorlatteshttps://lattes.cnpq.br/4713725426670655por
dc.contributor.authororcidhttps://orcid.org/0000-0002-4802-2343por
dc.date.accessioned2025-01-06T12:32:10Z
dc.date.available2025-01-06T12:32:10Z
dc.date.issued2024-10-29
dc.description.abstractNon-homogeneous hidden Markov models are a statistical paradigm in which a sequence of non-observable states generates a sequence of observable. Transitions between the non-observable states are controlled by transition coefficients and covariates. Because variable selection has been hardly explored for this model, the central purpose of this thesis is to propose variable selection methods which improve predictive performance of the model. We propose two versions of the LASSO for the non-homogeneous hidden Markov model, the Global LASSO and Individual LASSO. The proposed methods are tested in a simulation study, to analyze their performance under controlled conditions. Evaluation metrics used are the mean squared prediction error, non-observable sequence prediction accuracy and coefficient shrinkage efficiency. Regarding the mean squared prediction error, the proposals consistently show better predictive performance than ARIMA and Penalized Linear Regression. They show very good performance when predicting the non-observable state sequence which generates the observable values. In terms of coefficient shrinkage efficiency, the proposals show excellent performance in all simulation scenarios when selecting variables via coefficient shrinkage. This gain in predictive performance as well as the ability to perform variable selection makes the proposed methods an interesting option to apply with the model. Finally, the methods are applied to characterize and predict the rainfall regime in the city of São Carlos, Brazil, displaying good performance when predicting rainfall quantities in the region as well as selecting relevant covariates for the model.eng
dc.description.resumoModelos Markovianos ocultos não-homogêneos são um paradigma estatístico no qual uma sequência de estados não observáveis gera uma sequência de valores observáveis. Transições entre os estados não observáveis são controladas por coeficientes de transição e covariáveis. Contudo, estudos referentes a seleção de variáveis para este modelo têm sido pouco explorados. Devido a isto, o objetivo central desta tese é propor métodos de seleção de variáveis que melhorem o desempenho preditivo do modelo. Propomos duas versões do LASSO para o modelo Markoviano oculto não-homogêneo, o LASSO Global e LASSO Individual. Os métodos propostos são testados em um estudo de simulação para analisar seu desempenho sob condições controladas. As métricas de avaliação utilizadas são o erro quadrático médio preditivo, a precisão na predição da sequência não-observável e a eficiência do encolhimento dos coeficientes. Com relação ao erro quadrático médio preditivo, as propostas consistentemente mostram um desempenho preditivo melhor do que o ARIMA e a Regressão Linear Penalizada. Elas apresentam um desempenho muito bom na previsão da sequência de estados não observáveis que gera os valores observáveis. Em termos de eficiência do encolhimento dos coeficientes, as propostas mostram um desempenho excelente em todos os cenários de simulação, ao selecionar variáveis por meio do encolhimento dos coeficientes. Esse ganho no desempenho preditivo, bem como a capacidade de realizar a seleção de variáveis, torna os métodos propostos uma opção interessante para aplicação com o modelo. Finalmente, os métodos são aplicados para caracterizar e prever o regime de chuvas na cidade de São Carlos, Brasil, exibindo um bom desempenho na previsão das quantidades de chuva na região, bem como na seleção de covariáveis relevantes para o modelo.por
dc.description.sponsorshipNão recebi financiamentopor
dc.identifier.citationSABILLÓN LEE, Gustavo Alexis. Algoritmos para seleção de variáveis em modelos Markovianos ocultos não-homogêneos. 2024. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21170.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/20.500.14289/21170
dc.language.isoengpor
dc.publisherUniversidade Federal de São Carlospor
dc.publisher.addressCâmpus São Carlospor
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEspor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectSeleção de variáveispor
dc.subjectLASSOpor
dc.subjectEM estocásticeng
dc.subjectModelo markoviano ocultopor
dc.subjectPrevisão de séries temporaispor
dc.subjectVariable selectioneng
dc.subjectStochastic-EMeng
dc.subjectHidden Markov modelseng
dc.subjectTime-series forecasting.eng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICApor
dc.titleAlgoritmos para seleção de variáveis em modelos Markovianos ocultos não-homogêneospor
dc.title.alternativeVariable selection algorithms for non-homogeneous hidden Markov modelseng
dc.typeTesepor

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese - Gustavo Sabillon.pdf
Tamanho:
1.9 MB
Formato:
Adobe Portable Document Format
Descrição:
Tese de doutorado do aluno Gustavo Sabillón