Predição conforme para dados composicionais

dc.contributor.advisor1Pereira , Gustavo Henrique de Araújo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4536501674241631
dc.contributor.authorAmaral, Lucas Pereira do
dc.contributor.authorlatteshttp://lattes.cnpq.br/5766650248246940
dc.contributor.refereeCarvalho, Helton Graziadei de
dc.contributor.refereeMagalhães, Tiago Maia
dc.contributor.refereeLatteshttp://lattes.cnpq.br/8787163012039005
dc.contributor.refereeLatteshttp://lattes.cnpq.br/7953363504273397
dc.date.accessioned2026-04-08T22:10:37Z
dc.date.issued2026-02-24
dc.description.abstractDirichlet regression models are suitable for compositional data, in which the response variable represents proportions that sum to one. However, there are still no well-established methods for constructing valid prediction sets in this context, especially considering the geometry of the compositional space. In this work, we investigate conformal prediction-based strategies for constructing valid predictive regions in Dirichlet regression models. We evaluate three distinct approaches: a method based on quantile residuals, an approximate construction of highest density regions (HDR), and an adaptation of the approximate HDR using grid-based discretization over the simplex. The performance of the methods was analyzed through simulation studies under different scenarios, varying the model complexity, response dimensionality, and covariate structure. The results indicated that the HDR approximation approach exhibits good robustness in terms of coverage, while the grid discretization proved effective in reducing overcoverage and the area of the prediction region compared to the original method. The quantile method provided larger prediction regions compared to the grid method, while maintaining adequate coverage. The methodologies were also applied to two real datasets: one concerning sleep stages and another on biomass allocation in plants. In both cases, the proposed methods demonstrated practical feasibility and produced coherent interpretations within the compositional space. Finally, we discuss possible extensions of this work.eng
dc.description.resumoModelos de regressão Dirichlet são apropriados para dados composicionais, nos quais a variável resposta representa proporções que somam um. No entanto, ainda não existem métodos consolidados para a construção de conjuntos de predição válidos nesse contexto, especialmente levando em conta a geometria do espaço composicional. Neste trabalho, investigamos estratégias baseadas em predição conforme para a construção de regiões preditivas válidas em modelos de regressão Dirichlet. Avaliamos três abordagens distintas: um método baseado em resíduos quantílicos, uma construção aproximada de regiões de maior densidade (HDR) e uma adaptação da HDR aproximada via discretização por \textit{grid} no simplex. A performance dos métodos foi analisada por meio de estudos de simulação em diferentes cenários, variando a complexidade do modelo, a dimensionalidade da resposta e a estrutura das covariáveis. Os resultados indicaram que a abordagem de aproximação da HDR apresenta boa robustez em termos de cobertura, enquanto a discretização por \textit{grid} se mostrou eficaz para reduzir a sobrecobertura e a área da região de predição em relação ao método original. O método quantílico proporcionou regiões de previsão maiores em comparação com o método via \textit{grid}, mantendo, ao mesmo tempo, uma cobertura adequada. As metodologias também foram aplicadas a dois conjuntos de dados reais: um sobre estágios do sono e outro sobre alocação de biomassa em plantas. Em ambos os casos, os métodos propostos demonstraram viabilidade prática e produziram interpretações coerentes dentro do espaço composicional. Por fim, discutimos possíveis extensões desse trabalho.
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.identifier.citationAMARAL, Lucas Pereira do. Predição conforme para dados composicionais. 2026. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2026. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23905.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/23905
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.rightsAttribution 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.subjectDados composicionais
dc.subjectPredição conforme
dc.subjectRegressão Dirichlet
dc.subjectRegressão multivariada
dc.subjectCompositional dataeng
dc.subjectConformal predictioneng
dc.subjectDirichlet regressioneng
dc.subjectMultivariate regressioneng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.ods9. Indústria, Inovação e Infraestrutura
dc.titlePredição conforme para dados composicionais
dc.title.alternativeConformal prediction for compositional dataeng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
dissertacao_lucas_2026.pdf
Tamanho:
1.48 MB
Formato:
Adobe Portable Document Format