dc.contributor.author | Moreira, Diogo Barboza | |
dc.date.accessioned | 2022-10-11T16:57:25Z | |
dc.date.available | 2022-10-11T16:57:25Z | |
dc.date.issued | 2022-09-02 | |
dc.identifier.citation | MOREIRA, Diogo Barboza. A nonparametric bayesian approach for modeling and comparison of functional data. 2022. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16847. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/16847 | |
dc.description.abstract | The current advances of technology provides, among other things, several ways of collecting
data, which enlarges the possibility of studying new phenomena. Researches focused on studying
the functional relation between a variable and some quantity (usually time) produce the called
functional data. The main feature of this kind of data is that they are registered using devices that
can record values almost continuously over time. Suppose two groups of functional data and the
interest is to evaluate the similarity of the groups over some range of time. This work proposes a
method to compare the groups using predictive samples. The method submit data to a smoothing
step using orthonormal functions series and the coefficients of the series are then used to model
functional data, due to the bijective relation between the target functions and their respective
coefficients. The goal is to estimate the multivariate density associated to the coefficients of
each group. Under nonparametric Bayesian context, the densities were estimated using Dirichlet
Process Mixture model. Comparison of the functional data groups were performed using a
dissimilarity index based on some L2-distance and estimated using the predcitive samples of
the fitted DPM model. The index has a great interpretative appeal and constitute an useful tool
for data analysis. Furthermore, it is proposed a bayesian scheme to test the homogeneity of
groups of functional data based on the distance between the distributions of the processes for
each instant of time. A quick simulation study is presented, as well as preliminary analysis in
real functional data set. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | eng | eng |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Functional data | eng |
dc.subject | Density estimation | eng |
dc.subject | Dirichlet process mixtures | eng |
dc.subject | Bayesian inference | eng |
dc.subject | Nonparametric | eng |
dc.subject | Dissimilarity | eng |
dc.subject | Dados funcionais | por |
dc.subject | Estimação de densidades | por |
dc.subject | Mistura de processos de dirichlet | por |
dc.subject | Inferência bayesiana | por |
dc.subject | Não paramétrica | por |
dc.subject | Dissimilaridade | por |
dc.title | A nonparametric bayesian approach for modeling and comparison of functional data | eng |
dc.title.alternative | Uma abordagem bayesiana não paramétrica para modelagem e comparação de dados funcionais | por |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Salasar, Luis Ernesto Bueno | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5464564215528609 | por |
dc.description.resumo | Os recentes avanços na tecnologia fornecem, entre outras aspectos, diversas formas de
coletar dados, o que aumenta possibilidade de estudar novos fenômenos. Pesquisas cujo foco
seja estudar a relação funcional entre uma variável e uma grandeza física (geralmente o tempo)
produzem os chamados dados funcionais. A principal característica desse tipo de dado é que
eles são coletados utilizando dispositivos apropriados para registrar a informação quase que
continuamente ao longo do tempo. Suponha dois grupos de dados funcionais e que o interesse é
avaliar se os grupos são similares ou não em algum intervalo específico de tempo. Este trabalho
apresenta um método para comparação de dois grupos de dados funcionais utilizando amostras
preditivas. O método proposto submete os dados originais a uma etapa de suavização utilizando
aproximação por séries de funções ortonormais e os coeficientes da série são utilizados
para modelagem dos dados funcionais, devido ao fato de existir uma relação bijetora entre as
funções alvo e seus respectivos coeficientes. O objetivo é estimar a densidade multivariada
associada aos coeficientes de cada grupos. No contexto de inferência Bayesiana não paramétrica,
as densidades foram estimadas através do uso de Misturas de Processos de Dirichlet (DPM).
A comparação dos grupos de dados funcionais é então performada através de um índice de
dissimilaridade baseado em uma medida de distância definida no espaço das funções e estimada
através das curvas preditivas amostradas usando o modelo DPM ajustado. O índice possui grande
apelo interpretativo e fornece uma ferramenta útil para análise dos dados. É proposto também
um esquema bayesiano para testar a homogeneidade das distribuições dos grupos baseado na
distância entre as distribuições dos processos para cada instante de tempo. Um rápido estudo de
simulação é apresentado, bem como análises preliminares em dados funcionais reais. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA NAO-PARAMETRICA | por |
dc.description.sponsorshipId | 88882.426987/2019-01 | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/7221959923579554 | por |