Modelos de regressão binária espacial bayesiana para dados desbalanceados

dc.contributor.advisor1Ehlers, Ricardo Sandes
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4020997206928882
dc.contributor.authorAssunção, Alan da Silva
dc.contributor.authorlatteshttp://lattes.cnpq.br/5778341551382016
dc.contributor.refereeEhlers , Ricardo Sandes
dc.contributor.refereePrates, Marcos Oliveira
dc.contributor.refereePaez, Marina Silva
dc.contributor.refereePereira, João Batista de Morais
dc.contributor.refereeBastos, Leonardo Soares
dc.contributor.refereeLatteshttp://lattes.cnpq.br/4020997206928882
dc.contributor.refereeLatteshttp://lattes.cnpq.br/7893235207392165
dc.contributor.refereeLatteshttp://lattes.cnpq.br/2476843545735678
dc.contributor.refereeLatteshttp://lattes.cnpq.br/5251604111283337
dc.contributor.refereeLatteshttp://lattes.cnpq.br/5241799121437269
dc.date.accessioned2025-09-17T12:26:54Z
dc.date.issued2025-08-28
dc.description.abstractBinary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model.eng
dc.description.resumoModelos de regressão binária são excelentes propostas de modelagem para dados dicotômicos, que nos permitem relacionar a probabilidade do evento de interesse com as covariáveis disponíveis. Nesse tipo de cenário, é comum a ocorrência de desbalanceamento dos dados, isto é, uma proporção de zeros (ou uns) significativamente diferente de uns ( ou zeros), fazendo com que funções de ligações simétricas não sejam boas alternativas no momento de ajustar o modelo. Neste trabalho, propomos uma classe de modelos de regressão binária ajustada com funções de ligação assimétricas, a saber: as funções de ligação potência e reversa de potência. Além disso, incrementamos efeitos aleatórios espaciais em nossa regressão, assumindo assim, que os dados binários podem ser referenciados no espaço. A regressão binária resultante torna-se um tipo especial de modelo hierárquico bayesiano cuja estrutura espacial modelamos por meio de uma distribuição a priori mais flexível que o modelo CAR (Conditional autoregressive) padrão: a distribuição a priori G-Wishart. Através de um conjunto de dados motivacionais, apresentamos uma extensão do modelo de regressão binária espacial proposto. Para ambos os modelos, fornecemos estudos de simulação e aplicação em dados reais, além de análise bayesiana de detecção de pontos influentes. A estimação dos parâmetros é feita de forma completamente bayesiana, no qual buscamos a maximização da eficiência computacional no processo de estimação. O desempenho dos modelos aqui propostos será avaliado e comparados através de métricas de diagnóstico bayesiana e qualidade preditiva. O desempenho do nosso algoritmo será avaliado através de simulações computacionais, como também, em conjunto de dados reais. Para concluir esta tese, apresentamos de forma preliminar e motivacional um estudo de simulação com o modelo espacial DAGAR.por
dc.identifier.citationASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777.*
dc.identifier.urihttps://hdl.handle.net/20.500.14289/22777
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectRegressão bináriapor
dc.subjectEspacialpor
dc.subjectLigação assimétricapor
dc.subjectMCMCpor
dc.subjectMonte Carlo Hamiltonianopor
dc.subjectBinary regressioneng
dc.subjectSpatialeng
dc.subjectAsymmetric linkeng
dc.subjectMCMCeng
dc.subjectHamiltonian Monte Carloeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
dc.titleModelos de regressão binária espacial bayesiana para dados desbalanceadospor
dc.title.alternativeBayesian spatial binary regression models for imbalanced dataeng
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese_alan_versao_revisada.pdf
Tamanho:
8.37 MB
Formato:
Adobe Portable Document Format