Modelos de regressão binária espacial bayesiana para dados desbalanceados
| dc.contributor.advisor1 | Ehlers, Ricardo Sandes | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/4020997206928882 | |
| dc.contributor.author | Assunção, Alan da Silva | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/5778341551382016 | |
| dc.contributor.referee | Ehlers , Ricardo Sandes | |
| dc.contributor.referee | Prates, Marcos Oliveira | |
| dc.contributor.referee | Paez, Marina Silva | |
| dc.contributor.referee | Pereira, João Batista de Morais | |
| dc.contributor.referee | Bastos, Leonardo Soares | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/4020997206928882 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/7893235207392165 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/2476843545735678 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/5251604111283337 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/5241799121437269 | |
| dc.date.accessioned | 2025-09-17T12:26:54Z | |
| dc.date.issued | 2025-08-28 | |
| dc.description.abstract | Binary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model. | eng |
| dc.description.resumo | Modelos de regressão binária são excelentes propostas de modelagem para dados dicotômicos, que nos permitem relacionar a probabilidade do evento de interesse com as covariáveis disponíveis. Nesse tipo de cenário, é comum a ocorrência de desbalanceamento dos dados, isto é, uma proporção de zeros (ou uns) significativamente diferente de uns ( ou zeros), fazendo com que funções de ligações simétricas não sejam boas alternativas no momento de ajustar o modelo. Neste trabalho, propomos uma classe de modelos de regressão binária ajustada com funções de ligação assimétricas, a saber: as funções de ligação potência e reversa de potência. Além disso, incrementamos efeitos aleatórios espaciais em nossa regressão, assumindo assim, que os dados binários podem ser referenciados no espaço. A regressão binária resultante torna-se um tipo especial de modelo hierárquico bayesiano cuja estrutura espacial modelamos por meio de uma distribuição a priori mais flexível que o modelo CAR (Conditional autoregressive) padrão: a distribuição a priori G-Wishart. Através de um conjunto de dados motivacionais, apresentamos uma extensão do modelo de regressão binária espacial proposto. Para ambos os modelos, fornecemos estudos de simulação e aplicação em dados reais, além de análise bayesiana de detecção de pontos influentes. A estimação dos parâmetros é feita de forma completamente bayesiana, no qual buscamos a maximização da eficiência computacional no processo de estimação. O desempenho dos modelos aqui propostos será avaliado e comparados através de métricas de diagnóstico bayesiana e qualidade preditiva. O desempenho do nosso algoritmo será avaliado através de simulações computacionais, como também, em conjunto de dados reais. Para concluir esta tese, apresentamos de forma preliminar e motivacional um estudo de simulação com o modelo espacial DAGAR. | por |
| dc.identifier.citation | ASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777. | * |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/22777 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Câmpus São Carlos | |
| dc.publisher.initials | UFSCar | |
| dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Regressão binária | por |
| dc.subject | Espacial | por |
| dc.subject | Ligação assimétrica | por |
| dc.subject | MCMC | por |
| dc.subject | Monte Carlo Hamiltoniano | por |
| dc.subject | Binary regression | eng |
| dc.subject | Spatial | eng |
| dc.subject | Asymmetric link | eng |
| dc.subject | MCMC | eng |
| dc.subject | Hamiltonian Monte Carlo | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS | |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO | |
| dc.title | Modelos de regressão binária espacial bayesiana para dados desbalanceados | por |
| dc.title.alternative | Bayesian spatial binary regression models for imbalanced data | eng |
| dc.type | Tese |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- tese_alan_versao_revisada.pdf
- Tamanho:
- 8.37 MB
- Formato:
- Adobe Portable Document Format