dc.contributor.author | Bogoni, Mariella Ananias | |
dc.date.accessioned | 2022-02-23T18:24:34Z | |
dc.date.available | 2022-02-23T18:24:34Z | |
dc.date.issued | 2022-02-15 | |
dc.identifier.citation | BOGONI, Mariella Ananias. Bayesian variable selection for logistic mixture models with Pólya-Gamma data augmentation. 2022. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15643. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/15643 | |
dc.description.abstract | In this work, Bayesian methods for estimating and selecting variables in a mixture of logistic regressions model are presented.
In order to simplify its Bayesian estimation, we extend the data augmentation approach with Pólya-Gamma random variables to the mixture of logistic regression models.
Through the data augmentation approach, we present a Gibbs sampling algorithm for estimating the full model, and the number of components in the mixture is identified by Bayesian model selection criteria. In the model with variable selection, we investigate the performance of two prior distributions for the regression coefficients, adding a second set of latent variables to indicate the presence and non-presence of the predictor variables at each component of the mixture. Analogously to the full model, a Gibbs sampling algorithm is applied to the model with variable selection and the conjugation obtained for the distribution of the regression coefficients, through the inclusion of Pólya-Gamma variables, allows us to analytically calculate the marginal likelihood and gain computational efficiency in the variable selection process. To analyse the performance, the presented methodologies are applied in simulated and real data. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | eng | eng |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Variable selection | eng |
dc.subject | G-prior | eng |
dc.subject | Spike and slab prior | eng |
dc.subject | Pólya-Gamma-sampling | eng |
dc.subject | Seleção de variáveis | por |
dc.subject | G-priori | por |
dc.subject | Priori spike e slab | por |
dc.title | Bayesian variable selection for logistic mixture models with Pólya-Gamma data augmentation | eng |
dc.title.alternative | Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma | por |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Zuanetti, Daiane Aparecida | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/8352484284929824 | por |
dc.description.resumo | Neste trabalho, métodos Bayesianos para estimação e seleção de variáveis em um modelo de mistura de regressão logística são apresentados.
Com o objetivo de simplificar a inferência Bayesiana e ganhar eficiência computacional, a abordagem de aumento de dados com variáveis latentes Pólya-Gama é estendida para modelos de mistura de regressão logística. Através dela, o algoritmo amostrador de Gibbs é aplicado para a estimação do modelo completo, com a estimação do número de componentes da mistura sendo feita através de critérios Bayesianos de seleção de modelos.
Para a seleção de variáveis, duas distribuições a priori para os coeficientes de regressão são investigadas, adicionando um segundo conjunto de variáveis latentes para indicar a presença e ausência das variáveis preditoras em cada componente da mistura. De modo análogo ao modelo completo, o algoritmo amostrador de Gibbs é aplicado no modelo com a seleção de variáveis e a conjugação obtida para a distribuição dos coeficientes de regressão, com a inclusão das variáveis Pólya-Gama, nos permite calcular analiticamente a verossimilhança marginal e ganhar eficiência computacional no processo de seleção de variáveis. Para analisar a performance dos métodos, as metodologias apresentadas são aplicadas em dados simulados e reais. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA | por |
dc.description.sponsorshipId | CAPES: Código de Financiamento 001 | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/1099499926393005 | por |