Comparação entre alguns modelos de regressão de contagem

dc.contributor.advisor1Guzmán, Jorge Luis Bazán
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8040998023074358por
dc.contributor.advisor1orcidhttps://orcid.org/0000-0003-3918-8795por
dc.contributor.authorOnuki, Lucas Akio Senaga
dc.contributor.authorlatteshttps://lattes.cnpq.br/2849328325192046por
dc.contributor.authororcidhttps://orcid.org/0009-0008-8010-2301por
dc.date.accessioned2024-11-21T16:48:29Z
dc.date.available2024-11-21T16:48:29Z
dc.date.issued2024-09-27
dc.description.abstractCount data reflects the number of occurrences of a behavior of interest in a given period of time (for example, a team’s goals number in Brasileirão). A common behavior of this type of data is the presence of many zeros observed, i.e. zero-inflation, which ends up somewhat overturning the estimates obtained by the Poisson and Negative Binomial Regression models, usually used to model these type of data. With this in mind, this work set out to study the variations of these models, following two fronts: The first considering models that contain a possible excess of zeros and a second, which compares models from recent literature to check whether they are good alternatives in terms estimates and performance. In total, seven models were trained, the two mentioned above, plus: Poisson-Tweedie, Bell, Zero-inflated Poisson, Zero-inflated Negative Binomial and Zero-inflated Bell. Thus, different simulation scenarios were studied by computing metrics such as mean, standard deviation, REQM and model selection criteria, such as AIC and BIC. It is worth noting that both the classical and Bayesian study methods were used for comparative classification of estimates. In addition to the simulation studies, two applications to real data are presented. As a result of the different scenarios, we understand that the models that have an exclusive part to accommodate possible excesses of zeros had greater adherence to the data in applications. Regarding the models presented in recent literature, we can state that there is similarity in the adjustments made, which validates previous studies and guarantees that they are good alternatives to the Poisson and Negative Binomial models.eng
dc.description.resumoDados de contagem refletem o número de ocorrências de um comportamento de interesse em um período fixado de tempo (por exemplo, saldo de gols de um time no brasileirão). Um comportamento comum desse tipo de dado é a presença de muitos zeros observados, ie. inflacionamento de zeros, o que acaba viesando de certo modo as estimativas obtidas pelos modelos de Regressão Poisson e Binomial Negativa, usualmente utilizados para a modelagem desse tipo de dado. Com isso em mente, este trabalho propôs-se a estudar as variações desses modelos, seguindo em duas frentes: A primeira considerando modelos que conseguem comportar o possível excesso de zeros e uma segunda, que compara modelos da literatura recente para verificar se são boas alternativas em termos de estimativas e desempenho. No total, foram estudados sete modelos, sendo os dois mencionados acima, acrescidos de: Poisson-Tweedie, Bell, Zero-inflacionado Poisson, Zero-inflacionado Binomial Negativa e Zero-inflacionado Bell. Assim, diferentes cenários de simulação foram estudados computando métricas como média, desvio padrão, REQM e critérios de seleção de modelos, tais como AIC e BIC. Cabe ressaltar que tanto o método de estimação clássico, quanto a bayesiano, foram utilizados a critério comparativo das estimativas. Além dos estudos de simulação apresentamos duas aplicações a dados reais. Como resultado dos diversos cenários, entendemos que os modelos que possuem uma parte exclusiva para a acomodação de possíveis excessos de zeros possuíram maior aderência aos dados nas aplicações. Com relação aos modelos apresentados na literatura recente, podemos afirmar que há similaridade dos ajustes realizados, o que valida estudos anteriores e garante que são boas alternativas aos modelos Poisson e Binomial Negativa.por
dc.description.sponsorshipNão recebi financiamentopor
dc.identifier.citationONUKI, Lucas Akio Senaga. Comparação entre alguns modelos de regressão de contagem. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21040.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/20.500.14289/21040
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.publisher.addressCâmpus São Carlospor
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEspor
dc.rightsAttribution-NonCommercial-ShareAlike 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/br/*
dc.subjectModelos de regressãopor
dc.subjectDados de contagempor
dc.subjectMétodos de estimaçãopor
dc.subjectDesempenhopor
dc.subjectInflacionamento de zerospor
dc.subjectRegression modelseng
dc.subjectCounting dataeng
dc.subjectEstimation methodseng
dc.subjectPerformanceeng
dc.subjectZero-inflationeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICApor
dc.titleComparação entre alguns modelos de regressão de contagempor
dc.title.alternativeComparison between some count regression modelspor
dc.typeDissertaçãopor

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Lucas_Akio_Senaga_Onuki_final_v_REVISADA.pdf
Tamanho:
1.38 MB
Formato:
Adobe Portable Document Format
Descrição:
Artigo principal