Comparação entre alguns modelos de regressão de contagem
| dc.contributor.advisor1 | Guzmán, Jorge Luis Bazán | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/8040998023074358 | por |
| dc.contributor.advisor1orcid | https://orcid.org/0000-0003-3918-8795 | por |
| dc.contributor.author | Onuki, Lucas Akio Senaga | |
| dc.contributor.authorlattes | https://lattes.cnpq.br/2849328325192046 | por |
| dc.contributor.authororcid | https://orcid.org/0009-0008-8010-2301 | por |
| dc.date.accessioned | 2024-11-21T16:48:29Z | |
| dc.date.available | 2024-11-21T16:48:29Z | |
| dc.date.issued | 2024-09-27 | |
| dc.description.abstract | Count data reflects the number of occurrences of a behavior of interest in a given period of time (for example, a team’s goals number in Brasileirão). A common behavior of this type of data is the presence of many zeros observed, i.e. zero-inflation, which ends up somewhat overturning the estimates obtained by the Poisson and Negative Binomial Regression models, usually used to model these type of data. With this in mind, this work set out to study the variations of these models, following two fronts: The first considering models that contain a possible excess of zeros and a second, which compares models from recent literature to check whether they are good alternatives in terms estimates and performance. In total, seven models were trained, the two mentioned above, plus: Poisson-Tweedie, Bell, Zero-inflated Poisson, Zero-inflated Negative Binomial and Zero-inflated Bell. Thus, different simulation scenarios were studied by computing metrics such as mean, standard deviation, REQM and model selection criteria, such as AIC and BIC. It is worth noting that both the classical and Bayesian study methods were used for comparative classification of estimates. In addition to the simulation studies, two applications to real data are presented. As a result of the different scenarios, we understand that the models that have an exclusive part to accommodate possible excesses of zeros had greater adherence to the data in applications. Regarding the models presented in recent literature, we can state that there is similarity in the adjustments made, which validates previous studies and guarantees that they are good alternatives to the Poisson and Negative Binomial models. | eng |
| dc.description.resumo | Dados de contagem refletem o número de ocorrências de um comportamento de interesse em um período fixado de tempo (por exemplo, saldo de gols de um time no brasileirão). Um comportamento comum desse tipo de dado é a presença de muitos zeros observados, ie. inflacionamento de zeros, o que acaba viesando de certo modo as estimativas obtidas pelos modelos de Regressão Poisson e Binomial Negativa, usualmente utilizados para a modelagem desse tipo de dado. Com isso em mente, este trabalho propôs-se a estudar as variações desses modelos, seguindo em duas frentes: A primeira considerando modelos que conseguem comportar o possível excesso de zeros e uma segunda, que compara modelos da literatura recente para verificar se são boas alternativas em termos de estimativas e desempenho. No total, foram estudados sete modelos, sendo os dois mencionados acima, acrescidos de: Poisson-Tweedie, Bell, Zero-inflacionado Poisson, Zero-inflacionado Binomial Negativa e Zero-inflacionado Bell. Assim, diferentes cenários de simulação foram estudados computando métricas como média, desvio padrão, REQM e critérios de seleção de modelos, tais como AIC e BIC. Cabe ressaltar que tanto o método de estimação clássico, quanto a bayesiano, foram utilizados a critério comparativo das estimativas. Além dos estudos de simulação apresentamos duas aplicações a dados reais. Como resultado dos diversos cenários, entendemos que os modelos que possuem uma parte exclusiva para a acomodação de possíveis excessos de zeros possuíram maior aderência aos dados nas aplicações. Com relação aos modelos apresentados na literatura recente, podemos afirmar que há similaridade dos ajustes realizados, o que valida estudos anteriores e garante que são boas alternativas aos modelos Poisson e Binomial Negativa. | por |
| dc.description.sponsorship | Não recebi financiamento | por |
| dc.identifier.citation | ONUKI, Lucas Akio Senaga. Comparação entre alguns modelos de regressão de contagem. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21040. | * |
| dc.identifier.uri | https://repositorio.ufscar.br/handle/20.500.14289/21040 | |
| dc.language.iso | por | por |
| dc.publisher | Universidade Federal de São Carlos | por |
| dc.publisher.address | Câmpus São Carlos | por |
| dc.publisher.initials | UFSCar | por |
| dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | por |
| dc.rights | Attribution-NonCommercial-ShareAlike 3.0 Brazil | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/br/ | * |
| dc.subject | Modelos de regressão | por |
| dc.subject | Dados de contagem | por |
| dc.subject | Métodos de estimação | por |
| dc.subject | Desempenho | por |
| dc.subject | Inflacionamento de zeros | por |
| dc.subject | Regression models | eng |
| dc.subject | Counting data | eng |
| dc.subject | Estimation methods | eng |
| dc.subject | Performance | eng |
| dc.subject | Zero-inflation | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA | por |
| dc.title | Comparação entre alguns modelos de regressão de contagem | por |
| dc.title.alternative | Comparison between some count regression models | por |
| dc.type | Dissertação | por |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Lucas_Akio_Senaga_Onuki_final_v_REVISADA.pdf
- Tamanho:
- 1.38 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Artigo principal