Comparação de funções de ligação em modelos de regressão para respostas binárias com dados desbalanceados
| dc.contributor.advisor1 | Pereira, Gustavo Henrique Araujo | |
| dc.contributor.advisor1Lattes | https://lattes.cnpq.br/4536501674241631 | |
| dc.contributor.author | Akinaga, Fabianna Akari | |
| dc.date.accessioned | 2026-03-03T18:15:29Z | |
| dc.date.issued | 0025-12-04 | |
| dc.description.abstract | This work aims to compare different link functions applied to Generalized Linear Models (GLMs) for binary response variables, especially in contexts with unbalanced data. Traditional link functions, such as Logit, Probit, and Cloglog, as well as generalized extensions based on Power and Reverse Power functions, were evaluated. The interest in conducting this study arises from the claims in the literature that asymmetric links tend to exhibit superior predictive performance compared to symmetric functions in scenarios with strong imbalance. Accordingly, this work sought to systematically investigate whether such an advantage is indeed observed in practice. To this end, Monte Carlo simulation studies and applications to various real datasets were conducted, allowing observation in practice of how these functions behave under different degrees of imbalance. The analyses allowed us to evaluate, in various contexts, whether the flexibility introduced by the additional parameters of these links results in relevant gains in performance or stability. In general, the results showed that the different link functions, both traditional and generalized, presented very similar Area Under the ROC Curve (AUC) values in both simulations and practical applications, maintaining similar performance patterns even when faced with changes in the degree of imbalance, the distribution of covariates,or the number of predictors. | eng |
| dc.description.resumo | Este trabalho tem como objetivo comparar diferentes funções de ligação aplicadas a Modelos Lineares Generalizados (MLG) para variáveis resposta binárias, especialmente em contextos com dados desbalanceados. Foram avaliadas funções de ligação tradicionais, como Logito, Probito e Cloglog, bem como extensões generalizadas baseadas nas funções Potência e Potência Reversa. O interesse em conduzir este estudo surge das afirmações presentes na literatura de que ligações assimétricas tendem a apresentar desempenho preditivo superior ao de funções simétricas em cenários com forte desbalanceamento. Assim, buscou-se investigar, de forma sistemática, se essa vantagem realmente se confirma na prática. Para isso, foram conduzidos estudos de simulação de Monte Carlo e aplicações em vários conjuntos de dados reais, permitindo observar na prática como essas funções se comportam sob diferentes graus de desbalanceamento. As análises permitiram avaliar, em diversos contextos, se a flexibilidade introduzida pelos parâmetros adicionais dessas ligações resulta em ganhos relevantes de desempenho ou estabilidade. De maneira geral, os resultados mostraram que as diferentes funções de ligação, tradicionais e generalizadas, apresentaram valores da Área sob a Curva ROC (AUC) muito próximos tanto nas simulações quanto nas aplicações práticas, mantendo padrões semelhantes de desempenho mesmo diante de mudanças no grau de desbalanceamento, na distribuição das covariáveis ou no número de preditores. | |
| dc.identifier.citation | AKINAGA, Fabianna Akari. Comparação de funções de ligação em modelos de regressão para respostas binárias com dados desbalanceados. 0025. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de São Carlos, São Carlos, 0025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23712. | por |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/23712 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Câmpus São Carlos | |
| dc.publisher.course | Estatística - Es | |
| dc.publisher.initials | UFSCar | |
| dc.rights | Attribution 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | |
| dc.subject | Área sob a curva ROC | |
| dc.subject | Classificação binária | |
| dc.subject | Dados desbalanceados | |
| dc.subject | Funções de ligação | |
| dc.subject | Simulação | |
| dc.subject | Modelos lineares generalizados | |
| dc.subject | Area under the ROC curve | eng |
| dc.subject | Binary classification | eng |
| dc.subject | Unbalanced data | eng |
| dc.subject | Link functions | eng |
| dc.subject | Simulation | eng |
| dc.subject | Generalized linear models | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA | |
| dc.subject.ods | 4. Educação de Qualidade | |
| dc.title | Comparação de funções de ligação em modelos de regressão para respostas binárias com dados desbalanceados | |
| dc.title.alternative | Comparison of link functions in regression models for binary responses with imbalanced data | eng |
| dc.type | TCC |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Dissertação_TCC_Fabianna_vf.pdf
- Tamanho:
- 399.73 KB
- Formato:
- Adobe Portable Document Format