Comparação de funções de ligação em modelos de regressão para respostas binárias com dados desbalanceados

dc.contributor.advisor1Pereira, Gustavo Henrique Araujo
dc.contributor.advisor1Latteshttps://lattes.cnpq.br/4536501674241631
dc.contributor.authorAkinaga, Fabianna Akari
dc.date.accessioned2026-03-03T18:15:29Z
dc.date.issued0025-12-04
dc.description.abstractThis work aims to compare different link functions applied to Generalized Linear Models (GLMs) for binary response variables, especially in contexts with unbalanced data. Traditional link functions, such as Logit, Probit, and Cloglog, as well as generalized extensions based on Power and Reverse Power functions, were evaluated. The interest in conducting this study arises from the claims in the literature that asymmetric links tend to exhibit superior predictive performance compared to symmetric functions in scenarios with strong imbalance. Accordingly, this work sought to systematically investigate whether such an advantage is indeed observed in practice. To this end, Monte Carlo simulation studies and applications to various real datasets were conducted, allowing observation in practice of how these functions behave under different degrees of imbalance. The analyses allowed us to evaluate, in various contexts, whether the flexibility introduced by the additional parameters of these links results in relevant gains in performance or stability. In general, the results showed that the different link functions, both traditional and generalized, presented very similar Area Under the ROC Curve (AUC) values in both simulations and practical applications, maintaining similar performance patterns even when faced with changes in the degree of imbalance, the distribution of covariates,or the number of predictors.eng
dc.description.resumoEste trabalho tem como objetivo comparar diferentes funções de ligação aplicadas a Modelos Lineares Generalizados (MLG) para variáveis resposta binárias, especialmente em contextos com dados desbalanceados. Foram avaliadas funções de ligação tradicionais, como Logito, Probito e Cloglog, bem como extensões generalizadas baseadas nas funções Potência e Potência Reversa. O interesse em conduzir este estudo surge das afirmações presentes na literatura de que ligações assimétricas tendem a apresentar desempenho preditivo superior ao de funções simétricas em cenários com forte desbalanceamento. Assim, buscou-se investigar, de forma sistemática, se essa vantagem realmente se confirma na prática. Para isso, foram conduzidos estudos de simulação de Monte Carlo e aplicações em vários conjuntos de dados reais, permitindo observar na prática como essas funções se comportam sob diferentes graus de desbalanceamento. As análises permitiram avaliar, em diversos contextos, se a flexibilidade introduzida pelos parâmetros adicionais dessas ligações resulta em ganhos relevantes de desempenho ou estabilidade. De maneira geral, os resultados mostraram que as diferentes funções de ligação, tradicionais e generalizadas, apresentaram valores da Área sob a Curva ROC (AUC) muito próximos tanto nas simulações quanto nas aplicações práticas, mantendo padrões semelhantes de desempenho mesmo diante de mudanças no grau de desbalanceamento, na distribuição das covariáveis ou no número de preditores.
dc.identifier.citationAKINAGA, Fabianna Akari. Comparação de funções de ligação em modelos de regressão para respostas binárias com dados desbalanceados. 0025. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de São Carlos, São Carlos, 0025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23712.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/23712
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.courseEstatística - Es
dc.publisher.initialsUFSCar
dc.rightsAttribution 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.subjectÁrea sob a curva ROC
dc.subjectClassificação binária
dc.subjectDados desbalanceados
dc.subjectFunções de ligação
dc.subjectSimulação
dc.subjectModelos lineares generalizados
dc.subjectArea under the ROC curveeng
dc.subjectBinary classificationeng
dc.subjectUnbalanced dataeng
dc.subjectLink functionseng
dc.subjectSimulationeng
dc.subjectGeneralized linear modelseng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
dc.subject.ods4. Educação de Qualidade
dc.titleComparação de funções de ligação em modelos de regressão para respostas binárias com dados desbalanceados
dc.title.alternativeComparison of link functions in regression models for binary responses with imbalanced dataeng
dc.typeTCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação_TCC_Fabianna_vf.pdf
Tamanho:
399.73 KB
Formato:
Adobe Portable Document Format

Coleções