Amostragem aleatória e extensões para predição de eventos raros

dc.contributor.advisor1Diniz, Carlos Alberto Ribeiro
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3277371897783194
dc.contributor.authorSantos, Richard Guilherme dos
dc.contributor.authorlatteshttp://lattes.cnpq.br/8150418256303019
dc.date.accessioned2025-03-05T20:28:11Z
dc.date.issued2024-12-23
dc.description.abstractIn classification problems, the prediction of rare events, that is, when the class of interest is underrepresented„ is often a difficult issue to solve. Classical versions of algorithms suffer several problems when being trained when the response variable is unbalanced, and certain metrics, such as accuracy, lose value when comparing different models. In this dissertation, we present different random sampling techniques and their applications in extensions of ensemble techniques that aim to solve this dilemma. Although extensions exist for most methods used in multi-class problems, we focus on their use for dichotomous problems. In addition, we performed simulations on databases seeking to observe advantages and shortcomings of the methods used, with emphasis on a credit concession database, where the imbalance is severe (below 5%)eng
dc.description.resumoEm problemas de classificação, a predição de eventos raros, isto é, quando a classe de interesse está sub-representada, costuma ser uma questão de difícil resolução. Versões clássicas de algoritmos sofrem diversos problemas ao serem treinados quando a variável resposta é desbalanceada, além de certas métricas, como a acurácia, perderem valor na comparação de diferentes modelos. Nesta dissertação, apresentamos diferentes técnicas de random sampling e suas utilizações em extensões de técnicas ensemble que propõem resolver tal dilema. Embora existam extensões para a maioria dos métodos utilizados em problemas de multiclasse, focamos na sua utilização para problemas dicotômicos. Além disso, realizamos simulações em bases de dados buscando observar vantagens e lacunas dos métodos utilizados, com destaque em uma base de dados de concessão de crédito, onde o desbalanceamento é severo (abaixo de 5%)
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.identifier.citationSANTOS, Richard Guilherme dos. Amostragem aleatória e extensões para predição de eventos raros. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21499.*
dc.identifier.urihttps://hdl.handle.net/20.500.14289/21499
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectClassificação
dc.subjectAlto desbalanceamento
dc.subjectMachine learningeng
dc.subjectRandom samplingeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
dc.titleAmostragem aleatória e extensões para predição de eventos raros
dc.title.alternativeRandom sampling and extensions for rare event predictioneng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação de Mestrado - PIPGEs.pdf
Tamanho:
993.71 KB
Formato:
Adobe Portable Document Format