Amostragem aleatória e extensões para predição de eventos raros
| dc.contributor.advisor1 | Diniz, Carlos Alberto Ribeiro | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3277371897783194 | |
| dc.contributor.author | Santos, Richard Guilherme dos | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/8150418256303019 | |
| dc.date.accessioned | 2025-03-05T20:28:11Z | |
| dc.date.issued | 2024-12-23 | |
| dc.description.abstract | In classification problems, the prediction of rare events, that is, when the class of interest is underrepresented„ is often a difficult issue to solve. Classical versions of algorithms suffer several problems when being trained when the response variable is unbalanced, and certain metrics, such as accuracy, lose value when comparing different models. In this dissertation, we present different random sampling techniques and their applications in extensions of ensemble techniques that aim to solve this dilemma. Although extensions exist for most methods used in multi-class problems, we focus on their use for dichotomous problems. In addition, we performed simulations on databases seeking to observe advantages and shortcomings of the methods used, with emphasis on a credit concession database, where the imbalance is severe (below 5%) | eng |
| dc.description.resumo | Em problemas de classificação, a predição de eventos raros, isto é, quando a classe de interesse está sub-representada, costuma ser uma questão de difícil resolução. Versões clássicas de algoritmos sofrem diversos problemas ao serem treinados quando a variável resposta é desbalanceada, além de certas métricas, como a acurácia, perderem valor na comparação de diferentes modelos. Nesta dissertação, apresentamos diferentes técnicas de random sampling e suas utilizações em extensões de técnicas ensemble que propõem resolver tal dilema. Embora existam extensões para a maioria dos métodos utilizados em problemas de multiclasse, focamos na sua utilização para problemas dicotômicos. Além disso, realizamos simulações em bases de dados buscando observar vantagens e lacunas dos métodos utilizados, com destaque em uma base de dados de concessão de crédito, onde o desbalanceamento é severo (abaixo de 5%) | |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | |
| dc.identifier.citation | SANTOS, Richard Guilherme dos. Amostragem aleatória e extensões para predição de eventos raros. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21499. | * |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/21499 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Câmpus São Carlos | |
| dc.publisher.initials | UFSCar | |
| dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Classificação | |
| dc.subject | Alto desbalanceamento | |
| dc.subject | Machine learning | eng |
| dc.subject | Random sampling | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS | |
| dc.title | Amostragem aleatória e extensões para predição de eventos raros | |
| dc.title.alternative | Random sampling and extensions for rare event prediction | eng |
| dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Dissertação de Mestrado - PIPGEs.pdf
- Tamanho:
- 993.71 KB
- Formato:
- Adobe Portable Document Format