Show simple item record

dc.contributor.authorBrandini, Bruno Matheus
dc.date.accessioned2023-04-20T18:50:05Z
dc.date.available2023-04-20T18:50:05Z
dc.date.issued2023-03-22
dc.identifier.citationBRANDINI, Bruno Matheus. Máquinas de vetores suporte com aplicação em classificação de crédito. 2023. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17841.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/17841
dc.description.abstractThe credit granting represents one of the products with the highest profitability within a financial institution. However, to ensure profit, institutions must know to whom they lend their capital. In this scenario, a fundamental tool to assist in decision-making regarding the granting of funds is the credit risk which purpose is to predict the creditworthiness of a borrower, classifying the customer as non-defaulting or a defaulting customer. Therefore, this tool must reproduce results close to reality with a low margin of error to avoid financial losses for the credit-granting institution. Nonetheless, in the context of credit analysis, the databases used in the credit risk contain more observations referring to non-defaulting customers (majority class) than defaulting customers (minority class) turning them imbalanced and prone to lead to bias in credit risk. Alternatives to overcome such bias in the classification and adequately deal with the problem of class imbalance is to apply a pre-processing in the data set to balance the classes or modify the classification algorithm. Therefore, in the credit risk context, this work proposes to apply the support vector machine classifier in the discrimination of customers requesting a loan, comparing the performance of this technique both in balanced and imbalanced data sets. In the former will be used the oversampling SMOTE method and in the later the cost-sensitive support vector machine methodology since it is proposed to deal with imbalaced classes. Furthermore, this work compare the performance of the support vector machine classifier with other classifiers commonly used in the credit scenario, such as logistic regression and random forest. The study will be applied to real data and evaluated regards to some metrics that measure the prediction performance.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectClassificaçãopor
dc.subjectCréditopor
dc.subjectDados desbalanceadospor
dc.subjectMáquinas de vetores suportepor
dc.subjectSMOTEpor
dc.titleMáquinas de vetores suporte com aplicação em classificação de créditopor
dc.title.alternativeSupport vector machine applied to credit riskeng
dc.typeTCCpor
dc.contributor.advisor1Ferreira, Ricardo Felipe
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2355076087945221por
dc.contributor.advisor-co1Zuanetti, Daiane Aparecida
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/8352484284929824por
dc.description.resumoA concessão de crédito representa um dos produtos com maior rentabilidade dentro de uma instituição financeira. Entretanto, para garantir lucro é primordial que as instituições saibam a quem estão concedendo seu capital. Nesse cenário, uma ferramenta fundamental para auxiliar na tomada de decisão da concessão de recursos é a classificação de crédito, que tem a finalidade de predizer a qual classe um cliente pertence, se ele tem um comportamento inadimplente ou adimplente. Logo, é de suma importância que essa ferramenta reproduza resultados próximos da realidade, com baixa margem de erro para assim evitar prejuízos financeiros para a empresa concedente do crédito. Entretanto, na conjuntura de análise de crédito, os bancos de dados são, em sua maioria, desbalanceados, uma vez que contém mais observações referentes a clientes adimplentes (classe majoritária) do que clientes inadimplentes (classe minoritária), o que pode acarretar em um viés de classificação. Como uma alternativa para superar tal viés na classificação, podemos aplicar um pré-processamento no conjunto de dados, visando equilibrar as classes, ou realizar modificações no algoritmo de classificação, para que este possa lidar adequadamente com o problema de desequilíbrio entre as classes. Portanto, este trabalho tem como proposta aplicar o classificador de máquina de vetores suporte, no contexto de classificação de crédito, para discriminação de clientes solicitantes de crédito, comparando o desempenho da técnica tanto em conjuntos de dados balanceados, a partir do método de sobreamostragem SMOTE, como também em dados desbalanceados, ao qual também aplicaremos a metodologia de máquina de vetores suporte sensível ao custo, uma técnica proposta para lidar com o desequilíbrio de classes. Além disso, comparamos o desempenho do classificador de máquina de vetores suporte com outros classificadores habitualmente utilizados no cenário de crédito, como a regressão logística e florestas aleatórias. Para esse fim, o estudo será aplicado em conjuntos de dados reais, e avaliado em termos de algumas métricas que mensuram o desempenho de predição.por
dc.publisher.initialsUFSCarpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADASpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/4369699641421718por
dc.publisher.courseEstatística - Espor


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil