Show simple item record

dc.contributor.authorSilva, Luan Vinicius Moraes da
dc.date.accessioned2023-06-13T12:11:40Z
dc.date.available2023-06-13T12:11:40Z
dc.date.issued2023-04-06
dc.identifier.citationSILVA, Luan Vinicius Moraes da. Investigação de métodos de seleção de atributos para problemas de classificação hierárquica multirrótulo. 2023. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18137.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/18137
dc.description.abstractClassification is the task of assigning data instances to classes. In Hierarchical Multi- label Classification, instances may belong to two or more classes (labels) simultaneously, where the classes are hierarchically structured. Feature Selection is part of the data pre- processing step and plays an important role in classification tasks for Machine Learning, as it can effectively reduce the size of the dataset, removing irrelevant/redundant attributes and improving prediction performance of the classifier. Although many real-world prob- lems are from multi-label hierarchical domain, most related research addresses the feature selection task focusing on single-label problems. In many works, even when the proposal addresses multiple labels, the associated class structure is not hierarchical. Therefore, in this work, we study how feature selection can be used in the context of Hierarchical Multi- Label Classification. For this purpose, we compare global feature selectors known in the literature with flat feature selectors adapted for hierarchical structures. The global fea- ture selectors used were Relief, Genie3 and Symbolic, and the flat feature selectors were ReliefF and Information Gain. For flat selectors, strategies were adopted to transform the Hierarchical Multi-label problem into a non-hierarchical multi-label problem, using the Label Powerset and Binary Relevance transformations. As main results, the global evaluators produced subsets of relevant features, improving the predictive performance while reducing the original dataset by up to 75% of the original dimensionality, with emphasis on the evaluators based on the Genie3 and Symbolic set. Despite the improvement, the flat evaluators were proportionally better compared to the global evaluators.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectSeleção de atributospor
dc.subjectClassificação hierárquica multirrótulopor
dc.subjectAprendizado de máquinapor
dc.titleInvestigação de métodos de seleção de atributos para problemas de classificação hierárquica multirrótulopor
dc.title.alternativeInvestigating feature selection methods for hierarchical multi-label classification problemseng
dc.typeTCCpor
dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512por
dc.description.resumoClassificação é a tarefa de atribuir exemplos de dados a classes. Na Classificação Hierár- quica Multirrótulo, os exemplos podem pertencer a duas ou mais classes (rótulos) simulta- neamente, onde as classes são estruturadas de forma hierárquica. A Seleção de Atributos faz parte da etapa de pré-processamento de dados e desempenha papel fundamental em tarefas de classificação para Aprendizado de Máquina, uma vez que pode reduzir de forma eficaz a dimensão do conjunto de dados, removendo atributos irrelevantes/redundantes, melhorando o desempenho preditivo do classificador. Embora muitos problemas do mundo real sejam do domínio hierárquico multirrótulo, a maioria das pesquisas relacionadas abor- dam a tarefa de seleção de atributos com foco em problemas monorrótulo, ou seja, de rótulo único. Em muitos trabalhos, mesmo quando a proposta aborda múltiplos rótulos, a estrutura de classes associada não é hierárquica. Portanto, neste trabalho, estudamos como a seleção de atributos pode ser empregada no contexto da Classificação Hierár- quica Multirrótulo. Com esse propósito, comparamos como seletores de atributos globais conhecidos na literatura com seletores de atributos planos adaptados para estruturas hi- erárquicas. Os seletores de atributos globais utilizados foram Relief, Genie3 e Symbolic, e os seletores de atributos planos foram ReliefF e Information Gain. Para os seletores planos, foram adotadas estratégias para transformar o problema Hierárquico Multirró- tulo em um problema multirrótulo não hierárquico, utilizando as transformações Label Powerset e Binary Relevance. Como principais resultados, os avaliadores produziram sub- conjuntos de atributos relevantes, aprimorando o desempenho preditivo dos classificadores enquanto reduziam a dimensionalidade do conjunto de dados original em até 75%, com destaque para os avaliadores baseados em Genie3 e Symbolic. Apesar do aprimoramento, os avaliadores planos se mostraram melhores, proporcionalmente, se comparados com os avaliadores globais.por
dc.publisher.initialsUFSCarpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/2590190539349649por
dc.publisher.courseEngenharia de Computação - ECpor
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-2582-1695por


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil