Show simple item record

dc.contributor.authorGatto, Elaine Cecília
dc.date.accessioned2024-02-15T16:58:07Z
dc.date.available2024-02-15T16:58:07Z
dc.date.issued2023-11-14
dc.identifier.citationGATTO, Elaine Cecília. Além do aprendizado local e global: particionando o espaço de classes em problemas de classificação multirrótulo. 2023. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19284.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/19284
dc.description.abstractInducing a model capable of predicting a set of labels for an instance is the objective of multi-label classification, a supervised predictive machine learning task. Work in the literature has shown that identifying, modeling and exploring correlations between labels improves the predictive performance of multi-label classifiers. However, the traditional approaches, referred to here as global and local, used to solve multi-label classification problems may not be taking advantage of these correlations, as in both these correlations are not fully considered. In the global approach, all labels are learned at once and more specific information or correlations can be ignored, while in the local approach labels are learned individually, making correlation learning impractical. There are also works in the literature that show that the currently available multi-label datasets have a very low level of label dependence, and therefore exploring correlations is impractical, while others claim that learning the labels individually is the most compatible solution, and even works that recommend global approach methods as they generate a single, more compact model. In this work, a hybrid approach is proposed, which explores the advantages and tries to mitigate the disadvantages of traditional global and local approaches, which is called Hybrid Partitions for Multi-label Classification - \ac{HPML}. This approach aims to find several label partitions, which are composed of disjoint groups of correlated labels, here called hybrid partitions. Four experiments were conducted to test and validate the hypothesis with different versions of hybrid partitions, which were compared with the partitions generated by the global, local approach and also different random versions. In general, the experiments showed that it is possible to find a hybrid partition capable of improving the predictive performance of classifiers on various data sets and that traditional methods still fail to learn the labels as well as correctly deal with the correlations between labels.eng
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)por
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectClassificação multirrótulopor
dc.subjectCorrelações entre rótulospor
dc.subjectParticionamento do espaço de rótulospor
dc.subjectPartições multirrótulopor
dc.subjectMultiLabel classificationeng
dc.subjectLabel correlationseng
dc.subjectLabel space partitioningeng
dc.subjectMultiLabel partitionseng
dc.titleAlém do aprendizado local e global: particionando o espaço de classes em problemas de classificação multirrótulopor
dc.title.alternativeBeyond local and global learning: partitioning the class space in multi-label classification problemseng
dc.typeTesepor
dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512por
dc.contributor.advisor-co1Ferrandin, Mauri
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4132238007682356por
dc.description.resumoInduzir um modelo capaz de predizer um conjunto de rótulos para uma instância é objetivo da classificação multirrótulo, uma tarefa preditiva supervisionada do aprendizado de máquina. Trabalhos na literatura têm mostrado que identificar, modelar e explorar as correlações entre rótulos, melhora o desempenho preditivo dos classificadores multirrótulo. No entanto, as abordagens tradicionais, chamadas aqui de global e local, usadas para solucionar problemas de classificação multirrótulo podem não estar tirando proveito dessas correlações, já que em ambas essas correlações não são totalmente consideradas. Na abordagem global, todos os rótulos são aprendidos de uma única vez e informações ou correlações mais específicas podem ser ignoradas, enquanto que na abordagem local os rótulos são aprendidos de forma individual, tornando o aprendizado de correlações impraticável. Também há na literatura trabalhos que mostram que os conjuntos de dados mutirrótulos disponíveis atualmente têm um nível de dependência de rótulos muito baixo, e por isso explorar as correlações é impraticável, enquanto outros afirmam que aprender os rótulos individualmente é a solução mais compatível, e ainda trabalhos que recomendam os métodos da abordagem global por gerarem um único modelo mais compacto. Neste trabalho é proposta uma abordagem híbrida, que explora as vantagens e tenta mitigar as desvantagens das tradicionais abordagens global e local, a qual é chamada aqui de \ac{HPML}. Essa abordagem tem como objetivo encontrar diversas partições de rótulos, que são compostas por grupos disjuntos de rótulos correlacionados, aqui chamadas de partições híbridas. Quatro experimentos foram conduzidos para testar e validar a hipótese com diferentes versões de partições híbridas, as quais foram comparadas com as partições geradas pela abordagem global, local e também diferentes versões aleatórias. De forma geral, os experimentos mostraram que é possível encontrar uma partição híbrida capaz de melhorar o desempenho preditivo dos classificadores em vários conjuntos de dados e que métodos tradicionais ainda falham em aprender os rótulos assim como também lidar corretamente com as correlações entre rótulos.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.description.sponsorshipIdProcesso Número 001, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.description.sponsorshipIdProcesso Número 200371/2022-3, Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPQ)por
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/8559022477811603por
dc.contributor.authororcidhttps://orcid.org/0000-0002-3322-6407por
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-2582-1695por
dc.contributor.advisor-co1orcidhttps://orcid.org/0000-0002-4248-1207por


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil