dc.contributor.author | Gatto, Elaine Cecília | |
dc.date.accessioned | 2024-02-15T16:58:07Z | |
dc.date.available | 2024-02-15T16:58:07Z | |
dc.date.issued | 2023-11-14 | |
dc.identifier.citation | GATTO, Elaine Cecília. Além do aprendizado local e global: particionando o espaço de classes em problemas de classificação multirrótulo. 2023. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19284. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/19284 | |
dc.description.abstract | Inducing a model capable of predicting a set of labels for an instance is the objective of multi-label classification, a supervised predictive machine learning task. Work in the literature has shown that identifying, modeling and exploring correlations between labels improves the predictive performance of multi-label classifiers. However, the traditional approaches, referred to here as global and local, used to solve multi-label classification problems may not be taking advantage of these correlations, as in both these correlations are not fully considered. In the global approach, all labels are learned at once and more specific information or correlations can be ignored, while in the local approach labels are learned individually, making correlation learning impractical. There are also works in the literature that show that the currently available multi-label datasets have a very low level of label dependence, and therefore exploring correlations is impractical, while others claim that learning the labels individually is the most compatible solution, and even works that recommend global approach methods as they generate a single, more compact model. In this work, a hybrid approach is proposed, which explores the advantages and tries to mitigate the disadvantages of traditional global and local approaches, which is called Hybrid Partitions for Multi-label Classification - \ac{HPML}. This approach aims to find several label partitions, which are composed of disjoint groups of correlated labels, here called hybrid partitions. Four experiments were conducted to test and validate the hypothesis with different versions of hybrid partitions, which were compared with the partitions generated by the global, local approach and also different random versions. In general, the experiments showed that it is possible to find a hybrid partition capable of improving the predictive performance of classifiers on various data sets and that traditional methods still fail to learn the labels as well as correctly deal with the correlations between labels. | eng |
dc.description.sponsorship | Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) | por |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Classificação multirrótulo | por |
dc.subject | Correlações entre rótulos | por |
dc.subject | Particionamento do espaço de rótulos | por |
dc.subject | Partições multirrótulo | por |
dc.subject | MultiLabel classification | eng |
dc.subject | Label correlations | eng |
dc.subject | Label space partitioning | eng |
dc.subject | MultiLabel partitions | eng |
dc.title | Além do aprendizado local e global: particionando o espaço de classes em problemas de classificação multirrótulo | por |
dc.title.alternative | Beyond local and global learning: partitioning the class space in multi-label classification problems | eng |
dc.type | Tese | por |
dc.contributor.advisor1 | Cerri, Ricardo | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6266519868438512 | por |
dc.contributor.advisor-co1 | Ferrandin, Mauri | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/4132238007682356 | por |
dc.description.resumo | Induzir um modelo capaz de predizer um conjunto de rótulos para uma instância é objetivo da classificação multirrótulo, uma tarefa preditiva supervisionada do aprendizado de máquina. Trabalhos na literatura têm mostrado que identificar, modelar e explorar as correlações entre rótulos, melhora o desempenho preditivo dos classificadores multirrótulo. No entanto, as abordagens tradicionais, chamadas aqui de global e local, usadas para solucionar problemas de classificação multirrótulo podem não estar tirando proveito dessas correlações, já que em ambas essas correlações não são totalmente consideradas. Na abordagem global, todos os rótulos são aprendidos de uma única vez e informações ou correlações mais específicas podem ser ignoradas, enquanto que na abordagem local os rótulos são aprendidos de forma individual, tornando o aprendizado de correlações impraticável. Também há na literatura trabalhos que mostram que os conjuntos de dados mutirrótulos disponíveis atualmente têm um nível de dependência de rótulos muito baixo, e por isso explorar as correlações é impraticável, enquanto outros afirmam que aprender os rótulos individualmente é a solução mais compatível, e ainda trabalhos que recomendam os métodos da abordagem global por gerarem um único modelo mais compacto. Neste trabalho é proposta uma abordagem híbrida, que explora as vantagens e tenta mitigar as desvantagens das tradicionais abordagens global e local, a qual é chamada aqui de \ac{HPML}. Essa abordagem tem como objetivo encontrar diversas partições de rótulos, que são compostas por grupos disjuntos de rótulos correlacionados, aqui chamadas de partições híbridas. Quatro experimentos foram conduzidos para testar e validar a hipótese com diferentes versões de partições híbridas, as quais foram comparadas com as partições geradas pela abordagem global, local e também diferentes versões aleatórias. De forma geral, os experimentos mostraram que é possível encontrar uma partição híbrida capaz de melhorar o desempenho preditivo dos classificadores em vários conjuntos de dados e que métodos tradicionais ainda falham em aprender os rótulos assim como também lidar corretamente com as correlações entre rótulos. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | por |
dc.description.sponsorshipId | Processo Número 001, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.description.sponsorshipId | Processo Número 200371/2022-3, Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPQ) | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/8559022477811603 | por |
dc.contributor.authororcid | https://orcid.org/0000-0002-3322-6407 | por |
dc.contributor.advisor1orcid | https://orcid.org/0000-0002-2582-1695 | por |
dc.contributor.advisor-co1orcid | https://orcid.org/0000-0002-4248-1207 | por |