Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo

dc.contributor.advisor-co1Mantovani, Rafael Gomes
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/3753471203485400
dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512
dc.contributor.authorDel Valle, Aline Marques
dc.contributor.authorlatteshttp://lattes.cnpq.br/1961580945745420
dc.contributor.refereeCamargo, Heloisa de Arruda
dc.contributor.refereePrudêncio, Ricardo Bastos Cavalcante
dc.contributor.refereeCarvalho, Andre Carlos Ponce de Leon Ferreira de
dc.contributor.refereeLorena, Ana Carolina
dc.contributor.refereeLatteshttp://lattes.cnpq.br/0487231065057783
dc.contributor.refereeLatteshttp://lattes.cnpq.br/2984888073123287
dc.contributor.refereeLatteshttp://lattes.cnpq.br/9674541381385819
dc.contributor.refereeLatteshttp://lattes.cnpq.br/3451628262694747
dc.date.accessioned2025-12-01T12:52:50Z
dc.date.issued2025-10-13
dc.description.abstractMulti-label classification is a challenging problem, and its resolution involves choosing a classification algorithm and its respective hyperparameters. However, finding the best algorithm-hyperparameter combination is not a trivial task. In this context, Automated Machine Learning (AutoML) emerges as a solution, automating the selection of the best algorithm and its hyperparameter configuration for a machine learning problem. For multi-label classification problems, selection occurs in a hyperspace designed for this problem category. This thesis addresses AutoML and multi-label classification. Despite advances in the field, mainly related to constructing multi-label classifiers, some issues remain open. In this work, we investigate three of these areas. We investigate whether employing multi-objective optimization in AutoML strategies for multi-label classification is feasible and efficient. To address this research question, we proposed the EMANUEL strategy (gEnetic Multi-objective strategy for the Automatic selectioN of mUlti-labEl cLassifiers), an AutoML strategy developed with the NSGA-II algorithm to find classifiers that maximize the Macro F-score while minimizing the model size. Our results showed that multi-objective optimization can find a diversified Pareto frontier, with classifiers that weight different objectives and perform competitively with other classifiers. Furthermore, we study techniques that reduce AutoML runtime without compromising results. To this end, we employ meta-learning using surrogate models to evaluate multi-label classifier algorithms and estimate the objective values of optimization, avoiding direct evaluations during AutoML strategy execution. Including these surrogate models in new versions of the EMANUEL strategy maintained the predictive quality of the final models while reducing the total AutoML runtime. Finally, we investigated the effect of including feature selection in the EMANUEL strategy. To this end, we extend the hyperspace of classification algorithms by adding multi-label feature selection algorithms. The Pareto frontiers resulting from the new version of EMANUEL contained classifiers that maintained performance relative to the objectives, typically using fewer features.eng
dc.description.resumoA classificação multirrótulo é um problema desafiador e sua resolução envolve a escolha de um algoritmo de classificação e seus respectivos hiperparâmetros. Contudo, encontrar a melhor combinação algoritmo-hiperparâmetros não é uma tarefa trivial. É nesse contexto que o Aprendizado de Máquina Automatizado (Automated Machine Learning - AutoML) surge como solução, automatizando a seleção do melhor algoritmo e sua configuração de hiperparâmetros para problemas de aprendizado de máquina. Esta tese aborda o AutoML e a classificação multirrótulo. Apesar dos recentes avanços na área, principalmente relacionados à construção de classificadores multirrótulo, alguns problemas permanecem em aberto. Neste trabalho, investigamos três desafios nessa área. Investigamos se é viável e eficiente empregar a otimização multiobjetivo em estratégias AutoML para classificação multirrótulo. Para tratar essa questão de pesquisa, propusemos a estratégia EMANUEL (gEnetic Multi-objective strategy for the Automatic selectioN of mUlti-labEl cLassifiers), uma estratégia AutoML desenvolvida com o algoritmo NSGA-II com o objetivo de encontrar classificadores que maximizam o Macro F-score enquanto minimizam o tamanho dos modelos. Nossos resultados mostraram que a otimização multiobjetivo pode encontrar uma fronteira de Pareto diversificada, com classificadores que ponderam os diferentes objetivos e que apresentam desempenho competitivo em relação a outros classificadores. Além disso, estudamos técnicas que reduzem o tempo de execução do AutoML sem comprometer os resultados. Para isso, empregamos meta-aprendizado por meio de modelos substitutos para avaliar algoritmos de classificação multirrótulo e estimar os valores dos objetivos da otimização, evitando avaliações diretas durante a execução da estratégia AutoML. A inclusão desses modelos substitutos em novas versões da estratégia EMANUEL manteve a qualidade preditiva dos modelos finais, enquanto reduziu o tempo total de execução do AutoML. Por fim, investigamos o efeito da inclusão da seleção de atributos na estratégia EMANUEL. Para tanto, estendemos o hiperespaço de algoritmos de classificação, adicionando algoritmos de seleção de atributos multirrótulo. As fronteiras de Pareto resultantes da nova versão de EMANUEL continham classificadores que mantiveram o desempenho em relação aos objetivos, normalmente utilizando um número menor de atributos.
dc.description.sponsorshipNão recebi financiamento
dc.identifier.citationDEL VALLE, Aline Marques. Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo. 2025. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23117.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/23117
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCC
dc.relation.urihttps://dl.acm.org/doi/10.1007/978-3-031-45389-2_20
dc.relation.urihttps://www.springerprofessional.de/en/a-systematic-literature-review-on-automl-for-multi-target-learni/25910732
dc.rightsAttribution-NonCommercial-ShareAlike 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/br/
dc.subjectAprendizado de máquina automatizado
dc.subjectClassificação multirrótulo
dc.subjectOtimização multiobjetivo
dc.subjectMeta-aprendizado
dc.subjectSeleção de atributos
dc.subjectAutomated machine learningeng
dc.subjectMulti-label classificationeng
dc.subjectMultiobjective optimizationeng
dc.subjectMeta-learningeng
dc.subjectFeature selectioneng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.ods8. Trabalho Decente e Crescimento Econômico
dc.titleAprendizado de máquina automatizado multiobjetivo para classificação multirrótulo
dc.title.alternativeAutomated machine learning multi-objective for multi-label classificationeng
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese_aline_del_valle_2025.pdf
Tamanho:
2.08 MB
Formato:
Adobe Portable Document Format