Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo

Valle, Aline Marques Del

Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo

dc.contributor.advisor-co1	Mantovani, Rafael Gomes
dc.contributor.advisor-co1Lattes	https://lattes.cnpq.br/3753471203485400
dc.contributor.advisor1	Cerri, Ricardo
dc.contributor.advisor1Lattes	https://lattes.cnpq.br/6266519868438512
dc.contributor.author	Valle, Aline Marques Del
dc.contributor.authorlattes	https://lattes.cnpq.br/1961580945745420
dc.contributor.referee	Camargo, Heloisa de Arruda
dc.contributor.referee	Prudêncio, Ricardo Bastos Cavalcante
dc.contributor.referee	Carvalho, Andre Carlos Ponce de Leon Ferreira de
dc.contributor.referee	Lorena, Ana Carolina
dc.contributor.refereeLattes	https://lattes.cnpq.br/0487231065057783
dc.contributor.refereeLattes	https://lattes.cnpq.br/2984888073123287
dc.contributor.refereeLattes	https://lattes.cnpq.br/9674541381385819
dc.contributor.refereeLattes	https://lattes.cnpq.br/3451628262694747
dc.date.accessioned	2025-12-01T12:52:50Z
dc.date.issued	2025-10-13
dc.description.abstract	Multi-label classification is a challenging problem, and its resolution involves choosing a classification algorithm and its respective hyperparameters. However, finding the best algorithm-hyperparameter combination is not a trivial task. In this context, Automated Machine Learning (AutoML) emerges as a solution, automating the selection of the best algorithm and its hyperparameter configuration for a machine learning problem. For multi-label classification problems, selection occurs in a hyperspace designed for this problem category. This thesis addresses AutoML and multi-label classification. Despite advances in the field, mainly related to constructing multi-label classifiers, some issues remain open. In this work, we investigate three of these areas. We investigate whether employing multi-objective optimization in AutoML strategies for multi-label classification is feasible and efficient. To address this research question, we proposed the EMANUEL strategy (gEnetic Multi-objective strategy for the Automatic selectioN of mUlti-labEl cLassifiers), an AutoML strategy developed with the NSGA-II algorithm to find classifiers that maximize the Macro F-score while minimizing the model size. Our results showed that multi-objective optimization can find a diversified Pareto frontier, with classifiers that weight different objectives and perform competitively with other classifiers. Furthermore, we study techniques that reduce AutoML runtime without compromising results. To this end, we employ meta-learning using surrogate models to evaluate multi-label classifier algorithms and estimate the objective values of optimization, avoiding direct evaluations during AutoML strategy execution. Including these surrogate models in new versions of the EMANUEL strategy maintained the predictive quality of the final models while reducing the total AutoML runtime. Finally, we investigated the effect of including feature selection in the EMANUEL strategy. To this end, we extend the hyperspace of classification algorithms by adding multi-label feature selection algorithms. The Pareto frontiers resulting from the new version of EMANUEL contained classifiers that maintained performance relative to the objectives, typically using fewer features.	eng
dc.description.resumo	A classificação multirrótulo é um problema desafiador e sua resolução envolve a escolha de um algoritmo de classificação e seus respectivos hiperparâmetros. Contudo, encontrar a melhor combinação algoritmo-hiperparâmetros não é uma tarefa trivial. É nesse contexto que o Aprendizado de Máquina Automatizado (Automated Machine Learning - AutoML) surge como solução, automatizando a seleção do melhor algoritmo e sua configuração de hiperparâmetros para problemas de aprendizado de máquina. Esta tese aborda o AutoML e a classificação multirrótulo. Apesar dos recentes avanços na área, principalmente relacionados à construção de classificadores multirrótulo, alguns problemas permanecem em aberto. Neste trabalho, investigamos três desafios nessa área. Investigamos se é viável e eficiente empregar a otimização multiobjetivo em estratégias AutoML para classificação multirrótulo. Para tratar essa questão de pesquisa, propusemos a estratégia EMANUEL (gEnetic Multi-objective strategy for the Automatic selectioN of mUlti-labEl cLassifiers), uma estratégia AutoML desenvolvida com o algoritmo NSGA-II com o objetivo de encontrar classificadores que maximizam o Macro F-score enquanto minimizam o tamanho dos modelos. Nossos resultados mostraram que a otimização multiobjetivo pode encontrar uma fronteira de Pareto diversificada, com classificadores que ponderam os diferentes objetivos e que apresentam desempenho competitivo em relação a outros classificadores. Além disso, estudamos técnicas que reduzem o tempo de execução do AutoML sem comprometer os resultados. Para isso, empregamos meta-aprendizado por meio de modelos substitutos para avaliar algoritmos de classificação multirrótulo e estimar os valores dos objetivos da otimização, evitando avaliações diretas durante a execução da estratégia AutoML. A inclusão desses modelos substitutos em novas versões da estratégia EMANUEL manteve a qualidade preditiva dos modelos finais, enquanto reduziu o tempo total de execução do AutoML. Por fim, investigamos o efeito da inclusão da seleção de atributos na estratégia EMANUEL. Para tanto, estendemos o hiperespaço de algoritmos de classificação, adicionando algoritmos de seleção de atributos multirrótulo. As fronteiras de Pareto resultantes da nova versão de EMANUEL continham classificadores que mantiveram o desempenho em relação aos objetivos, normalmente utilizando um número menor de atributos.
dc.description.sponsorship	Não recebi financiamento
dc.identifier.citation	VALLE, Aline Marques Del. Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo. 2025. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, Campus São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23117.	*
dc.identifier.uri	https://hdl.handle.net/20.500.14289/23117
dc.language.iso	por
dc.publisher	Universidade Federal de São Carlos
dc.publisher.address	Campus São Carlos
dc.publisher.initials	UFSCar
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.relation.uri	https://dl.acm.org/doi/10.1007/978-3-031-45389-2_20
dc.relation.uri	https://www.springerprofessional.de/en/a-systematic-literature-review-on-automl-for-multi-target-learni/25910732
dc.rights	Attribution-NonCommercial-ShareAlike 3.0 Brazil	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/3.0/br/
dc.subject	Aprendizado de máquina automatizado
dc.subject	Classificação multirrótulo
dc.subject	Otimização multiobjetivo
dc.subject	Meta-aprendizado
dc.subject	Seleção de atributos
dc.subject	Automated machine learning	eng
dc.subject	Multi-label classification	eng
dc.subject	Multiobjective optimization	eng
dc.subject	Meta-learning	eng
dc.subject	Feature selection	eng
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.ods	8. Trabalho Decente e Crescimento Econômico
dc.title	Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo
dc.title.alternative	Automated machine learning multi-objective for multi-label classification	eng
dc.type	Tese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: tese_aline_del_valle_2025.pdf
Tamanho:: 2.08 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

Teses e Dissertações