Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo
| dc.contributor.advisor-co1 | Mantovani, Rafael Gomes | |
| dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/3753471203485400 | |
| dc.contributor.advisor1 | Cerri, Ricardo | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6266519868438512 | |
| dc.contributor.author | Del Valle, Aline Marques | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/1961580945745420 | |
| dc.contributor.referee | Camargo, Heloisa de Arruda | |
| dc.contributor.referee | Prudêncio, Ricardo Bastos Cavalcante | |
| dc.contributor.referee | Carvalho, Andre Carlos Ponce de Leon Ferreira de | |
| dc.contributor.referee | Lorena, Ana Carolina | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/0487231065057783 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/2984888073123287 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/9674541381385819 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/3451628262694747 | |
| dc.date.accessioned | 2025-12-01T12:52:50Z | |
| dc.date.issued | 2025-10-13 | |
| dc.description.abstract | Multi-label classification is a challenging problem, and its resolution involves choosing a classification algorithm and its respective hyperparameters. However, finding the best algorithm-hyperparameter combination is not a trivial task. In this context, Automated Machine Learning (AutoML) emerges as a solution, automating the selection of the best algorithm and its hyperparameter configuration for a machine learning problem. For multi-label classification problems, selection occurs in a hyperspace designed for this problem category. This thesis addresses AutoML and multi-label classification. Despite advances in the field, mainly related to constructing multi-label classifiers, some issues remain open. In this work, we investigate three of these areas. We investigate whether employing multi-objective optimization in AutoML strategies for multi-label classification is feasible and efficient. To address this research question, we proposed the EMANUEL strategy (gEnetic Multi-objective strategy for the Automatic selectioN of mUlti-labEl cLassifiers), an AutoML strategy developed with the NSGA-II algorithm to find classifiers that maximize the Macro F-score while minimizing the model size. Our results showed that multi-objective optimization can find a diversified Pareto frontier, with classifiers that weight different objectives and perform competitively with other classifiers. Furthermore, we study techniques that reduce AutoML runtime without compromising results. To this end, we employ meta-learning using surrogate models to evaluate multi-label classifier algorithms and estimate the objective values of optimization, avoiding direct evaluations during AutoML strategy execution. Including these surrogate models in new versions of the EMANUEL strategy maintained the predictive quality of the final models while reducing the total AutoML runtime. Finally, we investigated the effect of including feature selection in the EMANUEL strategy. To this end, we extend the hyperspace of classification algorithms by adding multi-label feature selection algorithms. The Pareto frontiers resulting from the new version of EMANUEL contained classifiers that maintained performance relative to the objectives, typically using fewer features. | eng |
| dc.description.resumo | A classificação multirrótulo é um problema desafiador e sua resolução envolve a escolha de um algoritmo de classificação e seus respectivos hiperparâmetros. Contudo, encontrar a melhor combinação algoritmo-hiperparâmetros não é uma tarefa trivial. É nesse contexto que o Aprendizado de Máquina Automatizado (Automated Machine Learning - AutoML) surge como solução, automatizando a seleção do melhor algoritmo e sua configuração de hiperparâmetros para problemas de aprendizado de máquina. Esta tese aborda o AutoML e a classificação multirrótulo. Apesar dos recentes avanços na área, principalmente relacionados à construção de classificadores multirrótulo, alguns problemas permanecem em aberto. Neste trabalho, investigamos três desafios nessa área. Investigamos se é viável e eficiente empregar a otimização multiobjetivo em estratégias AutoML para classificação multirrótulo. Para tratar essa questão de pesquisa, propusemos a estratégia EMANUEL (gEnetic Multi-objective strategy for the Automatic selectioN of mUlti-labEl cLassifiers), uma estratégia AutoML desenvolvida com o algoritmo NSGA-II com o objetivo de encontrar classificadores que maximizam o Macro F-score enquanto minimizam o tamanho dos modelos. Nossos resultados mostraram que a otimização multiobjetivo pode encontrar uma fronteira de Pareto diversificada, com classificadores que ponderam os diferentes objetivos e que apresentam desempenho competitivo em relação a outros classificadores. Além disso, estudamos técnicas que reduzem o tempo de execução do AutoML sem comprometer os resultados. Para isso, empregamos meta-aprendizado por meio de modelos substitutos para avaliar algoritmos de classificação multirrótulo e estimar os valores dos objetivos da otimização, evitando avaliações diretas durante a execução da estratégia AutoML. A inclusão desses modelos substitutos em novas versões da estratégia EMANUEL manteve a qualidade preditiva dos modelos finais, enquanto reduziu o tempo total de execução do AutoML. Por fim, investigamos o efeito da inclusão da seleção de atributos na estratégia EMANUEL. Para tanto, estendemos o hiperespaço de algoritmos de classificação, adicionando algoritmos de seleção de atributos multirrótulo. As fronteiras de Pareto resultantes da nova versão de EMANUEL continham classificadores que mantiveram o desempenho em relação aos objetivos, normalmente utilizando um número menor de atributos. | |
| dc.description.sponsorship | Não recebi financiamento | |
| dc.identifier.citation | DEL VALLE, Aline Marques. Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo. 2025. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23117. | por |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/23117 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Campus São Carlos | |
| dc.publisher.initials | UFSCar | |
| dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | |
| dc.relation.uri | https://dl.acm.org/doi/10.1007/978-3-031-45389-2_20 | |
| dc.relation.uri | https://www.springerprofessional.de/en/a-systematic-literature-review-on-automl-for-multi-target-learni/25910732 | |
| dc.rights | Attribution-NonCommercial-ShareAlike 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/br/ | |
| dc.subject | Aprendizado de máquina automatizado | |
| dc.subject | Classificação multirrótulo | |
| dc.subject | Otimização multiobjetivo | |
| dc.subject | Meta-aprendizado | |
| dc.subject | Seleção de atributos | |
| dc.subject | Automated machine learning | eng |
| dc.subject | Multi-label classification | eng |
| dc.subject | Multiobjective optimization | eng |
| dc.subject | Meta-learning | eng |
| dc.subject | Feature selection | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
| dc.subject.ods | 8. Trabalho Decente e Crescimento Econômico | |
| dc.title | Aprendizado de máquina automatizado multiobjetivo para classificação multirrótulo | |
| dc.title.alternative | Automated machine learning multi-objective for multi-label classification | eng |
| dc.type | Tese |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- tese_aline_del_valle_2025.pdf
- Tamanho:
- 2.08 MB
- Formato:
- Adobe Portable Document Format