Classificação semissupervisionada baseada em densidade com reconhecimento de anomalias
| dc.contributor.advisor1 | Naldi, Murilo Coelho | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0573662728816861 | |
| dc.contributor.advisor1orcid | https://orcid.org/0000-0002-3107-8236 | |
| dc.contributor.author | Mass, Bruno | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/5481357033125207 | |
| dc.contributor.authororcid | https://orcid.org/0009-0007-2775-5277 | |
| dc.contributor.referee | Naldi, Murilo Coelho | |
| dc.contributor.referee | Valejo, Alan Demétrius Baria | |
| dc.contributor.referee | Jaskowiak, Pablo Andretta | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/0573662728816861 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/9546164790189830 | |
| dc.contributor.refereeLattes | http://lattes.cnpq.br/3294090242380648 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0002-3107-8236 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0002-9046-9499 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0002-6377-3372 | |
| dc.date.accessioned | 2026-01-20T18:08:07Z | |
| dc.date.issued | 2025-12-05 | |
| dc.description.abstract | In the context of data mining, the task of anomaly detection is important because observations that deviate from the majority can negatively affect machine learning models or represent the main object of interest in various real-world scenarios. At the same time, semi-supervised classification tasks are essential in situations where labeled data are scarce. In this work, we suggest unifying these two tasks into a single integrated process: we propose combining a state-of-the-art density-based clustering algorithm capable of detecting outliers with two well-known density-based semi-supervised classifiers, with the goal of producing hybrid methods capable of performing both tasks. Experiments conducted on 42 semi-synthetic datasets with different proportions of labeled objects and two distinct types of anomalies showed that the investigated anomaly detection method outperforms similar approaches, especially on datasets containing global anomalies. The results also demonstrate that when the outlier detection method is combined with the semi-supervised classifiers, there is only a minor impact on classification quality. Thus, we show that the proposed hybrid approaches constitute viable alternatives to their respective original methods, enabling explicit identification of anomalies without significantly compromising classification performance. | eng |
| dc.description.resumo | No contexto de mineiração de dados, a tarefa de detecção de anomalias é importante pois observações divergentes do todo podem afetar negativamente de modelos de aprendizado de máquina ou constituir o principal objeto de interesse em diversos cenários reais. Ao mesmo tempo, tarefas de classificação semissupervisionada mostram-se essenciais em contextos nos quais os dados rotulados são escassos. Neste trabalho, sugerimos a unificação das duas tarefas em um processo único integrado: propomos a combinação de um algoritmo considerado estado da arte em agrupamento baseado em densidade, capaz de detectar anomalias, com dois conhecidos classificadores semissupervisionados baseados em densidade, com o objetivo de produzir métodos híbridos capazes de desempenhar ambas as tarefas. Experimentos conduzidos em 42 conjuntos de dados semissintéticos com diferentes proporções de objetos rotulados e dois tipos distintos de anomalias mostraram que o método de detecção de anomalias investigado apresenta desempenho superior ao de métodos similares, principalmente em conjuntos de dados contendo anomalias globais. Os resultados também comprovam que, quando o método de detecção de anomalias é combinado com os classificadores semissupervisionados, há um baixo impacto na qualidade da tarefa de classificação. Desta forma demonstramos que as abordagens híbridas propostas constituem alternativas viáveis aos seus respectivos métodos originais, permitindo a identificação explícita de anomalias sem comprometer de forma significativa a qualidade da tarefa de classificação. | por |
| dc.description.sponsorship | Não recebi financiamento | |
| dc.identifier.citation | MASS, Bruno. Classificação semissupervisionada baseada em densidade com reconhecimento de anomalias. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23433. | * |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/23433 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Câmpus São Carlos | |
| dc.publisher.initials | UFSCar | |
| dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Aprendizado semissupervisionado | por |
| dc.subject | Classificação semissupervisionada | por |
| dc.subject | Detecção de anomalias | por |
| dc.subject | Semi-supervised learning | eng |
| dc.subject | Semi-supervised classification | eng |
| dc.subject | Anomaly detection | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
| dc.subject.ods | 9. Indústria, Inovação e Infraestrutura | |
| dc.title | Classificação semissupervisionada baseada em densidade com reconhecimento de anomalias | por |
| dc.title.alternative | Semi-supervised density-based classification with anomaly detection | eng |
| dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Dissertacao_Bruno_Mass_Classificacao_Semissupervisionada_Baseada_em_Densidade_com_Reconhecimento_de_Anomalias_merged_compression_PDFA.pdf
- Tamanho:
- 14.71 MB
- Formato:
- Adobe Portable Document Format