Classificação semissupervisionada baseada em densidade com reconhecimento de anomalias

dc.contributor.advisor1Naldi, Murilo Coelho
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0573662728816861
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-3107-8236
dc.contributor.authorMass, Bruno
dc.contributor.authorlatteshttp://lattes.cnpq.br/5481357033125207
dc.contributor.authororcidhttps://orcid.org/0009-0007-2775-5277
dc.contributor.refereeNaldi, Murilo Coelho
dc.contributor.refereeValejo, Alan Demétrius Baria
dc.contributor.refereeJaskowiak, Pablo Andretta
dc.contributor.refereeLatteshttp://lattes.cnpq.br/0573662728816861
dc.contributor.refereeLatteshttp://lattes.cnpq.br/9546164790189830
dc.contributor.refereeLatteshttp://lattes.cnpq.br/3294090242380648
dc.contributor.refereeorcidhttps://orcid.org/0000-0002-3107-8236
dc.contributor.refereeorcidhttps://orcid.org/0000-0002-9046-9499
dc.contributor.refereeorcidhttps://orcid.org/0000-0002-6377-3372
dc.date.accessioned2026-01-20T18:08:07Z
dc.date.issued2025-12-05
dc.description.abstractIn the context of data mining, the task of anomaly detection is important because observations that deviate from the majority can negatively affect machine learning models or represent the main object of interest in various real-world scenarios. At the same time, semi-supervised classification tasks are essential in situations where labeled data are scarce. In this work, we suggest unifying these two tasks into a single integrated process: we propose combining a state-of-the-art density-based clustering algorithm capable of detecting outliers with two well-known density-based semi-supervised classifiers, with the goal of producing hybrid methods capable of performing both tasks. Experiments conducted on 42 semi-synthetic datasets with different proportions of labeled objects and two distinct types of anomalies showed that the investigated anomaly detection method outperforms similar approaches, especially on datasets containing global anomalies. The results also demonstrate that when the outlier detection method is combined with the semi-supervised classifiers, there is only a minor impact on classification quality. Thus, we show that the proposed hybrid approaches constitute viable alternatives to their respective original methods, enabling explicit identification of anomalies without significantly compromising classification performance.eng
dc.description.resumoNo contexto de mineiração de dados, a tarefa de detecção de anomalias é importante pois observações divergentes do todo podem afetar negativamente de modelos de aprendizado de máquina ou constituir o principal objeto de interesse em diversos cenários reais. Ao mesmo tempo, tarefas de classificação semissupervisionada mostram-se essenciais em contextos nos quais os dados rotulados são escassos. Neste trabalho, sugerimos a unificação das duas tarefas em um processo único integrado: propomos a combinação de um algoritmo considerado estado da arte em agrupamento baseado em densidade, capaz de detectar anomalias, com dois conhecidos classificadores semissupervisionados baseados em densidade, com o objetivo de produzir métodos híbridos capazes de desempenhar ambas as tarefas. Experimentos conduzidos em 42 conjuntos de dados semissintéticos com diferentes proporções de objetos rotulados e dois tipos distintos de anomalias mostraram que o método de detecção de anomalias investigado apresenta desempenho superior ao de métodos similares, principalmente em conjuntos de dados contendo anomalias globais. Os resultados também comprovam que, quando o método de detecção de anomalias é combinado com os classificadores semissupervisionados, há um baixo impacto na qualidade da tarefa de classificação. Desta forma demonstramos que as abordagens híbridas propostas constituem alternativas viáveis aos seus respectivos métodos originais, permitindo a identificação explícita de anomalias sem comprometer de forma significativa a qualidade da tarefa de classificação.por
dc.description.sponsorshipNão recebi financiamento
dc.identifier.citationMASS, Bruno. Classificação semissupervisionada baseada em densidade com reconhecimento de anomalias. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23433.*
dc.identifier.urihttps://hdl.handle.net/20.500.14289/23433
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCC
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectAprendizado semissupervisionadopor
dc.subjectClassificação semissupervisionadapor
dc.subjectDetecção de anomaliaspor
dc.subjectSemi-supervised learningeng
dc.subjectSemi-supervised classificationeng
dc.subjectAnomaly detectioneng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.ods9. Indústria, Inovação e Infraestrutura
dc.titleClassificação semissupervisionada baseada em densidade com reconhecimento de anomaliaspor
dc.title.alternativeSemi-supervised density-based classification with anomaly detectioneng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao_Bruno_Mass_Classificacao_Semissupervisionada_Baseada_em_Densidade_com_Reconhecimento_de_Anomalias_merged_compression_PDFA.pdf
Tamanho:
14.71 MB
Formato:
Adobe Portable Document Format