Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes

dc.contributor.advisor1Demétrius Baria Valejo, Alan
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9546164790189830
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-9046-9499
dc.contributor.authorLopes Filho, Carlos Pereira
dc.contributor.authorlatteshttp://lattes.cnpq.br/4073822253624796
dc.contributor.authororcidhttps://orcid.org/0009-0005-6290-6558
dc.contributor.refereeCoelho Naldi, Murilo
dc.contributor.refereeMarcondes Marcacini, Ricardo
dc.contributor.refereeLatteshttp://lattes.cnpq.br/0573662728816861
dc.contributor.refereeLatteshttp://lattes.cnpq.br/3272611282260295
dc.contributor.refereeorcidhttps://orcid.org/0000-0002-3107-8236
dc.contributor.refereeorcidhttps://orcid.org/0000-0002-2309-3487
dc.date.accessioned2025-10-28T14:38:26Z
dc.date.issued2025-06-04
dc.description.abstractClustering plays a fundamental role in attributed graphs, which incorporate both topological structure and node attributes represented as feature vectors. Deep clustering methods based on Graph Neural Networks (GNNs) have proven effective in extracting patterns from such data. Most existing approaches use a traditional clustering algorithm to identify representative elements, which are later employed in the training of the GNN and the clustering task. However, when selecting representative elements, these clustering algorithms consider only the feature vector of each instance, neglecting topological information. This limitation negatively impacts the GNN learning process. To address this issue, we propose Deep Graph Clustering via Graph Neural Network and Seed Selection (DGCSS), a model consisting of three modules: (1) the seed selection module, which iden- tifies representative nodes; (2) the embedding module, which employs a graph attentional network to capture global topological information; and (3) the self-supervised module, which leverages the representative nodes to guide the clustering task. An advantage of our algorithm is that it integrates both the topological structure and node attributes across all modules to identify representative elements. This is the first GNN-based clustering algorithm that incorporates seed selection, establishing a significant reference for future research. The empirical analysis of real world graphs provides evidence that the use of seeds is competitive when compared to traditional algorithms, such as K-Means combined with GNNs.eng
dc.description.resumoTarefas de detecção de comunidades (agrupamento, do inglês clustering) desempenham um papel fundamental em grafos com atributos, os quais incorporam tanto a estrutura topológica quanto os atributos dos nós, sendo representados por vetores de características. Métodos de detecção de comunidades baseados em Redes Neurais em Grafos (Graph Neural Networks - (GNNs)) têm se mostrado eficazes na extração de padrões a partir desses dados. A maioria das abordagens existentes utiliza um algoritmo de agrupamento tradicional para identificar elementos representativos, os quais são posteriormente empregados no treinamento da GNN e na tarefa de detecção de comunidades. Entretanto, ao selecionar esses elementos, tais algoritmos consideram apenas o vetor de características de cada nó, negligenciando a informação topológica do grafo, o que impacta negativamente o processo de aprendizado da GNN. Para solucionar essa questão, propomos o Deep Graph Clustering via Seed Selection (DGCSS), um modelo composto por três módulos: (1) o módulo de seleção de sementes, que identifica os nós representativos; (2) o módulo de embedding, que utiliza mecanismos de Atenção em Grafos (Graph Attention) para capturar informações topológicas globais; e (3) o módulo de auto-supervisão, que utiliza os nós representativos para orientar a tarefa de detecção de comunidades. Uma vantagem do nosso algoritmo é que ele integra, em todos os módulos, tanto a estrutura topológica quanto os atributos dos nós para identificar os elementos representativos. Este é o primeiro algoritmo de detecção de comunidades baseado em GNN que incorpora a seleção de sementes, estabelecendo uma referência significativa para pesquisas futuras. A análise empírica realizada em grafos do mundo real demonstra que o uso de sementes é competitivo quando comparado a algoritmos tradicionais, como o K-Means combinado com GNNs.por
dc.identifier.citationLOPES FILHO, Carlos Pereira. Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22963.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/22963
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCC
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectAgrupamentopor
dc.subjectSeleção de sementespor
dc.subjectGrafospor
dc.subjectRedes neurais em grafospor
dc.subjectGraph clusteringeng
dc.subjectGraph neural networkseng
dc.subjectSeed selectioneng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.titleAgrupamento profundo de grafos usando redes neurais de grafos e seleção de sementespor
dc.title.alternativeDeep graph clustering using graph neural networks and seed selectioneng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf
Tamanho:
1.47 MB
Formato:
Adobe Portable Document Format