Mapas auto-organizáveis crescentes para classificação de logs de firewall em fluxos contínuos de dados

dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-2582-1695
dc.contributor.authorGiarini, Wagner Rafael
dc.contributor.authorlatteshttp://lattes.cnpq.br/6461896471699749
dc.contributor.refereeGuardia, Hélio Guardia
dc.contributor.refereeBarddal, Jean Paul
dc.contributor.refereeLatteshttp://lattes.cnpq.br/1780902767520967
dc.contributor.refereeLatteshttp://lattes.cnpq.br/5862618116527136
dc.contributor.refereeorcidhttps://orcid.org/0000-0001-5010-747X
dc.contributor.refereeorcidhttps://orcid.org/0000-0001-9928-854X
dc.date.accessioned2026-04-24T19:42:59Z
dc.date.issued2026-03-13
dc.description.abstractThe exponential increase in data volume and the dynamic nature of computer networks have imposed significant challenges on information security. In this context, classification in Continuous Data Streams (CDS) becomes essential, especially for Network Security Systems (NSS). These applications require techniques that handle memory constraints, processing time, and non-stationary data. This work proposes an adaptation of the Growing Self-Organizing Map (GSOM) for classifying firewall logs in CDS. The GSOM architecture was considered suitable, as it adjusts neuron weights to follow the gradual evolution of patterns and expands its structure to represent new behaviors as they emerge. For evaluation, real data from an operational firewall was used, classified into the actions “Allow”, “Deny”, “Reset-Both”, or “Drop”. The experiments followed an approach with offline (initial training) and online phases, where three update strategies were proposed: (1) nearest winner neuron location, keeping the map fixed; (2) dynamic map expansion, adding new neurons to represent emerging patterns; and (3) refinement of existing neuron weights, adjusting the map without altering its structure. The performance of the GSOM was evaluated in four temporal scenarios, including a combined scenario, and compared with established methods such as Incremental SVM and Adaptive Random Forest (ARF). The comparison established an upper bound of performance for the ideal scenario of zerolabel latency. Although ARF demonstrated overall superiority, its high computational cost and dependence on immediate labeling limit its practical application. It is concluded that GSOM is a viable solution for real-world classification in CDS with infinite label latency, where complete supervision is operationally unfeasible.eng
dc.description.resumoO aumento exponencial no volume de dados e a natureza dinâmica das redes de computadores têm imposto desafios significativos à segurança da informação. Nesse contexto, a classificação de dados em Fluxo Contínuo de Dados (FCDs) torna-se essencial, especialmente em Sistemas de Segurança de Rede (SSR). Essas aplicações demandam técnicas que lidem com restrições de memória, de tempo de processamento e de dados não estacionários. Este trabalho propõe uma adaptação do Mapa Auto-Organizável Crescente (GSOM) para a classificação de registros de firewall em FCDs. A arquitetura do GSOM foi considerada ideal, pois ajusta os pesos dos neurônios para acompanhar a evolução gradual dos padrões e expande sua estrutura para representar novos comportamentos. Para avaliação, foram utilizados dados reais de um firewall em operação, classificados nas ações “allow”, “deny”, “reset-both” ou “drop”. Os experimentos seguiram uma abordagem em fases offline (treinamento inicial) e online, em que três estratégias de atualização foram propostas: (1) localização do neurônio vencedor mais próximo, mantendo o mapa fixo; (2) expansão dinâmica do mapa, adicionando novos neurônios para representar padrões emergentes; e (3) refinamento dos pesos dos neurônios existentes, ajustando o mapa sem alterar sua estrutura. O desempenho do GSOM foi avaliado em quatro cenários temporais, incluindo um cenário combinado, e comparado com métodos estabelecidos como Incremental SVM e Adaptive Random Forest (ARF). A comparação estabeleceu um limite superior de desempenho para o cenário ideal de latência nula dos rótulos. Embora o ARF tenha demonstrado superioridade geral, seu alto custo computacional e a dependência de rotulação imediata limitam sua aplicação prática. Conclui-se que o GSOM constitui uma solução viável para o cenário de classificação em FCDs com latência infinita de rótulos, em que a supervisão completa é operacionalmente inviável.por
dc.description.sponsorshipNão recebi financiamento
dc.identifier.citationGIARINI, Wagner Rafael. Mapas auto-organizáveis crescentes para classificação de logs de firewall em fluxos contínuos de dados. 2026. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2026. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23989.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/23989
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCC
dc.relation.urihttps://sol.sbc.org.br/index.php/eniac/article/view/38781/38554
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectFluxos contínuos de dadospor
dc.subjectMapas auto-organizáveispor
dc.subjectLogs de frewallpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.subject.ods9. Indústria, Inovação e Infraestrutura
dc.titleMapas auto-organizáveis crescentes para classificação de logs de firewall em fluxos contínuos de dadospor
dc.title.alternativeGrowing self-organizing maps for classification of firewall logs in data streamseng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao_Wagner_PPGCC.pdf
Tamanho:
26.18 MB
Formato:
Adobe Portable Document Format