Regressão simbólica em redes complexas

dc.contributor.advisor-co1Previdelli, Isolde Terezina
dc.contributor.advisor-co1Lattesttps://lattes.cnpq.br/0295127877081690
dc.contributor.advisor-co1orcidhttps://orcid.org/0000-0002-8686-420X
dc.contributor.advisor1Rodrigues, Francisco Apareciso
dc.contributor.advisor1Latteshttps://lattes.cnpq.br/2153014839354888
dc.contributor.advisor1orcidhttps://lattes.cnpq.br/2153014839354888
dc.contributor.authorBrum, Beatriz Regina
dc.contributor.authorlatteshttps://lattes.cnpq.br/9057626595103608
dc.contributor.authororcidhttps://orcid.org/0000-0001-9360-4329
dc.contributor.refereeRodrigues, Francisco Aparecido
dc.contributor.refereeIzbicki , Rafael
dc.contributor.refereeSouza, Eniuce Menezes de
dc.contributor.refereeRibeiro, Matheus Henrique Dal Molin
dc.contributor.refereeOliveira, Willian Luís de
dc.contributor.refereeLatteshttps://lattes.cnpq.br/2153014839354888
dc.contributor.refereeLatteshttps://lattes.cnpq.br/9991192137633896
dc.contributor.refereeLatteshttps://lattes.cnpq.br/0029713017048136
dc.contributor.refereeLatteshttps://lattes.cnpq.br/2531836774466938
dc.contributor.refereeLatteshttps://lattes.cnpq.br/4423792653643417
dc.contributor.refereeorcidhttps://orcid.org/0000-0002-0145-5571
dc.contributor.refereeorcidhttps://orcid.org/0000-0003-0379-9690
dc.contributor.refereeorcidhttps://orcid.org/0000-0003-0265-7586
dc.contributor.refereeorcidhttps://orcid.org/0000-0001-7387-9077
dc.contributor.refereeorcidhttps://orcid.org/0000-0002-2941-9804
dc.date.accessioned2026-03-12T15:04:43Z
dc.date.issued2026-02-20
dc.description.abstractDiscovering the equations that govern a system from observations is fundamental in several areas of science, as it enables both understanding its properties and predicting future behavior. Recently, machine learning techniques based on symbolic regression have emerged as an automated alternative for this task, with the advantage of not requiring prior domain knowledge to effectively describe dynamical systems, although they may benefit from such knowledge to refine the obtained equations. This study aims to develop a new methodology for the analysis and inference of complex phenomena by analyzing and comparing the performance of multiple symbolic regression algorithms in identifying epidemic dynamical systems across different propagation environments. Traditionally, temporal dynamics analyses rely on sequentially organized linear data, an approach that is limited when studying systems in which interconnections among elements and recurrent interactions decisively influence their evolution. To overcome this limitation, the research was structured into two approaches: the first using data from homogeneous environments and the second from heterogeneous environments. In both cases, symbolic regression algorithms were applied, using the fit obtained from Random Forest models as a reference. The effectiveness of the methods was evaluated through descriptive analysis and the application of the Wilcoxon test to assess significant differences between real and estimated dynamics. In the second approach, inferential statistical analysis was included to investigate the influence of network topology on the accuracy of the regressors. The results show that some algorithms, such as SINDy, SR, and MultKAN, demonstrated a high capacity to reconstruct the underlying dynamics in both approaches, with SR achieving the best performance among them. However, no significant effects of network topology were detected on algorithm performance, except with respect to R2, which was already expected. These findings indicate that the learned equations proved to be generalizable to the scenarios described here, regardless of the structural characteristics of the propagation environment, thereby supporting their potential implementation in real-world public health settings.eng
dc.description.resumoDescobrir as equações que regem um sistema a partir de observações é fundamental em diversas áreas da ciência, permitindo tanto compreender suas propriedades quanto prever comportamentos futuros. Recentemente, técnicas de aprendizado de máquina baseadas em regressão simbólica emergiram como alternativa automatizada para essa tarefa, com a vantagem de não exigir conhecimento prévio do domínio para descrever sistemas dinâmicos de forma eficaz, embora possam se beneficiar desse conhecimento para refinar as equações obtidas. Este estudo busca desenvolver uma nova metodologia para a análise e inferência de fenômenos complexos, analisando e comparando a eficácia de múltiplos algoritmos de regressão simbólica na identificação de sistemas dinâmicos epidêmicos em diferentes meios de propagação. Tradicionalmente, as análises de dinâmica temporal baseiam-se em dados sequenciais organizados linearmente, abordagem que se mostra limitada para o estudo de sistemas nos quais as interconexões entre elementos e as interações recorrentes influenciam decisivamente sua evolução. Para superar essa limitação, a pesquisa organizou-se em duas vertentes: a primeira utilizando dados de meio homogêneo e a segunda, de meios heterogêneos. Em ambas, aplicaram-se algoritmos de regressão simbólica, utilizando como referência o ajuste obtido por modelos de Floresta Aleatória. A eficácia dos métodos foi avaliada por meio de análise descritiva e da aplicação do teste de Wilcoxon, a fim de verificar diferenças significativas entre as dinâmicas reais e as estimadas. Na segunda vertente, incluiu-se análise estatística inferencial para investigar a influência da topologia da rede na precisão dos regressores. Os resultados demonstram que alguns algoritmos, como SINDy, SR e MultKAN, apresentaram alta capacidade de reconstrução das dinâmicas subjacentes em ambas as vertentes, sendo o SR o que apresentou melhor desempenho entre eles. Contudo, não foram detectados efeitos significativos da topologia da rede no desempenho dos algoritmos, exceto em relação ao R2, o que já era esperado. Esses achados indicam que as equações aprendidas revelaram-se generalizáveis para os cenários aqui descritos, independentemente das características estruturais do meio de propagação, o que viabiliza sua potencial implementação em contextos reais de saúde pública.por
dc.description.sponsorshipNão recebi financiamento
dc.identifier.citationBRUM, Beatriz Regina. Regressão simbólica em redes complexas. 2026. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2026. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23765.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/23765
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.relation.urihttps://iopscience.iop.org/article/10.1088/2632-072X/ae3eed
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectSistemas dinâmicos complexospor
dc.subjectSistemas dinâmicos complexospor
dc.subjectRedes complexaspor
dc.subjectSymbolic regressioneng
dc.subjectComplex dynamic systemseng
dc.subjectComplex networkseng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.ods3. Saúde e Bem-Estar
dc.titleRegressão simbólica em redes complexaspor
dc.title.alternativeSymbolic regression in complex networkseng
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese_beatriz_brum_2026.pdf
Tamanho:
4.03 MB
Formato:
Adobe Portable Document Format