Regressão simbólica em redes complexas
| dc.contributor.advisor-co1 | Previdelli, Isolde Terezina | |
| dc.contributor.advisor-co1Lattes | ttps://lattes.cnpq.br/0295127877081690 | |
| dc.contributor.advisor-co1orcid | https://orcid.org/0000-0002-8686-420X | |
| dc.contributor.advisor1 | Rodrigues, Francisco Apareciso | |
| dc.contributor.advisor1Lattes | https://lattes.cnpq.br/2153014839354888 | |
| dc.contributor.advisor1orcid | https://lattes.cnpq.br/2153014839354888 | |
| dc.contributor.author | Brum, Beatriz Regina | |
| dc.contributor.authorlattes | https://lattes.cnpq.br/9057626595103608 | |
| dc.contributor.authororcid | https://orcid.org/0000-0001-9360-4329 | |
| dc.contributor.referee | Rodrigues, Francisco Aparecido | |
| dc.contributor.referee | Izbicki , Rafael | |
| dc.contributor.referee | Souza, Eniuce Menezes de | |
| dc.contributor.referee | Ribeiro, Matheus Henrique Dal Molin | |
| dc.contributor.referee | Oliveira, Willian Luís de | |
| dc.contributor.refereeLattes | https://lattes.cnpq.br/2153014839354888 | |
| dc.contributor.refereeLattes | https://lattes.cnpq.br/9991192137633896 | |
| dc.contributor.refereeLattes | https://lattes.cnpq.br/0029713017048136 | |
| dc.contributor.refereeLattes | https://lattes.cnpq.br/2531836774466938 | |
| dc.contributor.refereeLattes | https://lattes.cnpq.br/4423792653643417 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0002-0145-5571 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0003-0379-9690 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0003-0265-7586 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0001-7387-9077 | |
| dc.contributor.refereeorcid | https://orcid.org/0000-0002-2941-9804 | |
| dc.date.accessioned | 2026-03-12T15:04:43Z | |
| dc.date.issued | 2026-02-20 | |
| dc.description.abstract | Discovering the equations that govern a system from observations is fundamental in several areas of science, as it enables both understanding its properties and predicting future behavior. Recently, machine learning techniques based on symbolic regression have emerged as an automated alternative for this task, with the advantage of not requiring prior domain knowledge to effectively describe dynamical systems, although they may benefit from such knowledge to refine the obtained equations. This study aims to develop a new methodology for the analysis and inference of complex phenomena by analyzing and comparing the performance of multiple symbolic regression algorithms in identifying epidemic dynamical systems across different propagation environments. Traditionally, temporal dynamics analyses rely on sequentially organized linear data, an approach that is limited when studying systems in which interconnections among elements and recurrent interactions decisively influence their evolution. To overcome this limitation, the research was structured into two approaches: the first using data from homogeneous environments and the second from heterogeneous environments. In both cases, symbolic regression algorithms were applied, using the fit obtained from Random Forest models as a reference. The effectiveness of the methods was evaluated through descriptive analysis and the application of the Wilcoxon test to assess significant differences between real and estimated dynamics. In the second approach, inferential statistical analysis was included to investigate the influence of network topology on the accuracy of the regressors. The results show that some algorithms, such as SINDy, SR, and MultKAN, demonstrated a high capacity to reconstruct the underlying dynamics in both approaches, with SR achieving the best performance among them. However, no significant effects of network topology were detected on algorithm performance, except with respect to R2, which was already expected. These findings indicate that the learned equations proved to be generalizable to the scenarios described here, regardless of the structural characteristics of the propagation environment, thereby supporting their potential implementation in real-world public health settings. | eng |
| dc.description.resumo | Descobrir as equações que regem um sistema a partir de observações é fundamental em diversas áreas da ciência, permitindo tanto compreender suas propriedades quanto prever comportamentos futuros. Recentemente, técnicas de aprendizado de máquina baseadas em regressão simbólica emergiram como alternativa automatizada para essa tarefa, com a vantagem de não exigir conhecimento prévio do domínio para descrever sistemas dinâmicos de forma eficaz, embora possam se beneficiar desse conhecimento para refinar as equações obtidas. Este estudo busca desenvolver uma nova metodologia para a análise e inferência de fenômenos complexos, analisando e comparando a eficácia de múltiplos algoritmos de regressão simbólica na identificação de sistemas dinâmicos epidêmicos em diferentes meios de propagação. Tradicionalmente, as análises de dinâmica temporal baseiam-se em dados sequenciais organizados linearmente, abordagem que se mostra limitada para o estudo de sistemas nos quais as interconexões entre elementos e as interações recorrentes influenciam decisivamente sua evolução. Para superar essa limitação, a pesquisa organizou-se em duas vertentes: a primeira utilizando dados de meio homogêneo e a segunda, de meios heterogêneos. Em ambas, aplicaram-se algoritmos de regressão simbólica, utilizando como referência o ajuste obtido por modelos de Floresta Aleatória. A eficácia dos métodos foi avaliada por meio de análise descritiva e da aplicação do teste de Wilcoxon, a fim de verificar diferenças significativas entre as dinâmicas reais e as estimadas. Na segunda vertente, incluiu-se análise estatística inferencial para investigar a influência da topologia da rede na precisão dos regressores. Os resultados demonstram que alguns algoritmos, como SINDy, SR e MultKAN, apresentaram alta capacidade de reconstrução das dinâmicas subjacentes em ambas as vertentes, sendo o SR o que apresentou melhor desempenho entre eles. Contudo, não foram detectados efeitos significativos da topologia da rede no desempenho dos algoritmos, exceto em relação ao R2, o que já era esperado. Esses achados indicam que as equações aprendidas revelaram-se generalizáveis para os cenários aqui descritos, independentemente das características estruturais do meio de propagação, o que viabiliza sua potencial implementação em contextos reais de saúde pública. | por |
| dc.description.sponsorship | Não recebi financiamento | |
| dc.identifier.citation | BRUM, Beatriz Regina. Regressão simbólica em redes complexas. 2026. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2026. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23765. | por |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/23765 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Câmpus São Carlos | |
| dc.publisher.initials | UFSCar | |
| dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | |
| dc.relation.uri | https://iopscience.iop.org/article/10.1088/2632-072X/ae3eed | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Sistemas dinâmicos complexos | por |
| dc.subject | Sistemas dinâmicos complexos | por |
| dc.subject | Redes complexas | por |
| dc.subject | Symbolic regression | eng |
| dc.subject | Complex dynamic systems | eng |
| dc.subject | Complex networks | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA | |
| dc.subject.ods | 3. Saúde e Bem-Estar | |
| dc.title | Regressão simbólica em redes complexas | por |
| dc.title.alternative | Symbolic regression in complex networks | eng |
| dc.type | Tese |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- tese_beatriz_brum_2026.pdf
- Tamanho:
- 4.03 MB
- Formato:
- Adobe Portable Document Format