Processamento de dados e modelagem de séries temporais para detecção de anomalias em arquiteturas de microsserviço
| dc.contributor.advisor1 | Lucrédio, Daniel | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/9090396559596221 | |
| dc.contributor.author | Almeida, Maurício Gallera de | |
| dc.date.accessioned | 2025-12-19T14:28:26Z | |
| dc.date.issued | 2025-12-11 | |
| dc.description.abstract | Microservices architecture has gained widespread adoption due to its scalability and flexibility, but it also poses significant challenges for monitoring and fault detection. Manual analysis and simple statistical methods often result in false positives or negatives, hindering the accurate identification of anomalies. This work proposes a comprehensive methodology for anomaly detection in microservices environments through time series metric processing and the application of deep learning. As there was no access to real data, a plausible synthetic database was developed containing HTTP latency, Kafka lag, and CPU usage metrics, reproducing real problems such as different collection frequencies, temporal gaps, outliers, and decentralized distribution of metrics. Next, a preprocessing pipeline was developed involving temporal standardization, format transformation, missing data imputation, and information enrichment, among others. Simulated anomalies—representing common crashes in production—were then inserted into the dataset. Finally, an initial model based on 1D CNN was trained and evaluated for the task of binary classification between normal and anomalous behavior. The results obtained showed good precision, recall, and F1-score values, indicating the potential of the approach, although limited by the use of artificial data. The study demonstrates the feasibility of applying deep learning techniques for anomaly detection in distributed systems and lays the groundwork for future work with real data and more refined models | eng |
| dc.description.resumo | A arquitetura de microsserviços tem ganhado ampla adoção devido à sua escalabilidade e flexibilidade, mas também impõe desafios relevantes de monitoramento e detecção de falhas. Análises manuais e métodos estatísticos simples frequentemente resultam em falsos positivos ou negativos, prejudicando a identificação precisa de anomalias. Este trabalho propõe uma metodologia completa para detecção de anomalias em ambientes de microsserviços por meio de processamento de métricas de séries temporais e aplicação de Aprendizado Profundo. Como não houve acesso a dados reais, foi desenvolvida uma base sintética verossímil contendo métricas de latência HTTP, lag Kafka e uso de CPU, reproduzindo problemas reais como frequências distintas de coleta, lacunas temporais, outliers e distribuição descentralizada das métricas. Em seguida, elaborou-se um pipeline de pré-processamento envolvendo padronização temporal, transformação de formato, imputação de dados faltantes e enriquecimento informacional, dentre outros. Anomalias simuladas — representando crashes comuns em produção — foram posteriormente inseridas no conjunto de dados. Por fim, um modelo inicial baseado em CNN 1D foi treinado e avaliado para a tarefa de classificação binária entre comportamento normal e anômalo. Os resultados obtidos apresentaram bons valores de precisão, recall e F1-score, indicando o potencial da abordagem, ainda que limitada pelo uso de dados artificiais. O estudo demonstra a viabilidade de aplicar técnicas de aprendizado profundo para detecção de anomalias em sistemas distribuídos e estabelece bases para trabalhos futuros com dados reais e modelos mais refinados. | |
| dc.identifier.citation | ALMEIDA, Maurício Gallera de. Processamento de dados e modelagem de séries temporais para detecção de anomalias em arquiteturas de microsserviço. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/23316. | por |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/23316 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Campus São Carlos | |
| dc.publisher.course | Engenharia de Computação - EC | |
| dc.publisher.initials | UFSCar | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Detecção de anomalias | |
| dc.subject | Microsserviços | |
| dc.subject | Séries temporais | |
| dc.subject | Aprendizado profundo | |
| dc.subject | Redes neurais | |
| dc.subject | Pré-processamento de dados | |
| dc.subject | Anomaly detection | eng |
| dc.subject | Microservices | eng |
| dc.subject | Time series | eng |
| dc.subject | Deep learning | eng |
| dc.subject | Neural networks | eng |
| dc.subject | Data preprocessing | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | |
| dc.subject.ods | 9. Indústria, Inovação e Infraestrutura | |
| dc.title | Processamento de dados e modelagem de séries temporais para detecção de anomalias em arquiteturas de microsserviço | |
| dc.title.alternative | Data processing and time series modeling for anomaly detection in microservice architectures | eng |
| dc.type | TCC |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- tcc_mauricio__gallera_de_almeida_2025.pdf
- Tamanho:
- 496.74 KB
- Formato:
- Adobe Portable Document Format