Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS

Freire, Yuri Nicolau

Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS

dc.contributor.advisor1	Senger, Hermes
dc.contributor.advisor1Lattes	https://lattes.cnpq.br/3691742159298316
dc.contributor.advisor1orcid	https://orcid.org/0000-0003-1273-9809
dc.contributor.author	Freire, Yuri Nicolau
dc.contributor.authorlattes	https://lattes.cnpq.br/3311132346029835
dc.date.accessioned	2025-03-21T17:29:07Z
dc.date.issued	2025-02-25
dc.description.abstract	High-performance computing (HPC) plays a crucial role in various scientific fields, and the use of GPUs for parallel computing has proven to be an efficient solution for large-scale problems, such as Full Waveform Inversion (FWI) in seismic simulations. This work proposes the implementation of domain decomposition, checkpointing, and data compression techniques in an FWI application executed on multiple GPUs, aiming to optimize computational performance and reduce memory usage. The research was conducted in three main stages: familiarization with the existing codebase, study of checkpointing and data compression techniques, and implementing domain decomposition in a multi-GPU environment. The domain decomposition strategy was applied by subdividing the three-dimensional grid into "slices," allowing distributed execution across multiple devices. Explicit control over data allocation and transfer between the CPU and GPUs, using OpenMP and nvcomp, enabled greater efficiency in memory management and data transfers. Experimental results, performed on a node with 4 NVidia V100 GPUs connected via NVLink, showed that the use of multiple GPUs offers significant performance gains for large-scale problems. For smaller problems, the overhead associated with data transfer between devices neutralizes the benefits of parallelism. The combination of checkpointing and data compression resulted in improvements in memory usage and communication between devices, particularly in larger domains and with more iterations. This work contributes to the advancement of FWI applications in distributed computing environments, providing a scalable and efficient solution for large-scale scientific problems.	eng
dc.description.resumo	A computação de alto desempenho (HPC) desempenha um papel crucial em diversas áreas científicas, e o uso de GPUs para computação paralela tem se mostrado uma solução eficiente para problemas de grande escala, como a inversão de forma de onda completa (FWI) em simulações sísmicas. Este trabalho propõe a implementação de técnicas de decomposição de domínio, checkpointing e compressão de dados em uma aplicação FWI executada em múltiplas GPUs, com o objetivo de otimizar o desempenho computacional e reduzir o uso de memória. A pesquisa foi realizada em três etapas principais: a familiarização com a base de código existente, o estudo das técnicas de checkpointing e compressão de dados, e a implementação da decomposição de domínio em um ambiente multi-GPU. A estratégia de decomposição de domínio foi aplicada por meio da subdivisão do grid tridimensional em "fatias", permitindo a execução distribuída entre múltiplos dispositivos. O controle explícito da alocação e transferência de dados entre a CPU e as GPUs, utilizando OpenMP e nvcomp, possibilitou uma maior eficiência na gestão da memória e nas transferências de dados. Os resultados experimentais, realizados em um nó com 4 GPUs NVidia V100 conectadas via NVLink, mostraram que a utilização de múltiplas GPUs oferece ganhos significativos de desempenho, principalmente para problemas de grande escala. Para problemas menores, o overhead associado à transferência de dados entre dispositivos neutraliza os benefícios do paralelismo. A combinação de checkpointing e compressão de dados resultou em melhorias no uso de memória e na comunicação entre dispositivos, destacando-se especialmente em domínios maiores e com maior número de iterações. Este trabalho contribui para o avanço das aplicações de FWI em ambientes de computação distribuída, oferecendo uma solução escalável e eficiente para problemas científicos de grande porte.
dc.description.sponsorship	Financiadora de Estudos e Projetos (FINEP)
dc.description.sponsorship	Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
dc.description.sponsorship	Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipId	Processos n° 2019/26702-8, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipId	Processos n° 2021/00199-8, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipId	Processos n° 2023/00566-6, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipId	Processo 302296/2023-9, Conselho Nacional de Pesquisa e Desenvolvimento-CNPq
dc.description.sponsorshipId	Convênio 01.23.0575.00 - 0381/23, Financiadora de Estudos e Projetos - FINEP / Ministério da Ciência, Tecnologia e Inovações - MCTI / Fundo Nacional de Desenvolvimento Científico e Tecnológico – FNDCT
dc.identifier.citation	FREIRE, Yuri Nicolau. Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21616.	por
dc.identifier.uri	https://hdl.handle.net/20.500.14289/21616
dc.language.iso	por
dc.publisher	Universidade Federal de São Carlos
dc.publisher.address	Campus São Carlos
dc.publisher.course	Engenharia de Computação - EC
dc.publisher.initials	UFSCar
dc.rights	Attribution 3.0 Brazil	en
dc.rights.uri	http://creativecommons.org/licenses/by/3.0/br/
dc.subject	FWI
dc.subject	CUDA
dc.subject	OpenMP
dc.subject	Domain decomposition
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.title	Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS
dc.title.alternative	Integrating checkpointing and data compression of a FWI Solver with OpenMP on multi-GPUS	eng
dc.type	TCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: TCC.pdf
Tamanho:: 1.34 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

TCC