Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS

dc.contributor.advisor1Senger, Hermes
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3691742159298316
dc.contributor.advisor1orcidhttps://orcid.org/0000-0003-1273-9809
dc.contributor.authorFreire, Yuri Nicolau
dc.contributor.authorlatteshttp://lattes.cnpq.br/3311132346029835
dc.date.accessioned2025-03-21T17:29:07Z
dc.date.issued2025-02-25
dc.description.abstractHigh-performance computing (HPC) plays a crucial role in various scientific fields, and the use of GPUs for parallel computing has proven to be an efficient solution for large-scale problems, such as Full Waveform Inversion (FWI) in seismic simulations. This work proposes the implementation of domain decomposition, checkpointing, and data compression techniques in an FWI application executed on multiple GPUs, aiming to optimize computational performance and reduce memory usage. The research was conducted in three main stages: familiarization with the existing codebase, study of checkpointing and data compression techniques, and implementing domain decomposition in a multi-GPU environment. The domain decomposition strategy was applied by subdividing the three-dimensional grid into "slices," allowing distributed execution across multiple devices. Explicit control over data allocation and transfer between the CPU and GPUs, using OpenMP and nvcomp, enabled greater efficiency in memory management and data transfers. Experimental results, performed on a node with 4 NVidia V100 GPUs connected via NVLink, showed that the use of multiple GPUs offers significant performance gains for large-scale problems. For smaller problems, the overhead associated with data transfer between devices neutralizes the benefits of parallelism. The combination of checkpointing and data compression resulted in improvements in memory usage and communication between devices, particularly in larger domains and with more iterations. This work contributes to the advancement of FWI applications in distributed computing environments, providing a scalable and efficient solution for large-scale scientific problems.eng
dc.description.resumoA computação de alto desempenho (HPC) desempenha um papel crucial em diversas áreas científicas, e o uso de GPUs para computação paralela tem se mostrado uma solução eficiente para problemas de grande escala, como a inversão de forma de onda completa (FWI) em simulações sísmicas. Este trabalho propõe a implementação de técnicas de decomposição de domínio, checkpointing e compressão de dados em uma aplicação FWI executada em múltiplas GPUs, com o objetivo de otimizar o desempenho computacional e reduzir o uso de memória. A pesquisa foi realizada em três etapas principais: a familiarização com a base de código existente, o estudo das técnicas de checkpointing e compressão de dados, e a implementação da decomposição de domínio em um ambiente multi-GPU. A estratégia de decomposição de domínio foi aplicada por meio da subdivisão do grid tridimensional em "fatias", permitindo a execução distribuída entre múltiplos dispositivos. O controle explícito da alocação e transferência de dados entre a CPU e as GPUs, utilizando OpenMP e nvcomp, possibilitou uma maior eficiência na gestão da memória e nas transferências de dados. Os resultados experimentais, realizados em um nó com 4 GPUs NVidia V100 conectadas via NVLink, mostraram que a utilização de múltiplas GPUs oferece ganhos significativos de desempenho, principalmente para problemas de grande escala. Para problemas menores, o overhead associado à transferência de dados entre dispositivos neutraliza os benefícios do paralelismo. A combinação de checkpointing e compressão de dados resultou em melhorias no uso de memória e na comunicação entre dispositivos, destacando-se especialmente em domínios maiores e com maior número de iterações. Este trabalho contribui para o avanço das aplicações de FWI em ambientes de computação distribuída, oferecendo uma solução escalável e eficiente para problemas científicos de grande porte.
dc.description.sponsorshipFinanciadora de Estudos e Projetos (FINEP)
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipIdProcessos n° 2019/26702-8, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipIdProcessos n° 2021/00199-8, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipIdProcessos n° 2023/00566-6, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipIdProcesso 302296/2023-9, Conselho Nacional de Pesquisa e Desenvolvimento-CNPq
dc.description.sponsorshipIdConvênio 01.23.0575.00 - 0381/23, Financiadora de Estudos e Projetos - FINEP / Ministério da Ciência, Tecnologia e Inovações - MCTI / Fundo Nacional de Desenvolvimento Científico e Tecnológico – FNDCT
dc.identifier.citationFREIRE, Yuri Nicolau. Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21616.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/21616
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.courseEngenharia de Computação - EC
dc.publisher.initialsUFSCar
dc.rightsAttribution 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.subjectFWI
dc.subjectCUDA
dc.subjectOpenMP
dc.subjectDomain decomposition
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.titleIntegrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS
dc.title.alternativeIntegrating checkpointing and data compression of a FWI Solver with OpenMP on multi-GPUSeng
dc.typeTCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC.pdf
Tamanho:
1.34 MB
Formato:
Adobe Portable Document Format

Coleções