Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS
| dc.contributor.advisor1 | Senger, Hermes | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3691742159298316 | |
| dc.contributor.advisor1orcid | https://orcid.org/0000-0003-1273-9809 | |
| dc.contributor.author | Freire, Yuri Nicolau | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/3311132346029835 | |
| dc.date.accessioned | 2025-03-21T17:29:07Z | |
| dc.date.issued | 2025-02-25 | |
| dc.description.abstract | High-performance computing (HPC) plays a crucial role in various scientific fields, and the use of GPUs for parallel computing has proven to be an efficient solution for large-scale problems, such as Full Waveform Inversion (FWI) in seismic simulations. This work proposes the implementation of domain decomposition, checkpointing, and data compression techniques in an FWI application executed on multiple GPUs, aiming to optimize computational performance and reduce memory usage. The research was conducted in three main stages: familiarization with the existing codebase, study of checkpointing and data compression techniques, and implementing domain decomposition in a multi-GPU environment. The domain decomposition strategy was applied by subdividing the three-dimensional grid into "slices," allowing distributed execution across multiple devices. Explicit control over data allocation and transfer between the CPU and GPUs, using OpenMP and nvcomp, enabled greater efficiency in memory management and data transfers. Experimental results, performed on a node with 4 NVidia V100 GPUs connected via NVLink, showed that the use of multiple GPUs offers significant performance gains for large-scale problems. For smaller problems, the overhead associated with data transfer between devices neutralizes the benefits of parallelism. The combination of checkpointing and data compression resulted in improvements in memory usage and communication between devices, particularly in larger domains and with more iterations. This work contributes to the advancement of FWI applications in distributed computing environments, providing a scalable and efficient solution for large-scale scientific problems. | eng |
| dc.description.resumo | A computação de alto desempenho (HPC) desempenha um papel crucial em diversas áreas científicas, e o uso de GPUs para computação paralela tem se mostrado uma solução eficiente para problemas de grande escala, como a inversão de forma de onda completa (FWI) em simulações sísmicas. Este trabalho propõe a implementação de técnicas de decomposição de domínio, checkpointing e compressão de dados em uma aplicação FWI executada em múltiplas GPUs, com o objetivo de otimizar o desempenho computacional e reduzir o uso de memória. A pesquisa foi realizada em três etapas principais: a familiarização com a base de código existente, o estudo das técnicas de checkpointing e compressão de dados, e a implementação da decomposição de domínio em um ambiente multi-GPU. A estratégia de decomposição de domínio foi aplicada por meio da subdivisão do grid tridimensional em "fatias", permitindo a execução distribuída entre múltiplos dispositivos. O controle explícito da alocação e transferência de dados entre a CPU e as GPUs, utilizando OpenMP e nvcomp, possibilitou uma maior eficiência na gestão da memória e nas transferências de dados. Os resultados experimentais, realizados em um nó com 4 GPUs NVidia V100 conectadas via NVLink, mostraram que a utilização de múltiplas GPUs oferece ganhos significativos de desempenho, principalmente para problemas de grande escala. Para problemas menores, o overhead associado à transferência de dados entre dispositivos neutraliza os benefícios do paralelismo. A combinação de checkpointing e compressão de dados resultou em melhorias no uso de memória e na comunicação entre dispositivos, destacando-se especialmente em domínios maiores e com maior número de iterações. Este trabalho contribui para o avanço das aplicações de FWI em ambientes de computação distribuída, oferecendo uma solução escalável e eficiente para problemas científicos de grande porte. | |
| dc.description.sponsorship | Financiadora de Estudos e Projetos (FINEP) | |
| dc.description.sponsorship | Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) | |
| dc.description.sponsorship | Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) | |
| dc.description.sponsorshipId | Processos n° 2019/26702-8, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) | |
| dc.description.sponsorshipId | Processos n° 2021/00199-8, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) | |
| dc.description.sponsorshipId | Processos n° 2023/00566-6, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) | |
| dc.description.sponsorshipId | Processo 302296/2023-9, Conselho Nacional de Pesquisa e Desenvolvimento-CNPq | |
| dc.description.sponsorshipId | Convênio 01.23.0575.00 - 0381/23, Financiadora de Estudos e Projetos - FINEP / Ministério da Ciência, Tecnologia e Inovações - MCTI / Fundo Nacional de Desenvolvimento Científico e Tecnológico – FNDCT | |
| dc.identifier.citation | FREIRE, Yuri Nicolau. Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21616. | por |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/21616 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Campus São Carlos | |
| dc.publisher.course | Engenharia de Computação - EC | |
| dc.publisher.initials | UFSCar | |
| dc.rights | Attribution 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | |
| dc.subject | FWI | |
| dc.subject | CUDA | |
| dc.subject | OpenMP | |
| dc.subject | Domain decomposition | |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO | |
| dc.title | Integrando checkpointing e compressão de dados de um Solver FWI com OpenMP em multi-GPUS | |
| dc.title.alternative | Integrating checkpointing and data compression of a FWI Solver with OpenMP on multi-GPUS | eng |
| dc.type | TCC |
Arquivos
Pacote Original
1 - 1 de 1