Estudo de associa̧ção genômica ampla para obesidade por meio de florestas aleatórias

dc.contributor.advisor1Cerqueira, Andressa
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1934493281651316
dc.contributor.authorLuzia, Milena Crnkovic
dc.contributor.authorlatteshttp://lattes.cnpq.br/5189523036986120
dc.date.accessioned2025-04-04T13:07:02Z
dc.date.issued2025-02-13
dc.description.abstractObesity is the result of an energy imbalance and has been growing significantly. However, not all individuals respond in the same way to the same environment, which may be due to genetic factors. According to (29), heritability can contribute around 40% to the variation of a disease. Therefore, notions of genetics are extremely important for a better understanding of chronic diseases such as obesity. Most cases of obesity are caused by the combination of several genetic variants of small effect, leading to various methodological and computational challenges. The statistical methods for Genome-Wide Association Studies (GWAS) commonly used for analyses are univariate, considering only one genetic marker (SNP) at a time. Consequently, such methods do not capture relationships between SNPs. The random forest method has been widely applied to biological data, as it supports high-dimensional data and can capture non-linear models based on genotypes. Therefore, the present study aims to identify genetic variants associated with obesity in a multifactorial manner using random forests. Using the importance measure of random forests and selecting the 99th percentile of its distribution, the results identified several SNPs associated with obesity and waist circumference, reinforcing the genetic complexity of these traits. One of the markers found was SNP rs478582, present in both analyses, suggesting a strong influence on the regulation of adiposity and body fat distribution. Many of the genes identified in the study are involved in metabolic and inflammatory processes, highlighting the importance of genetic factors in the predisposition to obesity. This reinforces the need for additional studies to deepen the understanding of the biological mechanisms related to obesity.eng
dc.description.resumoA obesidade é resultado de um desequilíbrio energético e vem crescendo drasticamente. Porém, nem todos os indivíduos respondem da mesma forma ao mesmo ambiente, o que pode ser resultado de fatores genéticos. Segundo (29), a herdabilidade pode contribuir com cerca de 40% para a variação de uma doença. Dessa forma, noções de genética são de extrema importância para uma melhor compreensão de doenças crônicas como a obesidade. A maioria dos casos de obesidade é causada pela combinação de diversas variantes genéticas de pequeno efeito. Assim, existem vários desafios metodológicos e computacionais. Os métodos estatísticos de Estudo de Associação Genômica Ampla (GWAS) usualmente utilizados para análises são univariados, considerando apenas um marcador genético (SNP) por vez. Logo, tais métodos não capturam relações entre SNPs. O método de florestas aleatórias tem sido largamente aplicado em dados biológicos, sendo um método que suporta dados de alta dimensionalidade e pode capturar modelos não lineares baseados em genótipos. Dessa forma, o presente trabalho pretende identificar variantes genéticas associadas à obesidade de forma multifatorial através de florestas aleatórias. Utilizando a medida de importância das florestas aleatórias e selecionando o quantil 99% de sua distribuição, os resultados identificaram diversos SNPs associados à obesidade e à circunferência da cintura, reforçando a complexidade genética dessas características. Um dos marcadores encontrados foi o SNP rs478582, presente em ambas as análises, sugerindo alta influência na regulação da adiposidade e na distribuição de gordura corporal. Muitos dos genes identificados no estudo estão envolvidos em processos metabólicos e inflamatórios, destacando a importância de fatores genéticos na predisposição à obesidade e reforçando a necessidade de estudos adicionais para aprofundar a compreensão dos mecanismos biológicos relacionados à obesidade.
dc.description.sponsorshipNão recebi financiamento
dc.identifier.citationLUZIA, Milena Crnkovic. Estudo de associa̧ção genômica ampla para obesidade por meio de florestas aleatórias. 2025. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21790.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/21790
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.courseEstatística - Es
dc.publisher.initialsUFSCar
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectAssociação
dc.subjectFlorestas aleatórias
dc.subjectGWAS
dc.subjectSNP
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
dc.titleEstudo de associa̧ção genômica ampla para obesidade por meio de florestas aleatórias
dc.title.alternativeGenome-wide association study for obesity through random forestseng
dc.typeTCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Monografia_TG2_Milena_final.pdf
Tamanho:
1.25 MB
Formato:
Adobe Portable Document Format

Coleções