Show simple item record

dc.contributor.authorFrajacomo, Henrique Cordeiro
dc.date.accessioned2022-04-21T12:25:39Z
dc.date.available2022-04-21T12:25:39Z
dc.date.issued2020-07-02
dc.identifier.citationFRAJACOMO, Henrique Cordeiro. Seleção de SNPs utilizando random forests. 2020. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15891.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/15891
dc.description.abstractSingle Nucleotide Polymorphisms (SNPs) are single-base variations in the nucleotide sequence of different individuals or between homologous sequences within a living being. A large part of genetic variations occur as SNPs. Many of these genetic variations occur in plants, influencing characteristics directly linked to crop productivity, such as rice. In addition to being the largest producer among Western countries, Brazil is also the largest per capita consumer of rice. Rice is one of the main foods for human nutrition, being the food base for more than half of the world population and mostly produced by Asian countries, but also widely produced in Brazil. Rice is part of the Genetic Improvement Program of the Brazilian Agricultural Research Corporation (Embrapa), which aims to improve rice crops with the goal of reaching the consumption preference pattern in Brazil. The Selection of SNPs that are strongly related to the amylose content of rice is one of the problems to be solved in Embrapa’s Genetic Improvement program. The Selection of SNPs can be modeled computationally using Machine Learning tools, a subarea of Artificial Intelligence, making analysis faster and less costly. Thus, the objective of this research is to develop a method capable of performing the SNP Selection task. That is, given a characteristic of an organism, the method must find the SNPs related to the given characteristic. As a test case, the method will be applied to the SNPs of the genomic content of different rice crops, in order to find out which SNPs had the greatest impact on their amylose content. The developed method proved to be efficient in solving the SNP Selection problem. The analysis of the method highlighted an SNP that was validated experimentally by Embrapa as important for the amylose content.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectSeleção de SNPspor
dc.subjectBioinformáticapor
dc.subjectAprendizado de máquinapor
dc.subjectSNP selectioneng
dc.subjectBioinformaticseng
dc.subjectMachine learningeng
dc.subjectRandom forestseng
dc.titleSeleção de SNPs utilizando random forestspor
dc.title.alternativeSNP Selection using random forestseng
dc.typeTCCpor
dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512por
dc.description.resumoOs Polimorfismos de Nucleotídeo Único (SNPs) são variações de base única na sequência de nucleotídeos de indivíduos diferentes ou entre sequências homólogas dentro de um ser vivo. Uma grande parte de variações genéticas ocorrem como SNPs. Muitas destas variações genéticas ocorrem em plantas, influenciando características diretamente ligadas com a produtividade de culturas, como por exemplo o arroz. O Brasil, além de ser o maior produtor dentre os países ocidentais, é também o maior consumidor per capita de arroz. O arroz é um dos principais alimentos para a nutrição humana, sendo a base alimentar para mais da metade da população mundial e majoritariamente produzido por países asiáticos, mas também largamente produzido no Brasil. O arroz faz parte do Programa de Melhoramento Genético da Empresa Brasileira de Pesquisa Agropecuária (Embrapa), que tem como objetivo a melhoria das safras de arroz mirando atingir o padrão de preferência de consumo do Brasil. A Seleção de SNPs que estão fortemente relacionadas com o teor de amilose do arroz é um dos problemas a serem resolvidos no programa de Melhoramento Genético da Embrapa. A Seleção de SNPs pode ser modelada computacionalmente utilizando ferramentas de Aprendizado de Máquina, subárea da Inteligência Artificial, tornando a análise mais rápida e menos custosa. Assim, o objetivo desta pesquisa é desenvolver um método capaz de realizar a tarefa de Seleção de SNPs. Isto é, dado uma característica de um organismo, o método deve encontrar os SNPs relacionados com a dada característica. Como caso de teste, o método será aplicado nos SNPs do conteúdo genômico de diferentes safras de arroz, com o objetivo de encontrar quais SNPs tiveram maior impacto em seu teor de amilose. O método desenvolvido se mostrou eficiente em resolver o problema da Seleção de SNPs. As análises do método destacaram um SNP que foi validado experimentalmente pela Embrapa como importante para o teor de amilose.por
dc.publisher.initialsUFSCarpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/6231011286979492por
dc.publisher.courseCiência da Computação - CCpor


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil