Mostrar el registro sencillo del ítem
Comparação do desempenho de diferentes estratégias de montagem do genoma de Bertholletia excelsa Bonpl. (Lecythidaceae)
dc.contributor.author | Barros, Laís Rossetto Ferraz de | |
dc.date.accessioned | 2020-04-02T11:48:27Z | |
dc.date.available | 2020-04-02T11:48:27Z | |
dc.date.issued | 2020-03-06 | |
dc.identifier.citation | BARROS, Laís Rossetto Ferraz de. Comparação do desempenho de diferentes estratégias de montagem do genoma de Bertholletia excelsa Bonpl. (Lecythidaceae). 2020. Dissertação (Mestrado em Biotecnologia e Monitoramento Ambiental) – Universidade Federal de São Carlos, Sorocaba, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12390. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/12390 | |
dc.description.abstract | The Brazil Nut (Bertholletia excelsa) is an arboreal species, native to the Amazon forest, by which there’s a concern referring to its ecological sustainability. Therefore, sequencing and assembling the genome might contribute to the conservation of genetic diversity and maintenance of natural populations, besides assisting the comprehension of the success of future populations. Therefore, the objectives are to assemble the genome of Bertholletia excelsa, compare different assembly methodologies, and define the methodology that results in the best quality. The methodology consisted in sequencing DNA samples from an adult individual of Bertholletia excelsa with Pacific Biosciences is Single Molecule Real Time. This step resulted in a genomic coverage of 187× and a N50 of raw reads of 14,02 kb. Following up, the haploid genome size was estimated from k-mer distribution (k=22), resulting in ~596Mpb. Subsequently, there were tested five assemblers (wtdbg2, MECAT2, SMARTdenovo, Flye and Canu) with six genomic coverages (47×, 63×, 97×, 126×, 187× and 60× with corrected reads by Canu). QUAST was used to compare the efficiency of these methods through the following parameters: contig N50, number of contigs, L50 and assembly size in relation to genome size estimative. BUSCO was used to determine the genomic completeness. The LAI score validated its quality, considering the contiguity and integrity of repetitive sequences. In conclusion, the best assembly was SMARTdenovo with genomic coverage of 187×, resulting in a contig N50 of ~2,6 Mb, genic completeness of 95,1% and LAI score of 10,53; totaling an assembly of 649.349.366 pb. | por |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | MECAT2 | por |
dc.subject | Wtdbg2 | por |
dc.subject | SMARTdenovo. | por |
dc.subject | Canu | por |
dc.subject | Flye | por |
dc.title | Comparação do desempenho de diferentes estratégias de montagem do genoma de Bertholletia excelsa Bonpl. (Lecythidaceae) | por |
dc.title.alternative | Performance comparison of different strategies for assembling the Bertholletia excelsa Bonpl. genome (Lecythidaceae) | por |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Martins, Karina | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/9367637840430435 | por |
dc.description.resumo | A Castanheira-do-Brasil (Bertholletia excelsa) é uma espécie arbórea nativa da Amazônia pela qual existe preocupação referente à sua sustentabilidade ecológica. Desse modo, sequenciar e montar seu genoma pode contribuir para definição de estratégias para a conservação da diversidade genética, manutenção das populações naturais, além de auxiliar na compreensão do sucesso de populações futuras. Portanto, os objetivos do projeto consistem em montar o genoma de Bertholletia excelsa, comparar diferentes metodologias de montagem, e definir a metodologia que obtenha a melhor qualidade. A metodologia consistiu em sequenciar amostras de DNA de um indivíduo adulto de Bertholletia excelsa com a tecnologia Single Molecule Real Time da Pacific Biosciences. Essa etapa, resultou em uma cobertura genômica de 187× e um N50 de reads brutas de 14,02 kb. Em seguida, procedeu-se com a estimativa do tamanho do genoma haploide a partir da distribuição k-mer, resultando em ~596 Mpb. Posteriormente, foram testados cinco assemblers (wtdbg2, MECAT2, SMARTdenovo, Flye e Canu) com seis coberturas genômicas (47×, 63×, 97×, 126×, 187× e 60× com reads corrigidas por Canu). QUAST foi utilizado para comparar a eficiência desses métodos através dos parâmetros: contig N50, número de contigs, L50 e tamanho da montagem em relação a estimativa do tamanho do genoma. BUSCO foi usado para determinar a completude gênica. LAI score validou a qualidade considerando a contiguidade e a integridade de sequências repetitivas. Dessa forma, conclui-se que a montagem com a melhor qualidade foi SMARTdenovo com cobertura genômica de 187×, resultando em um contig N50 de ~2,6 Mb, completude gênica de 95,1%, LAI score igual a 10,53; totalizando a montagem em 649.349.366 pb. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Biotecnologia e Monitoramento Ambiental - PPGBMA-So | por |
dc.subject.cnpq | CIENCIAS BIOLOGICAS::GENETICA | por |
dc.description.sponsorshipId | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001 | por |
dc.publisher.address | Câmpus Sorocaba | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/3170045878886584 | por |