Show simple item record

dc.contributor.authorBarros, Laís Rossetto Ferraz de
dc.date.accessioned2020-04-02T11:48:27Z
dc.date.available2020-04-02T11:48:27Z
dc.date.issued2020-03-06
dc.identifier.citationBARROS, Laís Rossetto Ferraz de. Comparação do desempenho de diferentes estratégias de montagem do genoma de Bertholletia excelsa Bonpl. (Lecythidaceae). 2020. Dissertação (Mestrado em Biotecnologia e Monitoramento Ambiental) – Universidade Federal de São Carlos, Sorocaba, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12390.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/12390
dc.description.abstractThe Brazil Nut (Bertholletia excelsa) is an arboreal species, native to the Amazon forest, by which there’s a concern referring to its ecological sustainability. Therefore, sequencing and assembling the genome might contribute to the conservation of genetic diversity and maintenance of natural populations, besides assisting the comprehension of the success of future populations. Therefore, the objectives are to assemble the genome of Bertholletia excelsa, compare different assembly methodologies, and define the methodology that results in the best quality. The methodology consisted in sequencing DNA samples from an adult individual of Bertholletia excelsa with Pacific Biosciences is Single Molecule Real Time. This step resulted in a genomic coverage of 187× and a N50 of raw reads of 14,02 kb. Following up, the haploid genome size was estimated from k-mer distribution (k=22), resulting in ~596Mpb. Subsequently, there were tested five assemblers (wtdbg2, MECAT2, SMARTdenovo, Flye and Canu) with six genomic coverages (47×, 63×, 97×, 126×, 187× and 60× with corrected reads by Canu). QUAST was used to compare the efficiency of these methods through the following parameters: contig N50, number of contigs, L50 and assembly size in relation to genome size estimative. BUSCO was used to determine the genomic completeness. The LAI score validated its quality, considering the contiguity and integrity of repetitive sequences. In conclusion, the best assembly was SMARTdenovo with genomic coverage of 187×, resulting in a contig N50 of ~2,6 Mb, genic completeness of 95,1% and LAI score of 10,53; totaling an assembly of 649.349.366 pb.por
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectMECAT2por
dc.subjectWtdbg2por
dc.subjectSMARTdenovo.por
dc.subjectCanupor
dc.subjectFlyepor
dc.titleComparação do desempenho de diferentes estratégias de montagem do genoma de Bertholletia excelsa Bonpl. (Lecythidaceae)por
dc.title.alternativePerformance comparison of different strategies for assembling the Bertholletia excelsa Bonpl. genome (Lecythidaceae)por
dc.typeDissertaçãopor
dc.contributor.advisor1Martins, Karina
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9367637840430435por
dc.description.resumoA Castanheira-do-Brasil (Bertholletia excelsa) é uma espécie arbórea nativa da Amazônia pela qual existe preocupação referente à sua sustentabilidade ecológica. Desse modo, sequenciar e montar seu genoma pode contribuir para definição de estratégias para a conservação da diversidade genética, manutenção das populações naturais, além de auxiliar na compreensão do sucesso de populações futuras. Portanto, os objetivos do projeto consistem em montar o genoma de Bertholletia excelsa, comparar diferentes metodologias de montagem, e definir a metodologia que obtenha a melhor qualidade. A metodologia consistiu em sequenciar amostras de DNA de um indivíduo adulto de Bertholletia excelsa com a tecnologia Single Molecule Real Time da Pacific Biosciences. Essa etapa, resultou em uma cobertura genômica de 187× e um N50 de reads brutas de 14,02 kb. Em seguida, procedeu-se com a estimativa do tamanho do genoma haploide a partir da distribuição k-mer, resultando em ~596 Mpb. Posteriormente, foram testados cinco assemblers (wtdbg2, MECAT2, SMARTdenovo, Flye e Canu) com seis coberturas genômicas (47×, 63×, 97×, 126×, 187× e 60× com reads corrigidas por Canu). QUAST foi utilizado para comparar a eficiência desses métodos através dos parâmetros: contig N50, número de contigs, L50 e tamanho da montagem em relação a estimativa do tamanho do genoma. BUSCO foi usado para determinar a completude gênica. LAI score validou a qualidade considerando a contiguidade e a integridade de sequências repetitivas. Dessa forma, conclui-se que a montagem com a melhor qualidade foi SMARTdenovo com cobertura genômica de 187×, resultando em um contig N50 de ~2,6 Mb, completude gênica de 95,1%, LAI score igual a 10,53; totalizando a montagem em 649.349.366 pb.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Biotecnologia e Monitoramento Ambiental - PPGBMA-Sopor
dc.subject.cnpqCIENCIAS BIOLOGICAS::GENETICApor
dc.description.sponsorshipIdCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001por
dc.publisher.addressCâmpus Sorocabapor
dc.contributor.authorlatteshttp://lattes.cnpq.br/3170045878886584por


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil