Mostrar el registro sencillo del ítem

dc.contributor.authorTavares, Thayana Vieira
dc.date.accessioned2022-01-20T21:25:28Z
dc.date.available2022-01-20T21:25:28Z
dc.date.issued2021-12-17
dc.identifier.citationTAVARES, Thayana Vieira. Aprendizado de Máquina para classificação das linhagens de Copia e Gypsy de angiospermas. 2021. Trabalho de Conclusão de Curso (Graduação em Biotecnologia) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15496.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/15496
dc.description.abstractThis study used machine learning algorithms (neural network, decision tree and close neighbors algorithm) to create classification models of 11 lineages of the Copia and Gypsy superfamilies, using angiosperm DNA sequences as training. Of eight models, three were efficient and were able to satisfactorily classify the sequences, in addition to being potentially efficient in classifying data from angiosperm species that were not in the dataset used for training. A comparison of the classification of the three most efficient models was also carried out with the prediction made by the Blast program, which has an algorithm based on sequence alignment, as a result, excellent classification metrics were obtained, however, considering 80% identity and 80 % coverage for there to be a prediction, it failed to classify 30% of the sequences.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectRetrotransposonspor
dc.subjectAprendizado de máquinapor
dc.subjectClassificaçãopor
dc.titleAprendizado de Máquina para classificação das linhagens de Copia e Gypsy de angiospermaspor
dc.title.alternativeMachine learning for classification of Copia and Gypsy strains of angiospermseng
dc.typeTCCpor
dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512por
dc.description.resumoEste estudo utilizou algoritmos de aprendizado de máquina (rede neural, árvore de decisão e algoritmo dos vizinhos próximos) para criar modelos de classificação de 11 linhagens das superfamílias Copia e Gypsy, utilizando como treinamento sequências de DNA de angiospermas. De oito modelos, três se mostraram eficientes e conseguiram classificar satisfatoriamente as sequências, além de se mostrarem potencialmente eficiente na classificação de dados de espécies de angiospermas que não estavam no conjunto de dados usado para treino. Também foi realizado comparação da classificação dos três modelos mais eficientes com a predição feita pelo programa Blast, o qual possui um algoritmo baseado em alinhamento de sequências, como resultado, obteve-se excelentes métricas de classificação, todavia, considerando 80% de identidade e 80% de cobertura para que houvesse uma predição, este não conseguiu classificar 30% das sequências.por
dc.publisher.initialsUFSCarpor
dc.subject.cnpqCIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULARpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/6055583178395953por
dc.publisher.courseBiotecnologia - Biotecpor


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 Brazil