Mostrar el registro sencillo del ítem

dc.contributor.authorFreire-Oliveira, Hiago
dc.date.accessioned2022-05-06T21:53:52Z
dc.date.available2022-05-06T21:53:52Z
dc.date.issued2022-04-26
dc.identifier.citationFREIRE-OLIVEIRA, Hiago. Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees. 2022. Trabalho de Conclusão de Curso (Graduação em Ciências Biológicas) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16064.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/16064
dc.description.abstractPIWI-interacting RNAs (PiRNAs) are a class of interfering RNAs whose actions range from regulating gene expression to fighting viral infections and silencing transposable elements, possessing unique characteristics such as being from 21 to 35 nucleotides long, displaying an uracil bias at the end 5' and 2'-O-methylation at the 3' end. Transposable elements (TEs) are genetic elements capable of moving between host genomes, being split into retrotransposons and DNA transposons. The replication of TEs can promote harmful recombination events by generating breaks in DNA double strands, in addition to interference in expression, considering that their promoters can lead to aberrant transcription of neighboring genes. Silencing of these elements by piRNAs occurs in the germ line in the majority of animals and is essential for the maintenance of genome integrity. The problem of in silico prediction of interaction between piRNAs and TEs was addressed by machine learning using a decision tree algorithm, namely Predictive Bi-Clustering Trees (PBCT). In order to improve the algorithm’s performance, the interaction matrix of piRNAs and TEs was reconstructed by means of an Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ) algorithm. PBCT was applied in 5-fold and 10-fold cross-validation configurations, both for the matrix without reconstruction (BICT) and for the matrix reconstructed by NRLMFβ (BICTR). In general, PBCT applied to this dataset was not able to predict positive interactions satisfactorily, behaving as a random classifier. Comparatively, in the BICT method, PBCT presented higher values of AUROC and AUPRC. However, in the BICTR method, PBCT was able to correctly predict more positive interactions, which are, in fact, the major interest in this study. Potential biological applications and ways to improve the algorithm’s performance were also considered.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectpiRNApor
dc.subjectElemento transponívelpor
dc.subjectPredição de interaçãopor
dc.subjectÁrvore de decisãopor
dc.subjectAprendizado de máquinapor
dc.titlePredição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering treespor
dc.title.alternativepiRNAs and transposable elements interaction prediction with predictive bi-clustering treeseng
dc.typeTCCpor
dc.contributor.advisor1Gabriel, Jane Eyre
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6757487143317098por
dc.contributor.advisor-co1Cerri, Ricardo
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/6266519868438512por
dc.description.resumoRNAs interagentes com PIWI (piRNAs) são uma classe de RNAs de interferência cujas ações variam de regulação da expressão gênica ao combate de infecções virais e silenciamento de elementos transponíveis, possuindo características únicas como tamanho de 21 a 35 nucleotídeos, viés de uracila na extremidade 5’ e 2’-O-metilação na extremidade 3’. Os elementos transponíveis (TEs) são elementos genéticos com capacidade de se moverem por entre os genomas hospedeiros, sendo divididos entre retrotransposons e transposons de DNA. A replicação dos TEs pode promover eventos recombinatórios danosos pela geração de quebras nas duplas-fitas de DNA, além de interferências na expressão, uma vez que seus promotores podem levar a uma transcrição aberrante dos genes vizinhos. O silenciamento desses elementos pelos piRNAs ocorre na linhagem germinativa da maioria dos animais e é essencial à manutenção da integridade do genoma. O problema de predição in silico de interação entre piRNAs e TEs foi abordado por aprendizado de máquina por meio de um algoritmo de árvores de decisões do tipo Predictive Bi-Clustering Trees (PBCT). A fim de melhorar o desempenho do algoritmo, a matriz de interações entre os piRNAs e TEs foi reconstruída por meio de um algoritmo do tipo Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ). O PBCT foi aplicado em configurações de validação cruzada de 5-folds e de 10-folds, tanto para a matriz sem reconstrução (BICT) quanto para a matriz reconstruída por NRLMFβ (BICTR). De forma geral, o PBCT aplicado a esse conjunto de dados não foi capaz de predizer as interações positivas satisfatoriamente, comportando-se como um classificador aleatório. Comparativamente, no método BICT, o PBCT apresentou maiores valores de AUROC e AUPRC. Entretanto, no método BICTR, o PBCT foi capaz de predizer corretamente mais interações positivas, que são, de fato, o maior interesse neste estudo. Possíveis aplicações biológicas e caminhos para melhorar o desempenho do algoritmo também foram consideradas.por
dc.publisher.initialsUFSCarpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/1648153620187307por
dc.publisher.courseCiências Biológicas - CBpor


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 Brazil