Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica

Assao, Fabiana Mari

dc.contributor.author	Assao, Fabiana Mari
dc.date.accessioned	2016-06-02T19:05:34Z
dc.date.available	2009-09-21
dc.date.available	2016-06-02T19:05:34Z
dc.date.issued	2008-05-27
dc.identifier.citation	ASSAO, Fabiana Mari. Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica. 2008. 131 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2008.	por
dc.identifier.uri	https://repositorio.ufscar.br/handle/ufscar/399
dc.description.abstract	Data clustering has been seen, in the last decades, as an important tool for gene expression data analysis. In recent years, due to the progress in gene annotation research, a growing interest has been noticed for the semi-supervised clustering techniques, which use knowledge previously available about some gene functions to discover functions of other genes by means of clustering. This work investigates non-supervised and semi-supervised clustering algorithms applied to gene expression data. The goal is to perform an inspection on strengths and weaknesses of the use of such clustering methods and, based on these findings, to provide ways of obtaining results significant to biology. Algorithms with different characteristics were implemented and tested, with the objective of verifying evidences of eventual gains with the partial labeling, as compared to the non-supervised techniques. The experiments considered data sets from the gene expression domain as well as more generic domains. The obtained results were evaluated with validation measures usually applied in similar contexts. The analysis developed, though, emphasize the important role of computational techniques in biological data analysis, by accelerating the process of deriving results and conclusions, to better understand gene functions and structures. The results of this stydy justify the large investiment in the research of behavior of semi-supervised techniques in gene expression data, as we shall see.	eng
dc.format	application/pdf	por
dc.language	por	por
dc.publisher	Universidade Federal de São Carlos	por
dc.rights	Acesso Aberto	por
dc.subject	Método de agrupamento	por
dc.subject	Agrupamento semi-supervisionado	por
dc.subject	Expressão gênica	por
dc.subject	Aprendizado do computador	por
dc.subject	Bioinformática	por
dc.subject	Aprendizado de Máquina	por
dc.subject	Clustering	eng
dc.subject	Semisupervised clustering	eng
dc.subject	Gene expression	eng
dc.subject	Machine learning	eng
dc.subject	Bioinformatics	eng
dc.title	Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica	por
dc.type	Dissertação	por
dc.contributor.advisor1	Camargo, Heloisa de Arruda
dc.contributor.advisor1Lattes	http://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4783179Z5	por
dc.description.resumo	O agrupamento de dados destacou-se nas últimas décadas como uma importante ferramenta para a análise de dados de expressão gênica. Nos últimos anos, em função do progresso das pesquisas para rotulação de genes, surgiu um interesse pelas técnicas de agrupamento semi-supervisionado, que utilizam o conhecimento prévio disponível sobre a função de alguns genes para descobrir funções de outros genes por meio do agrupamento. Neste trabalho são investigados algoritmos de agrupamento semi-supervisionado e não supervisionados aplicados a dados de expressão gênica. O intuito é realizar uma inspeção das vantagens e desvantagens da utilização destes métodos de agrupamento e, a partir disso, prover subsídios para obtenção de resultados significativos para a área de Biologia. Foram implementados e testados algoritmos de agrupamento com diferentes características, com o objetivo de verificar evidências de eventuais ganhos obtidos com a rotulação parcial dos genes com relação a técnicas não-supervisionadas. Os experimentos realizados consideraram conjuntos de dados do domínio de expressão gênica e de outros domínios mais genéricos. Os resultados obtidos foram avaliados com medidas de validação usualmente aplicadas em contextos semelhantes. Assim, as análises desenvolvidas reforçam o importante papel da computação na análise de dados biológicos, a fim de acelerar o processo de obtenção de resultados e conclusões, na compreensão das estruturas e funções dos genes. Os resultados obtidos neste trabalho justificam o grande investimento na pesquisa do comportamento de técnicas semi-supervisionadas em dados de expressão gênica, como veremos mais adiante.	por
dc.publisher.country	BR	por
dc.publisher.initials	UFSCar	por
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação - PPGCC	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	por
dc.contributor.authorlattes	http://lattes.cnpq.br/3998840368387781	por

Files in this item

Name:: 2160.pdf
Size:: 2.848Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Teses e dissertações

Show simple item record