Extração automática de relações semânticas a partir de dados ruidosos

dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512por
dc.contributor.authorSardinha, Diorge Brognara
dc.contributor.authorlatteshttp://lattes.cnpq.br/9373920877859975por
dc.date.accessioned2020-09-02T20:07:42Z
dc.date.available2020-09-02T20:07:42Z
dc.date.issued2020-03-09
dc.description.abstractRelationship extraction is a task performed in text-based continuous learning systems, aiming to find semantic relationships between categories or entities. NELL is such a system, which suffers from supervised labeling in its relationship extraction. One of the algorithms attempting to solve this task for NELL is OntExt, but it does not handle noisy input very well, and is computationally expensive. However this algorithm has interesting properties in the context of NELL’s application, not available in other methods. In this work, it is proposed a variant of the algorithm to reduce the impact of its flaws, using a graph-based representation, which is flexible in the handling of outliers. This new method has a comparable precision and higher recall, compared to the existing method. It is also shown an efficient way to represent the problem using sparse structures, reducing the computational cost from minutes to seconds.eng
dc.description.resumoExtração de relações é uma tarefa realizada em sistemas de aprendizado contínuo a partir de fontes textuais, com o objetivo de encontrar relações semânticas entre categorias ou entidades. A NELL é um sistema desse tipo, que encontra problemas na extração de relações devido a suas propriedades de supervisionamento e rotulação. Um dos algoritmos para essa tarefa desenvolvidos para a NELL é o OntExt, que apresenta dificuldades de execução devido a entradas ruidosas e ao seu custo computacional. No entanto, o algoritmo possui propriedades interessantes para o contexto da aplicação, que não estão presentes em outros métodos. Neste trabalho, é proposta uma variante do algoritmo a fim de aliviar as principais deficiências identificadas, que utiliza uma estrutura de grafo, e é flexível para tratamento de outliers. O novo método proposto possui precisão comparável ao existente, e uma revocação maior. Também é apresentada uma forma eficiente de representar o problema através de uma estrutura esparsa, reduzindo o custo computacional da ordem de minutos para segundos.por
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.description.sponsorshipIdCAPES: Código de Financiamento 001por
dc.identifier.citationSARDINHA, Diorge Brognara. Extração automática de relações semânticas a partir de dados ruidosos. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/13209.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/20.500.14289/13209
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.publisher.addressCâmpus São Carlospor
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectExtração da informaçãopor
dc.subjectExtração de relaçõespor
dc.subjectAprendizado contínuopor
dc.subjectInformation extractioneng
dc.subjectRelationship extractioneng
dc.subjectContinuous learningeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.titleExtração automática de relações semânticas a partir de dados ruidosospor
dc.title.alternativeAutomatic relationship extraction from noisy dataeng
dc.typeDissertaçãopor

Arquivos

Pacote Original

Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
dissertacao 2020-09-02.pdf
Tamanho:
697.13 KB
Formato:
Adobe Portable Document Format
Descrição:
Dissertação mestrado - Diorge Brognara Sardinha
Carregando...
Imagem de Miniatura
Nome:
Carta Comprovante Assinada.pdf
Tamanho:
113.47 KB
Formato:
Adobe Portable Document Format
Descrição:
Carta Comprovante Assinada - Mestrado Diorge Brognara Sardinha