Show simple item record

dc.contributor.authorTomazela, Élen Cátia
dc.date.accessioned2016-06-02T20:25:07Z
dc.date.available2011-02-11
dc.date.available2016-06-02T20:25:07Z
dc.date.issued2010-06-21
dc.identifier.citationTOMAZELA, Élen Cátia. O uso de informações semânticas do PALAVRAS : em busca do aprimoramento da seleção de unidades textuais correferentes na Sumarização Automática. 2010. 149 f. Dissertação (Mestrado em Ciências Humanas) - Universidade Federal de São Carlos, São Carlos, 2010.por
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/5700
dc.description.abstractThis dissertation aims at presenting a theoretical heuristic model which not only takes into consideration the Veins Theory, but also semantic information obtained from the Parser PALAVRAS to improve the selection of correferential textual units to be included in automatic summaries. Based on the analysis of the problems presented by VeinSum, an automatic summarizer, two main issues have been raised: the necessity of improving its summaries salience and reducing their size so that they suit the compression rate more adequately. Better results can be achieved through the elimination of irrelevant textual units although the summaries referential clarity may not be damaged. Heuristics based on the semantic information have then been proposed. Despite the semantic annotation inconsistencies, all the noun phrases that compose the Summ-it Corpus have been post-edited manually, which increases the credibility of the heuristics. Eleven texts from the corpus have been analysed and the results obtained are satisfactory, although a wider study would be required to better evaluate the results of this proposal.eng
dc.description.sponsorshipUniversidade Federal de Minas Gerais
dc.formatapplication/pdfpor
dc.languageporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAcesso Abertopor
dc.subjectLinguística - processamento de dadospor
dc.subjectSumarização automáticapor
dc.subjectTextualidadepor
dc.subjectCorreferênciapor
dc.titleO uso de informações semânticas do PALAVRAS : em busca do aprimoramento da seleção de unidades textuais correferentes na sumarização automáticapor
dc.typeDissertaçãopor
dc.contributor.advisor1Rino, Lúcia Helena Machado
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0315640846525832por
dc.description.resumoEsta dissertação tem como foco a proposta de um modelo heurístico teórico que utiliza, além da Teoria das Veias, informações semânticas provenientes do Parser PALAVRAS para melhorar a seleção de unidades correferentes para a inclusão em sumários automáticos. A partir da análise dos problemas apresentados pelo sumarizador automático VeinSum, identificou-se a necessidade de melhorar a saliência dos sumários produzidos, além de reduzir o tamanho dos mesmos para que se aproximassem mais da taxa de compressão ideal. Propõese, então, a eliminação de unidades textuais de importância secundária no que tange à clareza referencial, sem danificá-la, no entanto. Para isso, heurísticas baseadas nas informações semânticas do PALAVRAS foram propostas. Apesar de o parser apresentar inconsistências de etiquetação semântica, a anotação de todos os sintagmas nominais dos 50 textos-fonte que compõem o corpus Summ-it foi pós-editada manualmente para melhorar a confiabilidade das heurísticas geradas. Foram analisados 11 textos pertencentes ao corpus e os resultados são satisfatórios, porém reconhece-se que, para melhor avaliar os resultados desta proposta, faz-se necessário um estudo mais amplo.por
dc.publisher.countryBRpor
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Linguística - PPGLpor
dc.subject.cnpqLINGUISTICA, LETRAS E ARTES::LINGUISTICApor
dc.contributor.authorlatteshttp://lattes.cnpq.br/5260837297000438por


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record