Estudo e validação de teorias do domínio lingüístico com vistas à melhoria do tratamento de cadeias de co-referência em sumarização automática
| dc.contributor.advisor1 | Rino, Lúcia Helena Machado | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0315640846525832 | por |
| dc.contributor.author | Carbonel, Thiago Ianez | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/0446593777033541 | por |
| dc.date.accessioned | 2016-06-02T20:24:59Z | |
| dc.date.available | 2007-10-31 | |
| dc.date.available | 2016-06-02T20:24:59Z | |
| dc.date.issued | 2007-08-21 | |
| dc.description.abstract | The work presented in the dissertation focuses on the study and validation of linguistic theories so as to improve reference cohesion in Automatic Summarization systems, which with the advent of the Internet have received increasing attention due to the urge to manage the huge amounts of on-line textual information that become available each day. In this dissertation we evaluate Seno (2005) s Veins Theory-based proposal and prototype, and present a reimplementation with distinct features based on the analysis of a corpus annotated with rhetoric (RST) and referential information. In addition, we report on the first validation effort for Portuguese for Veins Theory s Conjecture 1 (C1), which constrains anaphora resolution given the rhetoric structure of texts and whose applicability to Automatic Summarization interests us. As a methodological novelty, we put forth the Non-Trivial Precision, a more realistic estimator of C1 s predictive power. | eng |
| dc.description.resumo | O trabalho apresentado nesta dissertação tem como foco o estudo e validação de teorias lingüísticas com vistas à melhoria dos sistemas de Sumarização Automática, ramo da Lingüística Computacional que, com o advento da internet, tem recebido grande atenção nos últimos tempos, pois a quantidade de informação on-line é enorme e os leitores têm cada vez menos tempo para apreender o máximo desta informação. Nesta dissertação, avaliamos o protótipo de AS baseado na Teoria das Veias proposto por Seno (2005) e apresentamos uma reimplementação com características distintas, baseada em análise de córpus um córpus anotado com informação retórica (RST) e referencial. Como inovação metodológica, formulamos a Precisão Não-Trivial, um estimador mais realista para o poder preditivo da C1. | por |
| dc.description.sponsorship | Universidade Federal de Sao Carlos | |
| dc.format | application/pdf | por |
| dc.identifier.citation | CARBONEL, Thiago Ianez. Estudo e validação de teorias do domínio lingüístico com vistas à melhoria do tratamento de cadeias de co-referência em Sumarização Automática.. 2007. 206 f. Dissertação (Mestrado em Ciências Humanas) - Universidade Federal de São Carlos, São Carlos, 2007. | por |
| dc.identifier.uri | https://repositorio.ufscar.br/handle/20.500.14289/5650 | |
| dc.language | por | por |
| dc.publisher | Universidade Federal de São Carlos | por |
| dc.publisher.country | BR | por |
| dc.publisher.initials | UFSCar | por |
| dc.publisher.program | Programa de Pós-Graduação em Linguística - PPGL | por |
| dc.rights | Acesso Aberto | por |
| dc.subject | Lingüística processamento de dados | por |
| dc.subject | Textualidade | por |
| dc.subject | Sumarização Automática | por |
| dc.subject | Anáfora (Lingüística) | por |
| dc.subject.cnpq | LINGUISTICA, LETRAS E ARTES::LINGUISTICA | por |
| dc.title | Estudo e validação de teorias do domínio lingüístico com vistas à melhoria do tratamento de cadeias de co-referência em sumarização automática | por |
| dc.type | Dissertação | por |
Arquivos
Pacote Original
1 - 1 de 1