Mostrar el registro sencillo del ítem
Regras de associação e correlação temporal para popular e detectar Inconsistências em grandes bases de conhecimento
dc.contributor.author | Miani, Rafael Garcia Leonel | |
dc.date.accessioned | 2018-02-27T19:55:50Z | |
dc.date.available | 2018-02-27T19:55:50Z | |
dc.date.issued | 2017-12-20 | |
dc.identifier.citation | MIANI, Rafael Garcia Leonel. Regras de associação e correlação temporal para popular e detectar Inconsistências em grandes bases de conhecimento. 2017. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2017. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9490. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/9490 | |
dc.description.abstract | Large growing knowledge bases have been an interesting field in many researches in the past few years. Most techniques focus on constructing algorithms to help a Knowledge Base (KB) automatically (or semi automatically) expands. However, many tools used to expand the KBs can extract incomplete or incorrect data, turning the KB inconsistent. In this way, this work has the objective to expand large knowledge bases as well as detect inconsistencies on them. To accomplish that, an association rule mining algorithm and temporal correlation are used. Applying an algorithm to extract association rules in large knowledge bases, the missing value problem need to be considered, once these bases grow day to day, and do not have all of the data. Therefore, a new parameter was created to perform the support calculation, the MSC parameter, to deal with missing values. Besides, a major problem on using association rules is the effort spent to analyze each extracted rule. Thus, this work developed ER component, which eliminates redundant and irrelevant association rules. Each valid rule is used by TARE component with the purpose of detecting inconsistencies. TARE introduces the concept of STARs (specific temporal association rules), which are used to detect possible inconsistencies. Each relevant STAR is used as an input to TCI component in order to get temporal correlations to (i) detect possible inconsistencies and (ii) to help populating the KB. Experiments showed that the association rules and the temporal correlation are capable to expand the knowledge base, decreasing the amount of missing values. Moreover, both TARE and TCI components were efficient in the process of detecting possible inconsistencies in the data set. Finally, the ER component reduced the number of rules in more then 30% without any lost in the process of populating the KB. | eng |
dc.description.sponsorship | Não recebi financiamento | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights.uri | Acesso aberto | por |
dc.subject | Regras de associação | por |
dc.subject | Grandes bases de conhecimento | por |
dc.subject | Regras de associação temporais específicas | por |
dc.subject | Correlação temporal | por |
dc.subject | Detecção de inconsistências | por |
dc.subject | Regras redundantes | por |
dc.subject | Regras irrelevantes | por |
dc.subject | Association rules | eng |
dc.subject | Large knowledge bases | eng |
dc.subject | Specific temporal association rules | eng |
dc.subject | Temporal correlations | eng |
dc.subject | Inconsistency detection | eng |
dc.subject | Redundant rules | eng |
dc.subject | Irrelevant rules | eng |
dc.title | Regras de associação e correlação temporal para popular e detectar Inconsistências em grandes bases de conhecimento | por |
dc.title.alternative | Association rules and temporal correlations to populate and detect inconsistencies in large knowledge bases | eng |
dc.type | Tese | por |
dc.contributor.advisor1 | Hruschka Júnior, Estevam Rafael | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2097340857065853 | por |
dc.description.resumo | Grandes bases de conhecimento crescente têm sido um interessante campo em muitas pesquisas nos últimos anos. A maioria das técnicas focam na construção de algoritmos para auxiliar a Base de Conhecimento (BC) a expandir automaticamente (ou semiautomaticamente). Entretanto, muitas ferramentas utilizadas para a expandir as BCs podem extrair dados incompletos ou incorretos, tornando a base inconsistente. Dessa forma, este trabalho possui o objetivo de expandir as grandes bases de conhecimento e detectar inconsistências nas mesmas. Para tal, são utilizadas a mineração de regras de associação e a correlação temporal. Ao aplicar um algoritmo de extração de regras de associação em grandes bases de conhecimento, é necessário considerar o problema de valores ausentes, uma vez que elas crescem diariamente, não possuindo todos os dados. Logo, foi criado um novo parâmetro para realizar o cálculo do suporte, denominado MSC, para trabalhar com valores ausentes. Além disso, um grande problema ao utilizar regras de associação é o esforço gasto ao avaliar cada regra extraída. Dessa forma, o presente trabalho desenvolveu o componente ER, o qual elimina regras de associação redundantes e irrelevantes. Cada regra válida é utilizada pelo componente TARE com o objetivo de detectar inconsistências. TARE introduz o conceito de STARs (regras de associação temporais específicas), as quais são utilizadas para detectar possíveis inconsistências. Cada STAR considerada relevante é utilizada como entrada para o componente TCI com o intuito de obter correlações temporais para (i) detectar possíveis inconsistências e (ii) auxiliar a popular a BC. Experimentos realizados demonstraram que as regras de associação e a correlação temporal são capazes de expandir a base de conhecimento, diminuindo a quantidade de valores ausentes. Além disso, ambos os componentes TARE e TCI foram eficientes no processo para detectar possíveis inconsistências na base de dados. Por fim, o componente ER reduziu em mais de 30% o número de regras sem perda no processo de popular a BC. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | por |
dc.ufscar.embargo | Online | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/9487235096598355 | por |