dc.contributor.author | Miani, Rafael Garcia Leonel | |
dc.date.accessioned | 2018-02-27T19:55:50Z | |
dc.date.available | 2018-02-27T19:55:50Z | |
dc.date.issued | 2017-12-20 | |
dc.identifier.citation | MIANI, Rafael Garcia Leonel. Regras de associação e correlação temporal para popular e detectar Inconsistências em grandes bases de conhecimento. 2017. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2017. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9490. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/9490 | |
dc.description.abstract | Large growing knowledge bases have been an interesting field in many researches in the
past few years. Most techniques focus on constructing algorithms to help a Knowledge
Base (KB) automatically (or semi automatically) expands. However, many tools used to expand
the KBs can extract incomplete or incorrect data, turning the KB inconsistent. In this
way, this work has the objective to expand large knowledge bases as well as detect inconsistencies
on them. To accomplish that, an association rule mining algorithm and temporal
correlation are used. Applying an algorithm to extract association rules in large knowledge
bases, the missing value problem need to be considered, once these bases grow day to day,
and do not have all of the data. Therefore, a new parameter was created to perform the
support calculation, the MSC parameter, to deal with missing values. Besides, a major problem
on using association rules is the effort spent to analyze each extracted rule. Thus,
this work developed ER component, which eliminates redundant and irrelevant association
rules. Each valid rule is used by TARE component with the purpose of detecting inconsistencies.
TARE introduces the concept of STARs (specific temporal association rules),
which are used to detect possible inconsistencies. Each relevant STAR is used as an input
to TCI component in order to get temporal correlations to (i) detect possible inconsistencies
and (ii) to help populating the KB. Experiments showed that the association rules and the
temporal correlation are capable to expand the knowledge base, decreasing the amount of
missing values. Moreover, both TARE and TCI components were efficient in the process of
detecting possible inconsistencies in the data set. Finally, the ER component reduced the
number of rules in more then 30% without any lost in the process of populating the KB. | eng |
dc.description.sponsorship | Não recebi financiamento | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights.uri | Acesso aberto | por |
dc.subject | Regras de associação | por |
dc.subject | Grandes bases de conhecimento | por |
dc.subject | Regras de associação temporais específicas | por |
dc.subject | Correlação temporal | por |
dc.subject | Detecção de inconsistências | por |
dc.subject | Regras redundantes | por |
dc.subject | Regras irrelevantes | por |
dc.subject | Association rules | eng |
dc.subject | Large knowledge bases | eng |
dc.subject | Specific temporal association rules | eng |
dc.subject | Temporal correlations | eng |
dc.subject | Inconsistency detection | eng |
dc.subject | Redundant rules | eng |
dc.subject | Irrelevant rules | eng |
dc.title | Regras de associação e correlação temporal para popular e detectar Inconsistências em grandes bases de conhecimento | por |
dc.title.alternative | Association rules and temporal correlations to populate and detect inconsistencies in large knowledge bases | eng |
dc.type | Tese | por |
dc.contributor.advisor1 | Hruschka Júnior, Estevam Rafael | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2097340857065853 | por |
dc.description.resumo | Grandes bases de conhecimento crescente têm sido um interessante campo em muitas pesquisas nos últimos anos. A maioria das técnicas focam na construção de algoritmos para auxiliar a Base de Conhecimento (BC) a expandir automaticamente (ou semiautomaticamente). Entretanto, muitas ferramentas utilizadas para a expandir as BCs podem extrair dados incompletos ou incorretos, tornando a base inconsistente. Dessa forma, este trabalho possui o objetivo de expandir as grandes bases de conhecimento e detectar inconsistências nas mesmas. Para tal, são utilizadas a mineração de regras de associação e a correlação temporal. Ao aplicar um algoritmo de extração de regras de associação em grandes bases de conhecimento, é necessário considerar o problema de valores ausentes, uma vez que elas crescem diariamente, não possuindo todos os dados. Logo, foi criado um novo parâmetro para realizar o cálculo do suporte, denominado MSC, para trabalhar com valores ausentes.
Além disso, um grande problema ao utilizar regras de associação é o esforço gasto ao avaliar cada regra extraída. Dessa forma, o presente trabalho desenvolveu o componente ER, o qual elimina regras de associação redundantes e irrelevantes. Cada regra válida é utilizada pelo componente TARE com o objetivo de detectar inconsistências. TARE introduz o conceito de STARs (regras de associação temporais específicas), as quais são utilizadas para detectar possíveis inconsistências. Cada STAR considerada relevante é utilizada como entrada para o componente TCI com o intuito de obter correlações temporais para (i) detectar possíveis inconsistências e (ii) auxiliar a popular a BC. Experimentos realizados demonstraram que as regras de associação e a correlação temporal são capazes de expandir a base de conhecimento, diminuindo a quantidade de valores ausentes. Além disso, ambos os componentes TARE e TCI foram eficientes no processo para detectar possíveis inconsistências na base de
dados. Por fim, o componente ER reduziu em mais de 30% o número de regras sem perda
no processo de popular a BC. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | por |
dc.ufscar.embargo | Online | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/9487235096598355 | por |