Show simple item record

dc.contributor.authorMiani, Rafael Garcia Leonel
dc.date.accessioned2018-02-27T19:55:50Z
dc.date.available2018-02-27T19:55:50Z
dc.date.issued2017-12-20
dc.identifier.citationMIANI, Rafael Garcia Leonel. Regras de associação e correlação temporal para popular e detectar Inconsistências em grandes bases de conhecimento. 2017. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2017. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9490.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/9490
dc.description.abstractLarge growing knowledge bases have been an interesting field in many researches in the past few years. Most techniques focus on constructing algorithms to help a Knowledge Base (KB) automatically (or semi automatically) expands. However, many tools used to expand the KBs can extract incomplete or incorrect data, turning the KB inconsistent. In this way, this work has the objective to expand large knowledge bases as well as detect inconsistencies on them. To accomplish that, an association rule mining algorithm and temporal correlation are used. Applying an algorithm to extract association rules in large knowledge bases, the missing value problem need to be considered, once these bases grow day to day, and do not have all of the data. Therefore, a new parameter was created to perform the support calculation, the MSC parameter, to deal with missing values. Besides, a major problem on using association rules is the effort spent to analyze each extracted rule. Thus, this work developed ER component, which eliminates redundant and irrelevant association rules. Each valid rule is used by TARE component with the purpose of detecting inconsistencies. TARE introduces the concept of STARs (specific temporal association rules), which are used to detect possible inconsistencies. Each relevant STAR is used as an input to TCI component in order to get temporal correlations to (i) detect possible inconsistencies and (ii) to help populating the KB. Experiments showed that the association rules and the temporal correlation are capable to expand the knowledge base, decreasing the amount of missing values. Moreover, both TARE and TCI components were efficient in the process of detecting possible inconsistencies in the data set. Finally, the ER component reduced the number of rules in more then 30% without any lost in the process of populating the KB.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rights.uriAcesso abertopor
dc.subjectRegras de associaçãopor
dc.subjectGrandes bases de conhecimentopor
dc.subjectRegras de associação temporais específicaspor
dc.subjectCorrelação temporalpor
dc.subjectDetecção de inconsistênciaspor
dc.subjectRegras redundantespor
dc.subjectRegras irrelevantespor
dc.subjectAssociation ruleseng
dc.subjectLarge knowledge baseseng
dc.subjectSpecific temporal association ruleseng
dc.subjectTemporal correlationseng
dc.subjectInconsistency detectioneng
dc.subjectRedundant ruleseng
dc.subjectIrrelevant ruleseng
dc.titleRegras de associação e correlação temporal para popular e detectar Inconsistências em grandes bases de conhecimentopor
dc.title.alternativeAssociation rules and temporal correlations to populate and detect inconsistencies in large knowledge baseseng
dc.typeTesepor
dc.contributor.advisor1Hruschka Júnior, Estevam Rafael
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2097340857065853por
dc.description.resumoGrandes bases de conhecimento crescente têm sido um interessante campo em muitas pesquisas nos últimos anos. A maioria das técnicas focam na construção de algoritmos para auxiliar a Base de Conhecimento (BC) a expandir automaticamente (ou semiautomaticamente). Entretanto, muitas ferramentas utilizadas para a expandir as BCs podem extrair dados incompletos ou incorretos, tornando a base inconsistente. Dessa forma, este trabalho possui o objetivo de expandir as grandes bases de conhecimento e detectar inconsistências nas mesmas. Para tal, são utilizadas a mineração de regras de associação e a correlação temporal. Ao aplicar um algoritmo de extração de regras de associação em grandes bases de conhecimento, é necessário considerar o problema de valores ausentes, uma vez que elas crescem diariamente, não possuindo todos os dados. Logo, foi criado um novo parâmetro para realizar o cálculo do suporte, denominado MSC, para trabalhar com valores ausentes. Além disso, um grande problema ao utilizar regras de associação é o esforço gasto ao avaliar cada regra extraída. Dessa forma, o presente trabalho desenvolveu o componente ER, o qual elimina regras de associação redundantes e irrelevantes. Cada regra válida é utilizada pelo componente TARE com o objetivo de detectar inconsistências. TARE introduz o conceito de STARs (regras de associação temporais específicas), as quais são utilizadas para detectar possíveis inconsistências. Cada STAR considerada relevante é utilizada como entrada para o componente TCI com o intuito de obter correlações temporais para (i) detectar possíveis inconsistências e (ii) auxiliar a popular a BC. Experimentos realizados demonstraram que as regras de associação e a correlação temporal são capazes de expandir a base de conhecimento, diminuindo a quantidade de valores ausentes. Além disso, ambos os componentes TARE e TCI foram eficientes no processo para detectar possíveis inconsistências na base de dados. Por fim, o componente ER reduziu em mais de 30% o número de regras sem perda no processo de popular a BC.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.ufscar.embargoOnlinepor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/9487235096598355por


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record