Show simple item record

dc.contributor.authorBarbirato, João Gabriel Melo
dc.date.accessioned2022-06-27T18:00:33Z
dc.date.available2022-06-27T18:00:33Z
dc.date.issued2022-04-27
dc.identifier.citationBARBIRATO, João Gabriel Melo. Construção automática de grafo de conhecimento no domínio do e-commerce. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16322.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/16322
dc.description.abstractExtracting knowledge efficiently, when large volumes of data are generated daily, is still a challenge. In most cases, these data are unstructured, that is, they are presented in textual or visual format without a clear delimitation of the information they contain and the relationships between this information. Thus, as important as correctly extracting knowledge is to represent it and store it so that it is useful. One of the ways to represent (store) this knowledge is through knowledge graphs. These structures represent semantic relationships (edges) between entities (vertices), as the semantic relationship is_a between the apple and fruit entities represented by the triple: is_a(apple,fruit). Thus, this work addresses the automatic construction of a knowledge graph for the e-commerce domain, where the vertices of this graph represent products and characteristics, while the edges connecting these vertices are used to describe the relationship between them. Among the challenges that this work faced is having to deal with unstructured, noisy and incomplete data generated by users in the e-commerce domain. Added to this fact are the semantic challenges of the domain, since e-commerce data carry more semantic value because they are real entities that came from very varied categories and contexts. In order to advance in the investigation of methods to deal with such challenges and peculiarities of the e-commerce domain, in this work two graph models were trained for product recommendation: one of them following distributive approach through the RedisGraph tool, and another that explores latent properties of the distributed methods of knowledge graph embeddings. The results show that the latter can contribute to tasks in the e-commerce domain that aim at product diversity.eng
dc.description.sponsorshipOutrapor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectProcessamento de língua naturalpor
dc.subjectRepresentação de conhecimentopor
dc.subjectGrafo de onhecimentopor
dc.subjectNatural language processingeng
dc.subjectKnowledge representationeng
dc.subjectKnowledge grapheng
dc.subjectE-commerceeng
dc.titleConstrução automática de grafo de conhecimento no domínio do e-commercepor
dc.title.alternativeAutomatic knowledge graph construction in the e-commerce domaineng
dc.typeDissertaçãopor
dc.contributor.advisor1Caseli, Helena de Medeiros
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6608582057810385por
dc.description.resumoExtrair conhecimento de forma eficiente, quando grandes volumes de dados são gerados diariamente, ainda é um desafio. Na maioria dos casos esses dados são não estruturados, ou seja, são apresentados no formato textual ou visual sem a clara delimitação das informações que contém e das relações entre essas informações. Assim, tão importante quanto extrair corretamente o conhecimento é representá-lo e armazená-lo de modo que ele seja útil. Uma das formas de representar (armazenar) esse conhecimento é por meio de grafos de conhecimento. Essas estruturas representam relações semânticas (arestas) entre entidades (vértices), como a relação semântica é_um entre as entidades maçã e fruta representada pela tripla: é_um(maçã,fruta). Assim, este trabalho aborda a construção automática de um grafo de conhecimento para o domínio do e-commerce, onde os vértices desse grafo representam produtos e caraterísticas, enquanto as arestas conectando esses vértices são usadas para descrever a relação entre eles. Entre os desafios que este trabalho enfrentou está o de ter de lidar com dados não estruturados, ruidosos e incompletos gerados pelos usuários no domínio do e-commerce. A esse fato somam-se os desafios semânticos do domínio, uma vez que os dados do e-commerce carregam mais valor semântico por se tratarem de entidades reais e de categorias e contextos muito variados. Com o intuito de avançar na investigação de métodos para lidar com tais desafios e peculiaridades do domínio do e-commerce, neste trabalho foram treinados dois modelos de grafo para a recomendação de produtos: um deles seguindo métodos distributivos através da ferramenta RedisGraph, e outro que explora propriedades latentes dos métodos distribuídos de embeddings de grafo de conhecimento. Os resultados mostram que o último pode contribuir para tarefas no domínio do e-commerce que visam a diversidade de produtos.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/7014175217181346por


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil