Show simple item record

dc.contributor.authorTomoyose, Kazumi
dc.date.accessioned2021-04-15T21:01:14Z
dc.date.available2021-04-15T21:01:14Z
dc.date.issued2021-03-10
dc.identifier.citationTOMOYOSE, Kazumi. O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data. 2021. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14116.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/14116
dc.description.abstractWith the development of semantic technologies, the importance and the recognition of data as information sources grow. In this context, the data generated from researches are increasingly valued, since their publication allows the foundation of the results obtained with the scientific works, also helping in the production of new knowledge in a sustainable way. Thus, there is a need to organize these research data, so as to optimize their retrieval. For this purpose, vocabularies could be used. From the standardization of data representation, vocabularies allow data to be organized and retrieved efficiently. When considering the Web environment, the discovery of new data is also improved, using Linked Data principles, and the Data Catalog Vocabulary (DCAT) appears as a vocabulary aimed at describing catalogs and its datasets, seeking to favor their interoperability. The objective of the research is to analyze the characteristcs and fundamentals of the Data Catalog Vocabulary (DCAT) and the vocabularies adopted by it, for the publication of research data in the Linked Data principles, in order to identify the discussion on the subject in the literature and verify the use of it. Through exploratory, descriptive and theoretical research, it was possible to systematize and analyze the characteristics of the vocabularies, identifying that DCAT allows catalogs and datasets to be standardized, reducing ambiguity issues and providing the discovery of data and data services, since it has specific terms for this purpose. Thus, in line with Linked Data principles, the use of DCAT allows the benefits of sharing research data to be accomplished. An analysis of re3data platforms was also carried out in order to identify the current use of vocabulary by them, where we verified low adoption of DCAT. However, the results indicate the concern of these platforms with issues of findability, accessibility, interoperability and reuse, going against the Linked Data principles and the FAIR principles. The research revealed that there are few discussions about DCAT in the literature, especially in the scope of Information Science. Thus, we point to the need to better explore the possibilities of representing information in the context of research data. In addition, further discussions that align the knowledge of the area with the semantic tools and concepts applied to the Web enhance the benefits of finding, using and retrieving information, in addition to expanding and improving the knowledge and possibilities of information professionals' performance.eng
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)por
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectVocabuláriospor
dc.subjectDados de pesquisapor
dc.subjectLinked dataeng
dc.subjectVocabularieseng
dc.subjectResearch dataeng
dc.subjectData Catalog Vocabulary (DCAT)eng
dc.titleO Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Datapor
dc.title.alternativeData Catalog Vocabulary (DCAT) for research data publishing in the Linked Data principleseng
dc.typeDissertaçãopor
dc.contributor.advisor1Arakaki, Ana Carolina Simionato
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9896600626524397por
dc.description.resumoCom o desenvolvimento das tecnologias semânticas, cresce a importância e o reconhecimento dos dados como fontes informacionais. Nesse contexto, os dados gerados a partir de pesquisas são cada vez mais valorizados, uma vez que sua publicação permite a fundamentação dos resultados obtidos com os trabalhos científicos, além de auxiliarem na produção de novos conhecimentos de forma sustentável. Assim, é observada a necessidade em organizar esses dados de pesquisa, de forma a otimizar a recuperação deles, sendo que poderiam ser utilizados, para tal finalidade, os vocabulários. Os vocabulários são compreendidos como conjuntos de termos que padronizam a descrição de recursos, sendo o foco da presente pesquisa aqueles voltados à padronização dos elementos de metadados, pensando-se na organização e recuperação da informação. Ao considerar o ambiente da Web, a utilização dos princípios Linked Data melhora a descoberta de novos dados, sendo que o Data Catalog Vocabulary (DCAT) figura como um vocabulário voltado à descrição de catálogos e seus conjuntos de dados, buscando favorecer a interoperabilidade na Web. O objetivo da pesquisa consiste em analisar as características e os fundamentos do DCAT e dos vocabulários adotados por ele para a publicação de dados de pesquisa nos princípios Linked Data, de modo a identificar a discussão sobre a temática na literatura e verificar a utilização do mesmo. Por meio de pesquisa exploratória, descritiva e teórica, foi possível sistematizar e analisar as características dos vocabulários, identificando-se que o DCAT permite que os catálogos e os conjuntos de dados sejam padronizados, diminuindo questões de ambiguidade e proporcionando a descoberta de dados e de serviços de dados, uma vez que dispõe termos específicos para tal finalidade. Desse modo, alinhado também aos princípios Linked Data, o uso do DCAT permite que sejam efetivados os benefícios do compartilhamento dos dados de pesquisa. Foi realizada também a análise de plataformas do re3data a fim de identificar a atual utilização do vocabulário por elas, verificando-se baixa adoção do DCAT. Entretanto, os resultados indicam a preocupação dessas plataformas com questões de encontrabilidade, acessibilidade, interoperabilidade e reutilização, indo de encontro com os princípios Linked Data e os princípios FAIR. A pesquisa revelou que existem poucas discussões sobre o DCAT na literatura, em especial no âmbito da Ciência da Informação. Dessa forma, identifica-se a necessidade de melhor explorar as possibilidades de representação da informação no contexto dos dados de pesquisa. Além disso, maiores discussões que alinhem o conhecimento da área às ferramentas e aos conceitos semânticos aplicados à Web potencializam os benefícios de encontrabilidade, utilização e recuperação de informações, além de expandir e aprimorar os conhecimentos e as possibilidades de atuação dos profissionais da informação.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Informação - PPGCIpor
dc.subject.cnpqCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAOpor
dc.description.sponsorshipIdFAPESP: 2018/23655-6por
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/8794584054375201por


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil