dc.contributor.author | Tomoyose, Kazumi | |
dc.date.accessioned | 2021-04-15T21:01:14Z | |
dc.date.available | 2021-04-15T21:01:14Z | |
dc.date.issued | 2021-03-10 | |
dc.identifier.citation | TOMOYOSE, Kazumi. O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data. 2021. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14116. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/14116 | |
dc.description.abstract | With the development of semantic technologies, the importance and the recognition of data as information sources grow. In this context, the data generated from researches are increasingly valued, since their publication allows the foundation of the results obtained with the scientific works, also helping in the production of new knowledge in a sustainable way. Thus, there is a need to organize these research data, so as to optimize their retrieval. For this purpose, vocabularies could be used. From the standardization of data representation, vocabularies allow data to be organized and retrieved efficiently. When considering the Web environment, the discovery of new data is also improved, using Linked Data principles, and the Data Catalog Vocabulary (DCAT) appears as a vocabulary aimed at describing catalogs and its datasets, seeking to favor their interoperability. The objective of the research is to analyze the characteristcs and fundamentals of the Data Catalog Vocabulary (DCAT) and the vocabularies adopted by it, for the publication of research data in the Linked Data principles, in order to identify the discussion on the subject in the literature and verify the use of it. Through exploratory, descriptive and theoretical research, it was possible to systematize and analyze the characteristics of the vocabularies, identifying that DCAT allows catalogs and datasets to be standardized, reducing ambiguity issues and providing the discovery of data and data services, since it has specific terms for this purpose. Thus, in line with Linked Data principles, the use of DCAT allows the benefits of sharing research data to be accomplished. An analysis of re3data platforms was also carried out in order to identify the current use of vocabulary by them, where we verified low adoption of DCAT. However, the results indicate the concern of these platforms with issues of findability, accessibility, interoperability and reuse, going against the Linked Data principles and the FAIR principles. The research revealed that there are few discussions about DCAT in the literature, especially in the scope of Information Science. Thus, we point to the need to better explore the possibilities of representing information in the context of research data. In addition, further discussions that align the knowledge of the area with the semantic tools and concepts applied to the Web enhance the benefits of finding, using and retrieving information, in addition to expanding and improving the knowledge and possibilities of information professionals' performance. | eng |
dc.description.sponsorship | Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Vocabulários | por |
dc.subject | Dados de pesquisa | por |
dc.subject | Linked data | eng |
dc.subject | Vocabularies | eng |
dc.subject | Research data | eng |
dc.subject | Data Catalog Vocabulary (DCAT) | eng |
dc.title | O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data | por |
dc.title.alternative | Data Catalog Vocabulary (DCAT) for research data publishing in the Linked Data principles | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Arakaki, Ana Carolina Simionato | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/9896600626524397 | por |
dc.description.resumo | Com o desenvolvimento das tecnologias semânticas, cresce a importância e o reconhecimento dos dados como fontes informacionais. Nesse contexto, os dados gerados a partir de pesquisas são cada vez mais valorizados, uma vez que sua publicação permite a fundamentação dos resultados obtidos com os trabalhos científicos, além de auxiliarem na produção de novos conhecimentos de forma sustentável. Assim, é observada a necessidade em organizar esses dados de pesquisa, de forma a otimizar a recuperação deles, sendo que poderiam ser utilizados, para tal finalidade, os vocabulários. Os vocabulários são compreendidos como conjuntos de termos que padronizam a descrição de recursos, sendo o foco da presente pesquisa aqueles voltados à padronização dos elementos de metadados, pensando-se na organização e recuperação da informação. Ao considerar o ambiente da Web, a utilização dos princípios Linked Data melhora a descoberta de novos dados, sendo que o Data Catalog Vocabulary (DCAT) figura como um vocabulário voltado à descrição de catálogos e seus conjuntos de dados, buscando favorecer a interoperabilidade na Web. O objetivo da pesquisa consiste em analisar as características e os fundamentos do DCAT e dos vocabulários adotados por ele para a publicação de dados de pesquisa nos princípios Linked Data, de modo a identificar a discussão sobre a temática na literatura e verificar a utilização do mesmo. Por meio de pesquisa exploratória, descritiva e teórica, foi possível sistematizar e analisar as características dos vocabulários, identificando-se que o DCAT permite que os catálogos e os conjuntos de dados sejam padronizados, diminuindo questões de ambiguidade e proporcionando a descoberta de dados e de serviços de dados, uma vez que dispõe termos específicos para tal finalidade. Desse modo, alinhado também aos princípios Linked Data, o uso do DCAT permite que sejam efetivados os benefícios do compartilhamento dos dados de pesquisa. Foi realizada também a análise de plataformas do re3data a fim de identificar a atual utilização do vocabulário por elas, verificando-se baixa adoção do DCAT. Entretanto, os resultados indicam a preocupação dessas plataformas com questões de encontrabilidade, acessibilidade, interoperabilidade e reutilização, indo de encontro com os princípios Linked Data e os princípios FAIR. A pesquisa revelou que existem poucas discussões sobre o DCAT na literatura, em especial no âmbito da Ciência da Informação. Dessa forma, identifica-se a necessidade de melhor explorar as possibilidades de representação da informação no contexto dos dados de pesquisa. Além disso, maiores discussões que alinhem o conhecimento da área às ferramentas e aos conceitos semânticos aplicados à Web potencializam os benefícios de encontrabilidade, utilização e recuperação de informações, além de expandir e aprimorar os conhecimentos e as possibilidades de atuação dos profissionais da informação. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Informação - PPGCI | por |
dc.subject.cnpq | CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO | por |
dc.description.sponsorshipId | FAPESP: 2018/23655-6 | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/8794584054375201 | por |