Proveniência de dados e metadados em repositórios de dados de pesquisa

dc.contributor.advisor-co1Baptista, Ana Alice Rodrigues Pereira
dc.contributor.advisor-co1orcidhttps://orcid.org/0000-0003-3525-0619
dc.contributor.advisor1Arakaki, Felipe Augusto
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5324289839207169
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-3983-2563
dc.contributor.authorSilva, Felipe Ivo da
dc.contributor.authorlatteshttp://lattes.cnpq.br/0753366586589793
dc.contributor.authororcidhttps://orcid.org/0009-0005-1379-4692
dc.date.accessioned2025-04-10T19:52:38Z
dc.date.issued2025-04-03
dc.description.abstractResearch data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity.eng
dc.description.resumoOs repositórios de dados de pesquisa são ambientes de armazenamento, preservação e compartilhamento de dados científicos, e garantem acessibilidade e reutilização dos dados. A proveniência, que documenta a origem, histórico e transformações dos dados, é fundamental para assegurar a autenticidade, confiabilidade e rastreabilidade das informações. No entanto, a falta de padronização e interoperabilidade entre os principais padrões de metadados utilizados nesses repositórios pode comprometer a eficácia da proveniência. Nesse contexto, a questão central desta pesquisa foi: os padrões de metadados utilizados para a descrição de dados em repositórios de pesquisa asseguram a rastreabilidade e autenticidade das informações ao longo do tempo? O objetivo geral do estudo foi avaliar a aderência dos metadados de proveniência, com base na Família PROV, aos principais padrões de metadados utilizados em repositórios de dados de pesquisa segundo o Re3data, como Dublin Core, DataCite e DDI. A pesquisa buscou identificar como esses padrões podem auxiliar na identificação da autenticidade e rastreabilidade das informações, propondo recomendações para sua aplicação. A metodologia adotada foi teórica e exploratória, utilizando levantamento bibliográfico em bases de dados reconhecidas, análise de literatura especializada e o método Crosswalk para mapear e comparar os padrões de metadados em relação à PROV-O. A análise focou na interoperabilidade entre os padrões e a Família PROV, visando identificar possíveis adaptações para melhorar a interoperabilidade semântica. Os resultados principais indicaram que os padrões analisados possuem diferentes graus de interoperabilidade com a Família PROV. O Dublin Core apresentou a maior correspondência relativa, enquanto DataCite e DDI mostraram níveis mais baixos de interoperabilidade. Apesar da viabilidade de integração, foram identificadas limitações que exigem adaptações para atender aos princípios de interoperabilidade semântica promovidos pelo W3C. Em conclusão, o estudo reforça a importância da proveniência para a confiabilidade e rastreabilidade dos dados em repositórios de dados pesquisa, destacando a necessidade de colaboração interdisciplinar entre Ciência da Informação e Ciência da Computação para aprimorar a gestão de dados em ambientes digitais. A pesquisa sugere a implementação de metadados de proveniência para promover a veracidade e longevidade dos dados. Palavras-chave: Metadados. Dados
dc.identifier.citationSILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/21866
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma de Pós-Graduação em Ciência da Informação - PPGCI
dc.rightsAttribution-ShareAlike 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/br/
dc.subjectMetadados
dc.subjectDados
dc.subjectProveniência
dc.subjectRepositórios de dados de pesquisa
dc.subject.cnpqCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
dc.titleProveniência de dados e metadados em repositórios de dados de pesquisa
dc.title.alternativeData and metadata provenance in research data repositorieseng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação Felipe Ivo da Silva .pdf
Tamanho:
1.58 MB
Formato:
Adobe Portable Document Format