Proveniência de dados e metadados em repositórios de dados de pesquisa
| dc.contributor.advisor-co1 | Baptista, Ana Alice Rodrigues Pereira | |
| dc.contributor.advisor-co1orcid | https://orcid.org/0000-0003-3525-0619 | |
| dc.contributor.advisor1 | Arakaki, Felipe Augusto | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5324289839207169 | |
| dc.contributor.advisor1orcid | https://orcid.org/0000-0002-3983-2563 | |
| dc.contributor.author | Silva, Felipe Ivo da | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/0753366586589793 | |
| dc.contributor.authororcid | https://orcid.org/0009-0005-1379-4692 | |
| dc.date.accessioned | 2025-04-10T19:52:38Z | |
| dc.date.issued | 2025-04-03 | |
| dc.description.abstract | Research data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity. | eng |
| dc.description.resumo | Os repositórios de dados de pesquisa são ambientes de armazenamento, preservação e compartilhamento de dados científicos, e garantem acessibilidade e reutilização dos dados. A proveniência, que documenta a origem, histórico e transformações dos dados, é fundamental para assegurar a autenticidade, confiabilidade e rastreabilidade das informações. No entanto, a falta de padronização e interoperabilidade entre os principais padrões de metadados utilizados nesses repositórios pode comprometer a eficácia da proveniência. Nesse contexto, a questão central desta pesquisa foi: os padrões de metadados utilizados para a descrição de dados em repositórios de pesquisa asseguram a rastreabilidade e autenticidade das informações ao longo do tempo? O objetivo geral do estudo foi avaliar a aderência dos metadados de proveniência, com base na Família PROV, aos principais padrões de metadados utilizados em repositórios de dados de pesquisa segundo o Re3data, como Dublin Core, DataCite e DDI. A pesquisa buscou identificar como esses padrões podem auxiliar na identificação da autenticidade e rastreabilidade das informações, propondo recomendações para sua aplicação. A metodologia adotada foi teórica e exploratória, utilizando levantamento bibliográfico em bases de dados reconhecidas, análise de literatura especializada e o método Crosswalk para mapear e comparar os padrões de metadados em relação à PROV-O. A análise focou na interoperabilidade entre os padrões e a Família PROV, visando identificar possíveis adaptações para melhorar a interoperabilidade semântica. Os resultados principais indicaram que os padrões analisados possuem diferentes graus de interoperabilidade com a Família PROV. O Dublin Core apresentou a maior correspondência relativa, enquanto DataCite e DDI mostraram níveis mais baixos de interoperabilidade. Apesar da viabilidade de integração, foram identificadas limitações que exigem adaptações para atender aos princípios de interoperabilidade semântica promovidos pelo W3C. Em conclusão, o estudo reforça a importância da proveniência para a confiabilidade e rastreabilidade dos dados em repositórios de dados pesquisa, destacando a necessidade de colaboração interdisciplinar entre Ciência da Informação e Ciência da Computação para aprimorar a gestão de dados em ambientes digitais. A pesquisa sugere a implementação de metadados de proveniência para promover a veracidade e longevidade dos dados. Palavras-chave: Metadados. Dados | |
| dc.identifier.citation | SILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866. | por |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/21866 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Campus São Carlos | |
| dc.publisher.initials | UFSCar | |
| dc.publisher.program | Programa de Pós-Graduação em Ciência da Informação - PPGCI | |
| dc.rights | Attribution-ShareAlike 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-sa/3.0/br/ | |
| dc.subject | Metadados | |
| dc.subject | Dados | |
| dc.subject | Proveniência | |
| dc.subject | Repositórios de dados de pesquisa | |
| dc.subject.cnpq | CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO | |
| dc.title | Proveniência de dados e metadados em repositórios de dados de pesquisa | |
| dc.title.alternative | Data and metadata provenance in research data repositories | eng |
| dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Dissertação Felipe Ivo da Silva .pdf
- Tamanho:
- 1.58 MB
- Formato:
- Adobe Portable Document Format