UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE EDUCAÇÃO E CIÊNCIAS HUMANAS PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO Ananda Fernanda de Jesus RECOMENDAÇÕES TEÓRICO-METODOLÓGICAS PARA A PUBLICAÇÃO DE DADOS BIBLIOGRÁFICOS ABERTOS E CONECTADOS São Carlos, SP 2021 ANANDA FERNANDA DE JESUS RECOMENDAÇÕES TEÓRICO-METODOLÓGICAS PARA A PUBLICAÇÃO DE DADOS BIBLIOGRÁFICOS ABERTOS E CONECTADOS. Dissertação apresentada como requisito parcial para a obtenção do título de Mestre em Ciência da Informação pelo Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de São Carlos Linha de Pesquisa: Tecnologia, Informação e Representação Orientador: Prof. Dr. Fabiano Ferreira de Castro Financiamento: FAPESP - Processo 2018/26545-7 São Carlos, SP 2021 Jesus, Ananda Fernanda de Recomendações teórico-metodológicas para a publicação de dados bibliográficos abertos e conectados / Ananda Fernanda de Jesus. -- São Carlos, A. F. de Jesus, 2021. 166 f. : il. Dissertação (Mestrado em Ciência da Informação) -- Universidade Federal de São Carlos, 2021. Bibliografia: f. 147-166. Orientador: Fabiano Ferreira de Castro. 1. Linked Open Data. 2. Catalogação Descritiva. 3. Dados Bibliograficos. 4. Catálogo Bibliográfico. 5. Revisão Sistemática da Literatura. I. Autor. II. Título. ANANDA FERNANDA DE JESUS RECOMENDAÇÕES TEÓRICO-METODOLÓGICAS PARA A PUBLICAÇÃO DE DADOS BIBLIOGRÁFICOS ABERTOS CONECTADOS. BANCA EXAMINADORA ______________________________ Orientador Prof. Dr. Fabiano Ferreira de Castro Universidade Federal de São Carlos ______________________________ Prof. Dr. Ariel Rodríguez García Universidad Nacional Autónoma de México ______________________________ Prof. Dr. Seiji Isotani Universidade de São Paulo ______________________________ Profa. Dra. Ana Carolina Simionato Arakaki Universidade Federal de São Carlos São Carlos, 26 de fevereiro de 2021. AGRADECIMENTOS Aos meus familiares e amigos por todo apoio ao longo dessa jornada. Ao meu orientador Prof. Dr. Fabiano Ferreira de Castro, por ter me apresentado à pesquisa científica, por toda confiança no meu trabalho e companheirismo. Aos membros da banca examinadora Profa. Dra. Ana Carolina Simionato Arakaki, Seiji Isotani e Prof. Dr. Ariel Rodríguez García pela leitura atenta e pelas contribuições para o desenvolvimento dessa pesquisa. À Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) que possibilitou e financiou a realização dessa pesquisa. (processo n° 2018/26545-7). RESUMO O ambiente Web foi elaborado para proporcionar o compartilhamento de recursos informacionais em formato digital, entretanto sua estrutura original não permite que os agentes computacionais entendam o significado desses recursos, causando problemas no processo de recuperação. O Linked Open Data ou Dados Abertos e Conectados (DAC), são um conjunto de princípios para a publicação de dados estruturados, conectados e disponíveis para reutilização sob uma licença aberta. Sua adoção ameniza os problemas de recuperação de informação na Web e as bibliotecas internacionais já têm se mobilizado para publicar seus dados de acordo com esses princípios. Nesse sentido, questiona-se, como publicar Dados Bibliográficos Abertos Conectados? Objetivou-se analisar o processo de publicação de dados bibliográficos como Dados Abertos Conectados à luz da literatura científica disponível. Foi realizada uma Revisão Sistemática da Literatura e a condução de um estudo empírico das instituições que publicaram os seus dados como DAC. Como resultados obtiveram- se: (a) o mapeamento das características e as especificidades dos dados bibliográficos e sua relação com a inovação e as tecnologias; (b) o estado da arte da relação entre dados bibliográficos e Dados Abertos e Conectados; (c) avaliação dos casos de publicação de dados bibliográficos de acordo com as 10 Melhores Práticas para a publicação de Dados Abertos e Conectados; (d) recomendações sobre a publicação de dados bibliográficos abertos e conectados. Conclui-se, que as recomendações teórico-metodológicas construídas nessa pesquisa podem atuar como um direcionamento para as instituições que pretendem iniciar o processo de publicação de Dados Bibliográficos Abertos e Conectados. Além disso, identifica-se a necessidade de registrar de maneira padronizada as tomadas de decisão das instituições durante o processo de publicação de DAC e que esse processo pode ser feito, a partir do estabelecimento de uma política de publicação de dados bibliográficos como DAC. Conclui-se ainda, que as recomendações estabelecidas podem atuar como um uma referência nacional, para as iniciativas do universo bibliográfico que pretendem publicar seus dados como DAC. Palavras-chave: Linked Open Data. Catalogação Descritiva. Dados Bibliográficos. Catálogo Bibliográfico. Revisão Sistemática da Literatura. ABSTRACT The Web environment was designed to provide the sharing of information resources in digital format, however its original structure does not allow computational agents to understand the meaning of these resources, causing problems in the recovery process. Linked Open Data is a set of principles for publishing structured, connected data and available for reuse under an open license. Its adoption eases the problems of information retrieval on the Web and international libraries have already mobilized to publish their data according to these principles. In this sense it is questioned, how to publish Linked And Open Bibliographic Data? The objective was to analyze the process of publishing bibliographic data as Linked and Open Data in the light of the available scientific literature. A Systematic Literature Review and an empirical study of the institutions that published their data as Linked and Open Data was carried out. The results obtained were: (a) the mapping of the characteristics and specificities of the bibliographic data and its relationship with innovation and technologies; (b) the state of the art of the relationship between bibliographic data and Linked and Open Data; (c) evaluation of the cases of publication of bibliographic data in accordance with the 10 Best Practices for the publication of Linked and Open Data; (d) recommendations on the publication of Connected Open Bibliographic Data. It is concluded that the theoretical-methodological recommendations built in this research can act as a guide for the institutions that intend to start the process of publishing Linked and Open Data. In addition, there is a need to register institutions' decision making in a standardized manner during the Linked and Open Data publication process and that this process can be done based on the establishment of a policy for publishing bibliographic data such as Linked and Open Data. It is also concluded, that the established recommendations can act as a national reference, for the initiatives of the bibliographic universe that intend to publish their data as DAC. Keywords: Linked Open Data. Descriptive cataloging. Bibliographic data. Bibliographic Catalog. Systematic Literature Review. LISTA DE FIGURAS Figura 1: Instrumentos de padronização do universo bibliográfico................... 22 Figura 2: Pilha de tecnologias da Web Semântica. .......................................... 56 Figura 3: Sistema de 5 estrelas de Dados Abertos. ......................................... 59 Figura 4:Impacto da publicação dos dados bibliograficos como DAC na estrutura do catálogo bibliográfico. ................................................................... 62 Figura 5: Etapas da Revisão Sistemática da Literatura .................................... 64 Figura 6: Preenchimento do protocolo de busca no StArt. ............................... 69 Figura 7: Proporção de documentos aceitos, rejeitados e duplicados na fase de execução. .................................................................................................... 70 Figura 8: Estrutura de um registro MARC21. ................................................. 111 LISTA DE QUADROS Quadro1: Autores que abordaram a evolução da Catalogação e sua relação com as tecnologias ................................................................................................................ 25 Quadro 2: Marcos da evolução dos registros e dos dados bibliográficos à luz das tecnologias. ............................................................................................................... 49 Quadro 3: Melhores Práticas para a publicação de DAC. ......................................... 60 Quadro 4: Preenchimento do protocolo de busca no StArt. ...................................... 64 Quadro 5: Proporção de documentos aceitos, rejeitados e duplicados na fase de execução. .................................................................................................................. 71 Quadro 6: Proporção de documentos aceitos, rejeitados e duplicados na fase de execução. .................................................................................................................. 73 Quadro 7: Casos de dados bibliográficos publicados como DAC. ............................ 80 Quadro 8: Relação entre as iniciativas e justificativas que embasam a adoção de DAC .................................................................................................................................. 83 Quadro 9: Análise do processo de seleção de dados para a publicação como DAC 91 Quadro 10: Análise dos modelos de dados apresentados pelas instituições ............ 95 Quadro 11: Licença para abertura de dados adotado pelas iniciativas. .................... 99 Quadro 12: Informações a respeito do estabelecimento de URIs fornecidas pelas instituições............................................................................................................... 103 Quadro 13: Vocabulários adotados pelas instituições. ............................................ 107 Quadro 14: Análise do processo de conversão realizado pelas iniciativas. ............ 109 Quadro 15: Formas de acesso aos dados das iniciativas. ...................................... 113 Quadro 16: Sistematização das formas de divulgação adotadas pelas instituições. ................................................................................................................................ 118 Quadro 17: Instrumentos que serviram como base para a modelagem de dados das instituições............................................................................................................... 126 Quadro 18: Mapeamento das licenças utilizadas pelas instituições. ....................... 128 Quadro 19: Referências adotadas pelas instituições para auxiliar no estabelecimento de ............................................................................................................................ 130 Quadro 20: Vocabulários adotados no universo bibliográfico. ................................ 131 Quadro 21: Ferramentas que podem auxiliar no processo de conversão de dados bibliográficos para DAC. .......................................................................................... 133 LISTA DE SIGLAS AACR - Anglo-American Cataloging Rules ALA - American Library API - Application Programming Interface BAV - Biblioteca Apostolica Vaticana BDTD - Biblioteca Digital Brasileira de Teses e Dissertações BIBFLOW - University of California Library Catalog BIBFRAME - Bibliographic Framework BNB - The British National Bibliography BNE - Biblioteca Nacional de Espanã BNF - Bibliothèque Nationale de France BRAPCI - Base de Dados Referencial de Artigos de Periódicos em Ciência da Informação CBU - Controle Bibliográfico Universal CDLI - The Canadian Linked Data Initiative DAC - Dados Abertos Conectados DNB - Deutsche Nationalbibliothek DPLA - Digital Public Library of America FEBAB - Federação Brasileira de Associações de Bibliotecários, Cientistas de Informação e Instituições FENNICA - Finnish National Bibliography HTML - Hypertext Markup Language HTTP - Hypertext Transfer Protocol IFLA - International Federation of Library Associations and Institutions ISBD - International Standard Bibliographic Description KB - Koninklijke Bibliotheek LAPES - Laboratório de Pesquisa em Engenharia de Software LC - Library of Congress LD4L - Linked Data for Libraries LD4P - Linked Data for Production LIBRIS - Library Information System of Swedish National Union MARC - Machine Readable Cataloging MPs - Melhores Práticas NLAI - National Library of Iran NLM - National Library of Medicine NSZL - National Széchényi Library OPAC - Online Public Access Catalog RDA - Resource Description and Access RDF - Resource Description Framework RIEC - Reunião Internacional de Especialistas em Catalogação RSL - Revisão Sistemática da Literatura RUNA - Rainis and Aspazija StArt - State of the Art through Systematic Review TAMU - Texas A&M University Library UFSCar - Universidade Federal de São Carlos UNLV - University of Nevada Las Vegas Library URI - Uniform Resource Identifier URL - Uniform Resource Locator URN - Uniform Resource Name VIAF - Virtual International Authority File W3C - World Wide Web Consortium SUMÁRIO 1 INTRODUÇÃO ...................................................................................... 13 1.2 Justificativa ............................................................................................. 15 1.1 Objetivos ................................................................................................ 16 1.3 Estrutura da dissertação ......................................................................... 16 2 DADOS BIBLIOGRÁFICOS: definições e interlocuções com as tecnologias e a inovação ............................................................................... 18 2.1 Dados bibliográficos: definições e contexto ............................................ 18 2.2 Dados bibliográficos: inovação e tecnologias ......................................... 23 2.2.1 Os dados bibliográficos e os primeiros recursos bibliográficos ............... 28 2.2.2 Os dados bibliográficos e o desenvolvimento da imprensa ..................... 30 2.2.3 Os dados bibliográficos durante o período tradicional ............................. 34 2.2.4 Os dados bibliográficos e o início da mecanização ................................. 40 2.2.5 Os dados bibliográficos com o uso dos computadores e da Web ........... 44 2.2.6 Marcos tecnológicos, instrumentos e estruturas dos catálogos e registros bibliográficos ...................................................................................... 48 3 DADOS ABERTOS CONECTADOS....................................................... 54 4 PROCEDIMENTOS METODOLÓGICOS ............................................... 63 5 RESULTADOS DA REVISÃO SISTEMÁTICA DA LITERATURA ......... 69 6 ANÁLISE DAS INICIATIVAS DE PUBLICAÇÃO DE DADOS BIBLIOGRAFICOS À LUZ DAS 10 MELHORES PRÁTICAS ......................... 80 6.1 Prepare as partes interessadas ............................................................... 82 6. 2 Selecione um conjunto de dados ............................................................ 91 6.3 Modele os dados ..................................................................................... 95 6.4 Especifique uma licença apropriada ........................................................ 98 6.5 Estabeleça bons URIS .......................................................................... 101 6.6 Utilize vocabulários-padrões ................................................................. 106 6.7 Converta os dados em dados conectados ............................................ 108 6. 8 Promova acesso aos dados conectados .............................................. 113 6.9 Anuncie os dados disponibilizados ao público ..................................... 118 6.10 Estabeleça um contrato de responsabilidade como publicador ............ 121 7 PROPOSTA DE RECOMENDAÇÕES TEÓRICO-METODOLÓGICAS PARA A PUBLICAÇÃO DE DADOS BIBLIOGRÁFICOS COMO DAC ........ 123 8 CONSIDERAÇÕES FINAIS ................................................................... 140 REFERÊNCIAS ..................................................................................... 145 13 1 INTRODUÇÃO A busca por formas mais eficientes de utilizar e de organizar os recursos informacionais acompanha a história da informação registrada desde o desenvolvimento da escrita, tornando-se mais urgente no contexto atual, caracterizado pela chamada explosão da informação, onde “[...] o termo explosão de informação é uma metáfora (como é a “explosão populacional”) porque nada realmente explodiu, mas apenas cresceu a uma taxa alta, mesmo que exponencialmente”. (SARACEVIC, 2009, p. 1, tradução nossa). Nesse contexto informacional, o ambiente Web foi desenvolvido com o escopo de permitir o compartilhamento de informações, pautado em um formato de apresentação de uso simples, cujo objetivo é possibilitar a visualização dos conteúdos, estabelecendo-se como um importante meio de comunicação. Entretanto, a estrutura original da Web faz com que apenas usuários humanos sejam capazes de entender o significado dos recursos informacionais e não permite que os agentes computacionais (usuários não humanos) extraíam significados desses recursos e das relações existentes entre eles. (ISOTANI; BITTENCOURT, 2015). Com o aumento exponencial da disponibilização de recursos na Web, a busca eficiente de informação por usuários humanos se torna inviável. Para que os agentes computacionais possam utilizar as informações contidas na Web para realizar atividades de maneira automatizada, auxiliando na recuperação e na utilização eficiente dos recursos informacionais é necessário que sejam fornecidas características desses recursos (ISOTANI; BITTENCOURT, 2015). Um elemento importante para fornecer informações sobre os recursos de maneira formal, ou seja, legível por computadores, são os metadados, ou “dados que descrevem outros dados em um sistema de informação, com o intuito de identificar de forma única uma entidade (recurso informacional) para posterior recuperação”. (ALVES, 2010, p. 47). Como forma de ampliar a disponibilização e a padronização desses metadados, e ainda permitir a explicitação das relações existentes entre eles, foi proposto um conjunto de práticas denominado Linked Data, ou em português Dados Conectados. De acordo com Berners-Lee (2006), os Dados Conectados consistem na conexão desses dados representados com base na utilização de identificadores únicos e na 14 adoção de um formato padrão, partindo da utilização de links que permitem relacionar dados advindos de fontes diversas. Arakaki (2016) aponta que os Dados Conectados também podem ser atrelados aos princípios de Dados Abertos, um conjunto de recomendações que visa ampliar as possibilidades de reutilização de dados na Web, resultando nos chamados Linked Open Data, ou em português Dados Abertos e Conectados (DAC)1. Em 2014 foram elaboradas 10 Melhores Práticas (MPs) para a publicação de DAC, o documento consiste em um conjunto de orientações sobre todo o processo, desde o preparo da equipe até a seleção, a conversão e a disponibilização dos dados. As bibliotecas, enquanto ambientes informacionais padronizados, são fornecedoras importantes de metadados, devido à sua tradição na utilização de modelos, de formatos, de códigos e de padrões que garantem a consistência, a unicidade e a veracidade dos seus dados. Entretanto, esses formatos e padrões não foram projetados para serem recuperados por meio dos buscadores da Web. Além disso, as novas estruturas de armazenamento, os tipos documentais, os meios de busca e obtenção de informação advindos da Web alteraram o comportamento e as necessidades dos usuários de informação. Ampliar a utilização dos DAC no contexto das bibliotecas possibilita adequar os dados bibliográficos ao cenário informacional e tecnológico contemporâneos e, ao mesmo tempo, contribui para melhorar a recuperação da informação no ambiente Web. Arakaki (2016) aponta as iniciativas em bibliotecas no exterior que já se mobilizaram para publicar dados bibliográficos como DAC, demonstrando que já existe um movimento dessas instituições no sentido de adotar as práticas de DAC. Entende-se que é de interesse para as bibliotecas que seus dados sejam compartilhados na Web, como forma de reduzir custos e evitar retrabalho. É também interesse do ambiente Web que esses dados sejam compartilhados por sua qualidade e consistência. Ressaltado o interesse mútuo na publicação de dados bibliográficos como DAC questiona-se: Como publicar Dados Bibliográficos Abertos Conectados? Parte-se da hipótese de que as experiências institucionais de publicação de DAC, somadas às bases de conhecimento da Catalogação Descritiva e alinhadas 1 Para essa pesquisa utiliza-se o termo Dados Abertos Conectados em maiúsculo para referir-se ao conjunto de recomendações do W3C. 15 às melhores práticas para a publicação de Dados Abertos e Conectados do W3C podem ser sistematizadas para compor recomendações teórico-metodológicas, visando fornecer exemplos e fomentar discussões voltadas para as especificidades dos dados bibliográficos. 1.2 Justificativa A proposta de pesquisa é motivada pelos estudos da Iniciação Científica e do Trabalho de Conclusão de Curso da autora2, que analisou a literatura científica nacional e internacional sobre a relação entre dados bibliográficos e os Dados Conectados. A pesquisa constatou que a adequação dos dados bibliográficos aos princípios de Dados Conectados seria relevante por, entre outras vantagens, promover a interoperabilidade dos dados com fontes externas ao catálogo bibliográfico, melhores resultados de busca, maior visibilidade dos dados bibliográficos na Web e ainda a descoberta acidental de recursos. O estudo constatou que, no âmbito internacional, a maioria dos artigos teve como enfoque apresentar estudos práticos sobre o processo de adequação, enquanto nacionalmente, os estudos são em sua maioria teóricos, demonstrando que no Brasil, no contexto da Ciência da Informação, ainda são poucas as aplicações práticas. Desse modo, no aspecto científico, essa pesquisa se justifica pela elaboração de recomendações sobre como publicar dados bibliográficos em consonância com as Melhores Práticas para a publicação de Dados Abertos e Conectados. Justifica-se ainda pela construção de um estado da arte advindo dos resultados da Revisão Sistemática da Literatura (RSL). Do ponto de vista das comunidades de prática, justifica-se pela aplicabilidade das recomendações na realização de projetos de publicação de dados bibliográficos como DAC, permitindo que os profissionais se apropriem da experiência adquirida 2 “DOS CATÁLOGOS BIBLIOGRÁFICOS AO MOVIMENTO LINKED DATA: um estudo dos dados de controle de autoridade das Universidades Públicas Paulistas.” - PIBIC/CNPq - processo no 121352/2016. “Dos catálogos bibliográficos ao movimento Linked Data: um estudo dos dados de controle de autoridade das Universidades Públicas Paulistas” – processo FAPESP n° 2017/06707-0. 16 durante a condução de outros projetos e que compartilhem suas experiências com outros profissionais. No que tange à abordagem social, a relevância desse estudo se justifica pelos benefícios que a adequação dos dados bibliográficos traria para os usuários de informação, ao tornar os catálogos mais navegáveis, melhorar a recuperação de informação no ambiente Web e ao promover a descoberta acidental de recursos em a partir disponibilização de dados confiáveis, de forma que a adequação contribuirá para a democratização da informação. 1.1 Objetivos O objetivo geral dessa pesquisa é analisar o processo de publicação de dados bibliográficos como Dados Abertos e Conectados à luz da literatura científica disponível. Para tanto, foram delineados os seguintes objetivos específicos: • Mapear as características e as especificidades dos dados bibliográficos; • Analisar e apresentar o estado da arte sobre a publicação de dados bibliográficos como DAC; • Analisar e apresentar os casos de publicação de dados bibliográficos como DAC, a partir da perspectiva das 10 Melhores Prática do W3C; e • Propor recomendações para a publicação de dados bibliográficos como DAC. 1.3 Estrutura da dissertação Esta dissertação é composta pelas seguintes seções: • 1 INTRODUÇÃO – contendo a contextualização da temática de interesse, delimitação do problema de pesquisa, objetivos e justificativa; • 2 DADOS BIBLIOGRÁFICOS - DEFINIÇÕES E INTERLOCUÇÕES COM AS TECNOLOGIAS E INOVAÇÃO – abrangendo a discussão sobre os conceitos de dados bibliográficos e recursos bibliográfico, bem como a sua relação com a inovação e as tecnologias disponíveis; 17 • 3 DADOS ABERTOS CONECTADOS - seção na qual são apresentados os princípios de Dados Conectados, Dados Abertos e discutidas as 10 Melhores Práticas para a publicação de Dados Abertos e Conectados; • 4 PROCEDIMENTOS METODOLÓGICOS – seção composta pelas etapas e procedimentos metodológicos seguidos para atingir os objetivos da pesquisa. Nessa seção são discutidos os procedimentos realizados na etapa da RSL, no estudo empírico e na elaboração das recomendações para a publicação de dados bibliográficos como DAC; • 5 RESULTADOS DA REVISÃO SISTEMÁTICA DA LITERATURA – seção onde são apresentados os documentos recuperados a partir da RSL, discutindo as formas de abordagem da temática de interesse pelos documentos recuperados e seu enquadramento em categorias de análise específicas; • 6 ANÁLISE DAS INICIATIVAS DE PUBLICAÇÃO DE DADOS BIBLIOGRAFICOS À LUZ DAS 10 MELHORES PRÁTICAS - seção onde são apresentados os resultados do estudo das iniciativas de publicação de dados bibliográficos como DAC e sua relação com as 10 (dez) Melhores Práticas (MPs) publicadas pelo W3C (2014); • 7 PROPOSTA DE RECOMENDAÇÕES PARA A PUBLICAÇÃO DE DADOS BIBLIOGRÁFICOS COMO DAC - seção onde são apresentadas as recomendações para a publicação de dados bibliográficos como DAC baseadas nas 10 MPs do W3C e na experiência de iniciativas de publicação de DAC do universo bibliográfico; e • 8 CONSIDERAÇÕES FINAIS – seção onde são retomados e discutidos os principais resultados da pesquisa, as lacunas identificadas e as propostas de pesquisas futuras. 18 2 DADOS BIBLIOGRÁFICOS: definições e interlocuções com as tecnologias e a inovação A presente seção foi construída com o objetivo de definir o termo “dado bibliográfico”, bem como os conceitos a ele relacionados, uma vez que há uma gama de dados advindos de comunidades e de domínios heterogêneos, com suas especificidades próprias e particulares. Apresenta também a contextualização dos dados bibliográficos e sua evolução ao longo da história, além de estabelecer as relações com as tecnologias e a inovação. 2.1 Dados bibliográficos: definições e contexto A informação se caracteriza como elemento imperativo no desenvolvimento humano, influenciando tomadas de decisão, transmitindo tradições e garantindo a sobrevivência dos sujeitos na sociedade. Para Buckland (1991), a informação pode ser entendida no sentido de conhecimento comunicado – elemento capaz de reduzir ou aumentar a incerteza do indivíduo a respeito de determinada temática de interesse. A importância da informação como insumo para a sobrevivência e evolução se torna evidente com o estabelecimento das sociedades agrárias, onde a agricultura “[...] pressupõe uma organização pensada do tempo delimitado, todo um sistema do atraso, uma especulação sobre as estações”. (LÉVY, 2010, p. 53). Antes do estabelecimento da escrita, o compartilhamento de informações era limitado à comunicação oral, onde [...] a mensagem linguística era sempre recebida no tempo e lugar em que eram emitidas. Emissores e receptores compartilhavam de uma situação idêntica, na maior parte do tempo, universo semelhante de significação. (LÉVY, 1999, p. 113). A busca por formas mais eficientes de transmitir a informação fez com que a escrita fosse desenvolvida de maneira simultânea em diversas sociedades agrárias da antiguidade (LÉVY, 2010). Segundo McGarry (1999, p. 11-12) para que essa informação representada por meio da escrita possa ser utilizada ela precisa ser contida em alguma forma, “[...] pode estar contida em qualquer coisa que uma pessoa escreva, componha, imprima, desenhe ou transmita por meios similares [...]”. A 19 informação, portanto, deve ter alguma forma de veículo”. Esse veículo da informação também é denominado como estrutura, o qual propicia suporte informacional. Existe uma pluralidade de termos para representar o registro de um conteúdo intelectual ou artístico em uma determinada estrutura, tomando como exemplos: informação registrada, recurso informacional, informação como coisa, item, artefato, obra, entidade, documento, unidade informacional e recurso informacional. Para essa pesquisa optou-se por utilizar o termo recurso informacional. Em um primeiro momento, as bibliotecas tiveram o papel de selecionar os recursos pertinentes a determinadas comunidades, armazená-los e preservá-los. A leitura e a escrita eram restritas à elite e a reprodução desses recursos era custosa e lenta, porém, mesmo com essas limitações, grandes coleções de documentos se estabeleceram. (WERSIG, 1993). Como resultado da criação dessas coleções passou-se a buscar formas de organizar as coleções administradas pelo universo bibliográfico. Para essa pesquisa o universo bibliográfico é compreendido como “O escopo relacionado às coleções das bibliotecas. Em um sentido amplo, pode incluir as coleções de outras comunidades relacionadas a informações, como arquivos, museus e entre outros”. (DECLARAÇÃO, 2016, p.18). Os avanços tecnológicos possibilitaram o desenvolvimento de novos suporte e meios para reprodução dos recursos bibliográficos, invertendo a proporção entre informação disponível e leitores em potencial, levando a necessidade de construir formas eficientes de comunicar aos usuários os recursos contidos nas coleções. “Para que a instituição possa disponibilizar a informação gerada por outros, ela elabora e disponibiliza uma informação documentária, secundária em relação à informação contida nos documentos”. (SMIT, 2012, p. 96). Essas informações secundárias passaram a compor listas que representavam as coleções do universo bibliográfico, essas listas eram compostas por registros bibliográficos. Quando coleções de informações se tornaram muito grandes para organizar e acessar diretamente, os bibliotecários criaram substitutos, registros bibliográficos para representar itens específicos do acervo de uma biblioteca, física ou digital. O objetivo desses registros bibliográficos é ostensivamente descrever um documento em suficientes detalhes para identificá-lo exclusivamente entre outros documentos e especificar onde o registro pode estar localizado em um 20 arquivo de outros registros bibliográficos. (CLARKE, 2014, p. 2, tradução nossa). O termo registro bibliográfico pode ser definido como um “[...] agregado de dados que estão associados a entidades descritas em catálogos de bibliotecas”. (IFLA, 2009, p. 8. tradução nossa). Embora o termo tenha caído em desuso, de acordo com a Declaração (2016), entende-se que sua conceitualização e discussão são pertinentes por representar a forma histórica como tem sido agrupados os dados bibliográficos. Originalmente, meros título e autor eram suficientes para distinguir uma obra entre outras e ordenar seu registro dentro de uma coleção de registros. Mas com o tempo, as quantidades e tipos de dados que constituem detalhes suficientes para descrever um recurso com exclusividade e oferecer acesso à sua descrição aumentaram. (CLARKE, 2014, p. 2, tradução nossa). Com o objetivo de estruturar e de padronizar as tentativas até então dispersas de representação das informações contidas nos acervos das bibliotecas tem-se a Catalogação Descritiva, que é responsável por garantir a unicidade e o instanciamento do recurso informacional nos catálogos bibliográficos disponíveis. “A catalogação é o processo por meio do qual se descreve formalmente um documento ou recurso e se estabelece um variado e variável número de pontos de acesso [...]”. (CATARINO; SOUZA, 2012, p. 84). De acordo com Faria (2018, p. 26) a catalogação pode ser entendida ainda como “[...] o processo intelectual, analítico e técnico de registro de dados dos recursos informacionais, que expressa as características essenciais dos recursos, estabelecendo o relacionamento entre eles”. A Catalogação também pode ser conceituada enquanto uma disciplina, que [...] apresenta-se como parte da Biblioteconomia e da Ciência da Informação referindo-se ao conjunto de conhecimentos acerca das teorias, dos instrumentos de representação e das tecnologias relacionadas à catalogação enquanto processo. (ASSUMPÇÃO, 2018, p. 21). Existe uma pluralidade conceitual acerca da Catalogação Descritiva. Desse modo, utiliza-se o conceito de Castro (2020), pois é o que mais se adequa e vai ao encontro dos propósitos dessa pesquisa e de acordo com o contexto tecnológico vigente. Assim, a Catalogação Descritiva é definida como, 21 [...] uma área de conhecimento teórico-aplicada-tecnológica e especializada, advinda do domínio bibliográfico, com a finalidade de descrever uma obra/recurso/entidade, dados e informações, responsável pela modelagem de sistemas interconectados por atributos de representações construídos e codificados, a partir de regras e padrões internacionalmente aceitos, garantindo a unicidade da entidade e multidimensionando sua forma de acesso e de recuperação, primando pela efetiva comunicação do usuário com o ambiente informacional e potencializada para outros domínios do conhecimento. (CASTRO, 2020, p. 123). Como um resultado da catalogação enquanto processo e objeto de estudo da Catalogação enquanto disciplina, têm-se os catálogos bibliográficos, responsáveis por possibilitar o armazenamento dos registros bibliográficos e a identificação dos recursos presentes em um acervo, visando permitir que o usuário encontre, identifique, selecione, navegue e adquira determinado recurso (DECLARAÇÃO, 2016). Para Santos (2019), um registro bibliográfico é considerado como a unidade básica do catálogo e muitas vezes entendido pelas práticas discursivas como um sinônimo dos termos entrada e ficha catalográfica. Assim como um registro bibliográfico se estabeleceu como unidade básica de um catálogo, os dados bibliográficos são a unidade básica de um registro bibliográfico, cada registro possui dados que descrevem os recursos bibliográficos quanto às suas características de forma e de conteúdo, possui ainda um variado número de dados bibliográficos que atuam como pontos de acesso. Um ponto de acesso é entendido como Um nome, termo, código e entre outros pelo qual os dados bibliográficos ou de autoridade são pesquisados e identificados. Os pontos de acesso também cumprem uma função de ordenação no catálogo. (DECLARAÇÃO, 2016, p.17). Santos (2019) aponta que os pontos de acesso também foram conhecidos como cabeçalhos, por estarem localizados na parte superior dos registros bibliográficos. Concorda-se ainda com Santos (2019), que ao explorar a pluralidade conceitual do termo entrada aponta que: [...] a questão terminológica, que muitas vezes confunde a estudantes e especialistas, é a de que o termo “entrada” é usado tanto para o cabeçalho da ficha, quanto para a própria ficha catalográfica; nesta pesquisa, porém, vale-se de “entrada” para indicar o segundo significado e “cabeçalho da entrada” para o primeiro. (SANTOS, 2019, p. 27). 22 A mesma pluralidade terminológica afeta o termo ficha catalográfica, utilizado tanto para descrever a estrutura de armazenamento, onde podem ser inscritos os registros bibliográficos, como o conjunto de dados bibliográficos. Nesse sentido, é imprescindível compreender que a ficha catalográfica se refere a estrutura de armazenamento onde são registrados os dados bibliográficos, enquanto registro bibliográfico se refere a um conjunto de dados bibliográficos, instanciados em diversas estruturas. Para garantir a consistência dos registros bibliográficos ao longo da história da Catalogação Descritiva foram desenvolvidos instrumentos para a padronização do processo de representação desses recursos. O Library Liked Data Incubator Group (2005) realiza uma sistematização dos instrumentos de padronização do universo bibliográfico, listando os princípios de catalogação, as regras ou os códigos de catalogação, os formatos de intercâmbio e os modelos conceituais. A figura 1, elaborada com base na sistematização do Library Liked Data Incubator Group (2005) e nas definições apresentadas por Declaração (2016), Castro (2012) e Assumpção (2018), representa uma síntese desses instrumentos de padronização, aos quais são acrescentadas as políticas de catalogação e o catálogo de autoridade. Figura 1: Instrumentos de padronização do universo bibliográfico. Fonte: Autora (2021). A aplicação desses instrumentos tem garantido a consistência e a representatividade dos dados bibliográficos ao longo dos anos, nos catálogos 23 disponíveis. Após a conceitualização do termo dado bibliográfico, a próxima subseção irá discuti-lo a partir de sua relação com a inovação e as tecnologias, buscando ainda realizar um resgate da evolução dos instrumentos de padronização e como essa evolução afetou os dados contidos nos registros bibliográficos. 2.2 Dados bibliográficos: inovação e tecnologias Nas práticas discursivas, o conceito de inovação é quase sempre entendido de maneira indissociável dos conceitos de invenção e tecnologia, principalmente a aplicação de tecnologia para a criação de novos produtos. Entretanto, a inovação não se limita à invenção e nem mesmo ao desenvolvimento de produtos tecnológicos, embora as tecnologias disponíveis em cada momento histórico desempenhem um papel importante no processo de inovar. A inovação pode consistir inclusive na utilização de um produto ou processo que não é novo para a as demandas ao qual foi criado, mas foi adaptado como forma de atender a novas demandas. “A inovação está presente na vida de todas as pessoas e surge com o propósito de otimizar o cotidiano de cada um, seja por meio de produtos, processos, serviços ou tecnologias”. (MACHADO; STORTI; ZAFALON, 2018, p. 1). A inovação possui uma relação com o uso e principalmente reuso das tecnologias disponíveis para a melhoria de processos, de produtos e de serviços. Clarke (2012) aponta que, embora seja constantemente relacionada à indústria, ela também é primordial para às instituições do universo bibliográfico, que precisam se manter atuais, atender às necessidades dos usuários que estão em constante mudança e ainda competir por recursos disponíveis. As ferramentas criadas pela humanidade desde os tempos pré- históricos aspiravam uma forma de simplificar os trabalhos por eles desenvolvidos e, à medida em que foram criadas, outras necessidades também surgiram e exigiram que novas formas de instrumentos, ou sua melhoria, fossem estudadas, criadas, testadas e aplicadas. (MACHADO; ZAFALON, 2019, p. 2). Entende-se que, as tecnologias disponíveis vão além de ferramentas que podem melhorar processos, elas afetam a produção de informação registrada e, consequentemente, as necessidades dos usuários, as quais se configuram como o objetivo central da elaboração dos catálogos bibliográficos. 24 A tecnologia perpassa todas as atividades humanas e deve ser entendida “[...] como a totalidade do patrimônio material humano, como influenciada e influenciadora do modo de ser e estar do ser humano no mundo”. (SANTOS; VIDOTTI, 2009, p. 5). Nesse sentido, os avanços tecnológicos não afetaram somente os suportes e as possibilidades de acesso à informação, eles criaram formas de ser e de se posicionar na sociedade e principalmente colocam a informação registrada em destaque. Essas tecnologias também afetam a Catalogação Descritiva, já que ela [...] encontra nas tecnologias o suporte indispensável para criação de um canal de comunicação entre usuário e informação. Tal processo integra todas as atividades do ciclo de representação da informação [...]. (ARAKAKI; SIMIONATO; SANTOS, 2017, p. 5). Alves (2010) acrescenta que desde a antiguidade, as práticas da catalogação têm sido aprimoradas com o objetivo de utilizar alguma tecnologia como aporte para melhoria dos processos e serviços oferecidos. Reconhecendo a importância das tecnologias disponíveis para o desenvolvimento do universo bibliográfico e especialmente para a Catalogação Descritiva, buscou-se identificar na literatura nacional, estudos que traçam o histórico da relação entre as tecnologias disponíveis e o desenvolvimento das práticas da catalogação. As buscas foram realizadas na Base de Dados em Ciência da Informação (BRAPCI) e na Biblioteca Digital Brasileira de Teses e Dissertações (BDTD), durante o mês de julho de 2020, a partir dos termos representação descritiva, catalogação, catálogo bibliográfico, registro bibliográfico, dado bibliográfico, bem como suas variações no plural. Foram considerados os documentos em que pelo menos em uma sessão foi realizada uma análise da evolução cronológica que permita avaliar a aplicação de tecnologias no processo de catalogação. O quadro 1 apresenta os autores e os trabalhos identificados, divididos por tipo documental. 25 Quadro1: Autores que abordaram a evolução da Catalogação e sua relação com as tecnologias Autor Título Tipo de documento CASTRO (2020) Catalogação descritiva: necessidade de revisão em suas bases teórico conceituais? Artigo LOURENÇO (2020) Novas tendências em catalogação: o novo paradigma da catalogação a partir da modelagem conceitual Artigo DUMER (2019) Representação descritiva da informação em bibliotecas: um estudo sobre os formatos de intercâmbio Dissertação HOLANDA; LOURENÇO (2019) Percepção da RDA para implementação nas bibliotecas da Universidade Federal de Minas Gerais Artigo SANTOS (2019) Fundamentos estruturais do registro bibliográfico: revisitando a compreensão de Seymour Lubetzky sobre a entrada principal representativa da obra e sua manifestação Tese MACHADO; ZAFALON (2019) Panizzi, Cutter, Lubetzky, Jewett e Ranganathan e as relações com o RDA: princípios teóricos da catalogação descritiva Artigo DUMER; ALBUQUERQUE (2018) Representação descritiva da informação em bibliotecas: um estudo sobre os formatos de intercâmbio Artigo FARIA (2018) Premissas normativas para construção da política de catalogação em RDA: estudo de caso no sistema de bibliotecas da UFMG Dissertação SANTOS (2018) Contribuições de Andrew Maunsell à catalogação: uma breve narrativa do cabeçalho bíblia Artigo AGANETTE; TEIXEIRA; AGANETTE (2017) A representação descritiva nas perspectivas do século xxi: um estudo evolutivo dos modelos conceituais Artigo ARAKAKI; SIMIONATO; SANTOS (2017) Catalogação e tecnologia: interseções com a Web semântica. Artigo ASSUMPÇÃO; SANTOS; ZAFALON (2017a) O controle de autoridade no domínio bibliográfico: os catálogos em livros e em fichas Artigo ASSUMPÇÃO; SANTOS; ZAFALON (2017b) O controle de autoridade no domínio bibliográfico: os catálogos digitais Artigo SERRA et al. (2017) Os princípios da descrição e os formatos MARC 21 e ONIX Artigo SERRA; SANTARÉM SEGUNDO (2017) O catálogo da biblioteca e o Dados Abertos Conectados Artigo 26 SILVA; SERRA, SANTARÉM SEGUNDO (2018) O orcid como aplicação de Dados Abertos Conectados no catálogo de bibliotecas Artigo SILVA et al. (2017) O código RDA e a iniciativa BIBFRAME: tendências da representação da informação no domínio bibliográfico Artigo SOUZA; BEZERRA (2016) Descrição de recursos em uma estrutura de metadados pautada no modelo FRBR Artigo TOLENTINO; ORTEGA (2016) A descrição sob o ponto de vista da catalogação, da bibliografia e da catalografia Artigo ASSUMPÇÃO; SANTOS (2015) Representação no domínio bibliográfico: um olhar sobre os formatos MARC 21 Artigo GRINGS (2015 Controle de autoridades na biblioteca nacional do Brasil: breve histórico e práticas atuais. Artigo SALGADO (2015) O controle de autoridade sob a norma rda: análise da aplicação e implicações na construção de registros de autoridade Dissertação SILVA; SILVA (2015) Análise da descrição bibliográfica do inventário da primeira biblioteca pública de São Paulo Artigo SOUSA (2015) Políticas para representação descritiva: ponderações para discussão Artigo TOLENTINO (2015) A técnica da descrição em catálogos e bibliografias: contribuição aos fundamentos da catalogação Dissertação ALMEIDA (2014) Padrão de descrição de informação: avaliação da capacidade representacional de bens materiais Dissertação GODINHO; FARIA (2014) Catalogação cooperativa: história, vantagens e desvantagens. Artigo SOUZA; HILLESHEIM (2014) Tratamento da informação e o uso das tecnologias da informação e comunicação. Artigo BASTOS (2013) A interação do usuário com catálogos bibliográficos on-line: investigação a partir da teoria fundamentada Tese SILVEIRA (2013) A trajetória da autoria na representação documental Tese SOUSA; FUJITA (2012) Do catálogo impresso ao on-line: alguns desafios para os profissionais bibliotecários. Artigo TABOSA; PAES (2012) Ferramentas tecnológicas na representação descritiva de documentos Artigo ARAÚJO (2011) Catálogo da biblioteca: o objeto Orientado ao usuário Artigo 27 Fonte: Autora (2021) Foram identificados 45 documentos, entre artigos, teses e dissertações que discutem a evolução tecnológica da Catalogação Descritiva, seus produtos e instrumentos de padronização. Considerando-se os trabalhos destacados no Quadro 1 e o referencial teórico utilizado na construção desses trabalhos, busca-se apresentar um breve histórico da evolução dos registros e dos dados bibliográficos, no cenário nacional. A divisão dos MORENO (2011) Em busca dos objetivos bibliográficos: um estudo sobre catálogos Tese ORTEGA (2011) Do princípio monográfico à unidade documentária: exploração dos fundamentos da catalogação Artigo ALVES (2010) Metadados como elementos do processo de catalogação Tese FUSCO (2010) Modelos conceituais de dados como parte do processo da catalogação: perspectiva de uso dos FRBR no desenvolvimento de catálogos bibliográficos digitais Tese CASTRO (2008) Padrões de representação e descrição de recursos informacionais em bibliotecas digitais na perspectiva da ciência da informação: uma abordagem do marcont initiative na era da Web semântica Dissertação CORRÊA (2008) Catalogação descritiva no século xxi: um estudo sobre o RDA Dissertação BAPTISTA (2006) A catalogação como atividade profissional especializada e objeto de ensino universitário Artigo MORENO; ARELANO (2005) Requisitos funcionais para registros bibliográficos - FRBR: uma apresentação Artigo VILAN FILHO (1992) Sistema de hipertexto para microcomputadores: uma aplicação em informação científica e tecnológica Dissertação FIUZA (1987) A catalogação bibliográfica até o advento das novas tecnologias Artigo PINTO (1987) Catálogos e bibliografias: evolução histórica do trabalho de controle bibliográfico. Artigo CAPOS (1984) Regras portuguesas de catalogação Artigo PEREIRA-MULLER (1984) Normas de catalogação: brevíssima história e comparação. Artigo FIUZA (1980) Funções e desenvolvimento do catálogo: uma visão retrospectiva. Artigo 28 períodos foi baseada em Alves (2010), que apresenta a seguinte divisão: 1) Períodos Remotos; 2) Período Tipográfico; 3) Período Tradicional; 4) Período Pré-Mecanizado; 5) Período Mecanizado; e 6) Período de Metadados. Dessa forma, propõe-se a seguinte categorização: • Os dados bibliográficos e os primeiros recursos bibliográficos – compreendendo aos “Períodos Remotos”, abrangendo o início da necessidade de sistematização da informação até o desenvolvimento da imprensa; • Os dados bibliográficos no período tipográfico – Equivalente ao “Período Tipográfico”, abrangendo o surgimento e o estabelecimento da imprensa, terminando no início da formalização dos instrumentos de padronização; • Os dados bibliográficos durante o período tradicional – “Período Tradicional” - período que compreende o início da formalização dos instrumentos de padronização e é encerrado com a realização de diversas avaliações críticas desses instrumentos; • Os dados bibliográficos e o início da mecanização – compreendendo o “Período Pré-mecanizado”, que tem início na realização da Conferência de Paris, término com a realização da Reunião Internacional de Especialistas em Catalogação (RIEC); • Os dados bibliográficos com o uso dos computadores e da Web – compreendendo os períodos mecanizados e parte do período dos metadados, com início partindo da realização da RIEC (Reunião Internacional de Especialistas em Catalogação) e as práticas ainda adotadas no universo bibliográfico. 2.2.1 Os dados bibliográficos e os primeiros recursos bibliográficos Para Barbosa (1978), a história da catalogação se mostra obscura em seu início. Essa afirmação se reflete na análise da literatura nacional sobre a temática, onde as discussões sobre esse período inicial se limitam a poucos autores, e eles o debatem com brevidade. 29 Esse fato pode ser explicado parcialmente, devido a poucos produtos desses primeiros esforços terem sobrevivido, bem como existirem poucas informações a respeito dos que sobreviveram (ASSUMPÇÃO; SANTOS; ZAFALON, 2017a). Outro fator que justifica as discussões limitadas a respeito do período são os esforços realizados para representar as informações das bibliotecas, que foram dispersos e pouco sistemáticos, não resultando em instrumentos de padronização, de princípios ou de teorias para embasar a evolução da Catalogação Descritiva. Boa parte dos estudos tem início no período tradicional, com os esforços para a elaboração de instrumentos de padronização. Durante os períodos remotos foram desenvolvidas as primeiras tecnologias empregadas no suporte da informação, sendo o papiro, as tabuletas de argila ou pedra, pergaminho, madeira e papel. Esses suportes também foram utilizados na construção de listas criadas com o objetivo principal de inventariar o conteúdo das bibliotecas. Na antiguidade os catálogos de bibliotecas assumiam o papel de inventário do material existente, e seu controle era relativamente simples, sendo o ideal de reunir tudo o que se produzia. (SALGADO, 2015, p. 28). Alves (2010) considera essas primeiras listas como pré-catálogos. Santos (2019) aponta que a construção das listas era feita de acordo com o gosto pessoal de seu elaborador, sem o desenvolvimento e a aplicação de instrumentos para a padronização, levando à criação de registros bibliográficos inconsistentes inclusive em um mesmo pré-catálogo. A seleção dos dados bibliográficos que iriam compor os registros era determinada ainda pelo custo da produção dos próprios pré-catálogos, como aponta Santos (2019, p. 64): [...] a elaboração das listas em folhas de pergaminho ou de papiro pelos bibliotecários medievais levava em consideração o custo elevado desses suportes, por isso a produção delas atinha-se tão somente a informações sucintas, de modo a atender ao propósito pretendido. Alves (2010, p. 27) traz como exemplo as listas elaboradas para as bibliotecas de Nínive e Alexandria, as quais [...] foram encontrados tabletes de argila com as seguintes informações descritas: título, número da tabula ou volume, as primeiras palavras da tabula seguinte, o nome do possuidor original, o nome do escriba e um selo de propriedade. 30 A lista do acervo da Biblioteca de Alexandria, elaborada por Calímaco, continha dados a respeito do assunto dos recursos, que podiam ser incluídos em uma lista de temas abrangentes pré-estabelecida e dados de localização dos recursos, “Os materiais possuíam no verso pequenas etiquetas que identificavam o autor e título das obras”. (ALVES, 2010, p. 27). Sendo assim, a indicação da autoria ficava condicionada ao acesso ao próprio recurso. Diferentes iniciativas para a criação de listas ocorreram ao longo dos séculos: A lista do convento St. Martin, em Dover, Inglaterra, de 1389, é talvez o primeiro catálogo considerado como tal. Entre outros recursos, continha o conteúdo de cada volume, além da análise das partes (entradas analíticas). O catálogo compilado por Amplonius Ratnick, de Berka, Alemanha, entre 1410 e 1412, inovou com o uso de remissivas (registros que eram remetidos a outros). (ORTEGA, 2009, p. 90). Muitas outras listas foram desenvolvidas durante o período, o que permite constatar que os dados bibliográficos com maior ocorrência eram relacionados com a organização física das bibliotecas (ALVES, 2010). O desenvolvimento da imprensa, tema do período discutido a seguir, alterou o ritmo de produção de recursos informacionais, evidenciando as fragilidades dessas listas, levando à necessidade de maior detalhamento na representação da informação. 2.2.2 Os dados bibliográficos e o desenvolvimento da imprensa A imprensa foi elaborada por Gutemberg no século XV “[...] causando grande impacto na sociedade, que já́ passava por profundas mudanças sociais”. (ALMEIDA, 2015, p. 35). A possibilidade de impressão permitiu a popularização dos recursos informacionais, e a informação registrada passou a poder ser replicada com perfeição e velocidade, se tornando mais acessível. Embora pareçam incipientes, as tecnologias na época trouxeram significativos avanços, pois possibilitaram a divulgação e o acesso amplo aos registros do conhecimento em diversos lugares. Além disso, os avanços proporcionados pela imprensa na construção dos catálogos predominam até os dias de hoje, obviamente em um novo contexto [...]. (ALVES, 2010, p. 30). As bibliotecas se multiplicaram não só pelo aumento dos recursos disponíveis, mas também pelas mudanças sociais relacionadas ao período. 31 O monopólio da informação começou a ser questionado, a informação passou a ser considerada sinônimo de desenvolvimento social e de igualdade; o surgimento de novos públicos leitores alterou as estruturas de circulação e comunicação da informação, novos tipos de recursos informacionais impressos começaram a surgir, houve um crescente aumento do número de publicações na época e surgiram as primeiras bibliotecas públicas. (ALVES, 2010, p. 28). Os registros bibliográficos passaram a ser mais estruturados, a receber páginas de rosto contendo informações sobre sua origem e seus responsáveis. Passaram a receber ainda elementos estruturantes - tais como notas de rodapé, índices, sumários - relacionando seu conteúdo principal a informações complementares, permitindo o acesso a partes específicas do texto, sem que para isso fosse necessário realizar uma leitura completa do documento, criando a possibilidade de leitura não linear (LIMA, 2007). É em torno desse contexto que se estrutura o período tipográfico, durante o qual as representações antes criadas com o objetivo de inventário “[...] tornaram-se peças importantes para consultas e pesquisas deixando de ser apenas índices bibliográficos ou listas”. (FUSCO, 2010, p. 38). Para Santos (2019), as melhorias na estruturação dos catálogos durante esse período ocorreram de maneira intermitente, a partir de avanços e retrocessos, com o acréscimo e a omissão de determinados dados bibliográficos. Ainda durante o século XV passam a ser incluídas remissivas aos registros bibliográficos (ALVES, 2010). Essas remissivas, ou notas criadas para direcionar os usuários do catálogo de um registro bibliográfico a outro correlato, tem um papel importante na diferenciação entre listas de inventários e os catálogos, por constituírem um elemento de ligação e permitem a navegação, promovendo as primeiras formas de serendipidade3 nos catálogos. Outra informação importante que passa a ser recorrente nos catálogos é a identificação do autor, Ao acompanhar a evolução do catálogo, percebe-se muitas vezes a ausência da identificação do autor. Os catálogos mais elaborados com as questões autorais surgem durante a Idade Média. Coincidência ou não, foi nessa época que a censura as obras e aos autores se tornou rigorosa. Neste período, a obra era condenada junto com seu autor, 3 Relativo ao ato de realizar descobertas acidentais partindo de uma informação inicial (PRIBERAM, 2020). 32 portanto, a identificação era necessária para a concretização da censura. (SILVEIRA, 2013, p. 29). Essa necessidade de incluir informações de autor também está relacionada à identificação do trabalho intelectual como uma força de trabalho passível de monetarização (SILVEIRA, 2013). Um dos marcos do período foi o desenvolvimento do Catálogo Bodleiano, da Universidade de Oxford, na Inglaterra (SANTOS, 2019; ORTEGA, 2009; VILAN FILHO, 1992; CLARKE, 2014). Esse catálogo se destaca pela iniciativa de reunir os trabalhos de um mesmo autor e por identificar as variações de uma mesma obra, que começam a ser frequentes com o desenvolvimento da impressa, tal como traduções e edições (ORTEGA, 2009). O catálogo também se destaca pelo tratamento dado à autoria, como aponta Santos (2019, p. 68): Assim, ao contrário de seus contemporâneos, as entradas nos catálogos bodleianos de 1620 e 1674 tiveram suas estruturas lógicas apoiadas no princípio de autoria, de maneira que, ao se combinar o autor seguido do título da publicação, foi possível reunir eventualmente algumas (não todas) unidades literárias de um dado autor e de uma dada obra. O Catálogo Bodleiano também incluía, eventualmente, dados bibliográficos dos doadores das obras, a inclusão desse tipo de dado se justifica, pois muitos desses catálogos ainda eram projetados visando fins administrativos e pouco focados nas necessidades de seus usuários externos4. Durante o período colonial, pouca atenção foi dada à articulação dos objetivos do catálogo da biblioteca. Muitos catálogos de livros impressos não foram projetados para encontrar ajudas, mas sim como ferramentas de marketing para reconhecer doações, divulgar a coleção e solicitar novos patrocinadores e outras doações. (CLARKE, 2014, p. 3, tradução nossa). Santos (2019) destaca também o caráter administrativo dos catálogos do período, que eram ainda experimentais e dependiam muito das escolhas individuais dos catalogadores. Exemplos de dados bibliográficos encontrados no período incluem “[...] palavras iniciais do livro, nome de doador, indicação das condições físicas do 4 Entende-se nessa pesquisa que, tanto a equipe da biblioteca, como a comunidade utilizadora, são usuários do catálogo. Para diferenciá-los são utilizados os termos usuários internos para a equipe e externos para a comunidade. 33 livro, juízo de valor (livro bom, inútil, legível, estética etc.), dentre outras informações peculiares a cada biblioteca”. (SANTOS, 2019, p. 54). Segundo Alves (2010, p. 29), a possibilidade de impressão afetou também a estrutura dos catálogos. Os catálogos em livros refletiam o avanço tecnológico da época, ocasionado pela imprensa. Mais do que isso, constituíam-se como “bibliotecas sem muros” e eram considerados instrumentos importantes para a democratização do acesso ao conhecimento impresso, embora ainda tivessem a característica de inventário de coleções. Essa portabilidade e replicabilidade do catálogo impresso no formato de livro possibilitou o início das primeiras tentativas, ainda que dispersas, de sistematizar o trabalho de elaboração dos catálogos. Alves (2010) aponta que entre os séculos XVII e XVIII começam ser realizadas tentativas para a sistematização da construção de catálogos, que eram elaboradas de acordo com as necessidades locais das bibliotecas. A Revolução Francesa atuou como potencializadora do processo, tanto de sistematização da catalogação, como do uso inovador de tecnologias para a elaboração de catálogos. Segundo Barbosa (1978), durante a revolução, as bibliotecas privadas da nobreza e do clero foram confiscadas, levando a criação de bibliotecas públicas. Nesse contexto, surge o primeiro código de catalogação criado para uso nacional, diferente dos esforços anteriores que estavam relacionados às necessidades locais das bibliotecas (SILVEIRA, 2013). Nesse código são observados elementos presentes em muitos dos códigos posteriores como, [...] extração de informações da página de rosto da obra, a alfabetação segundo o sobrenome do autor, e a indicação dos dados físicos do material, tais como número de volumes, tamanho da obra, ilustrações e encadernação. (ALMEIDA, 2015, p. 35). A Revolução Francesa também teve impacto sobre os próprios recursos informacionais, pela valorização da pesquisa científica e popularização da leitura, alterando ainda o comportamento dos usuários das bibliotecas. Essas bibliotecas públicas passaram a receber filas diárias de usuários, e suas recentes coleções necessitavam ser rapidamente representadas e organizadas. Nesse contexto foi [...] inaugurado o catálogo em fichas de mais fácil e rápida atualização que o catálogo em forma de livro, mas devido à falta de papel foram 34 utilizadas cartas de baralho, sendo que as cartas de ases e dois eram usadas para o registro de livros com títulos mais longos, talvez por disporem de mais espaço para a escrita. (ORTEGA, 2009, p. 92). Também tem início nesse período, as primeiras tentativas para a criação de princípios que norteassem a Catalogação Descritiva. “Gabriel Naudé escreveu sobre a importância dos catálogos como meios de encontrar livros e de identificá-los bibliograficamente, perspectiva muito próxima da atual”. (SILVEIRA, 2013, p. 29). Essa busca por princípios e outros instrumentos para a padronização da catalogação é o marco do próximo período. 2.2.3 Os dados bibliográficos durante o período tradicional Esse período tem início com a formalização dos primeiros instrumentos para a padronização e as teorias para embasar a Catalogação Descritiva e é encerrado com a realização de diversas avaliações críticas desses instrumentos, que levaram à necessidade de discussões coletivas e internacionais sobre a Catalogação Descritiva. Faz-se necessário compreender a aplicabilidade do termo tradicional a esse período. Tradicional [...] em sentido etimológico, é o ato de transmissão de técnicas, de fatos ou de dogmas de uma geração a outra, ou seja, a herança produzida e deixada por uma geração a outra num campo do conhecimento. (SANTOS, 2019, p. 83). Os avanços ocorridos durante o período, tanto no tocante à catalogação descritiva como uma prática e à Catalogação Descritiva enquanto disciplina, tiveram um forte impacto nos próximos períodos, servindo como fundamento para os instrumentos e os princípios desenvolvidos posteriormente. Em relação à tecnologia, o período não foi marcado por uma ruptura tecnológica e sim pelo aperfeiçoamento das tecnologias em vigor. Neste período as tecnologias proporcionadas pela imprensa ainda predominavam, embora já houvesse o desenvolvimento e a utilização de algumas tecnologias mecânicas que proporcionavam a automação de alguns processos. (ALVES, 2010, p. 32). Além de ser considerado o período tradicional, esse também é o período em que “[...] dá-se o início da Biblioteconomia como se conhece hoje, ou seja, a Biblioteconomia moderna”. (ORTEGA, 2009, p. 93). Nesse período, os dados bibliográficos passam a ser construídos fortemente pautados em instrumentos de 35 padronização, o catálogo adquire o status de ambiente informacional criado para a busca e a estruturação do conhecimento produzido; e a Catalogação Descritiva passa a ser tratada como uma disciplina que vai além da prática, o que seria evidenciado por muitos de seus primeiros teóricos. Considerados os primeiros teóricos da catalogação, Panizzi, Jewett e Cutter, [...] motivaram e subsidiaram a criação de vários códigos de catalogação para uso local e estudos para melhorar a construção dos catálogos em vários países. As preocupações com a padronização da representação nos registros bibliográficos mobilizou profissionais em diversos países e passou a ser vista como um problema global. (SILVEIRA, 2013, p. 69). O primeiro deles, o advogado italiano Antônio Panizzi (1797-1879), foi responsável pela organização da biblioteca do Museu Britânico, em Londres, (SANTOS, 2019). O catálogo anterior do Museu Britânico era “[...] organizado por títulos sob um cabeçalho de assunto, muitas vezes obscuro e inútil”. (SALGADO, 2015, p. 37). Esse tipo de catálogo era organizado a partir de categorias gerais, muitas vezes genéricas e que tinham pouco a dizer a respeito dos documentos que continham. Ortega (2011) aponta que Panizzi foi o responsável por reavaliar a organização desse catálogo e sua proposta para a nova organização foi amplamente discutida, sendo criada uma comissão especial no parlamento inglês, perante a qual a relevância do código precisou ser defendida. O primeiro código moderno de catalogação é atribuído ao bibliotecário Anthony Panizzi, que em 1839 juntamente com seus colaboradores da Biblioteca do Museu Britânico de Londres, elaborou as primeiras 91 regras de catalogação, destinadas à confecção de catálogos de livros impressos, mapas e música. As 91 regras, Rules for the Compilation of the Catalog – Catalogue of printed books in British Museum, foram aprovadas em 1841 pelos autores do Museu Britânico, tendo sua última edição em 1936. (FUSCO, 2010, p. 39). O código era estruturado a partir de índices de assunto. “Essas regras definiam como registrar os nomes dos autores e os títulos e como catalogar obras anônimas”. (SALGADO, 2015, p. 37). Nesse sentido, as regras de Panizzi contribuíram para o estabelecimento de cabeçalhos de autor e ainda para a criação do conceito de autoria coletiva (CASTRO, 2008). A tecnologia predominantemente utilizada no período de elaboração do código de Panizzi para dar suporte ao catálogo era a do livro, manuscrito ou impresso 36 (SANTOS, 2019). Esse aporte tecnológico influenciou e foi influenciado pelo desenvolvimento das primeiras tentativas de sistematização do processo de catalogação descritiva, na medida em que sua existência fazia necessário um elemento de padronização para que sua estrutura se mantivesse coerente; ao mesmo tempo, os autores dos primeiros instrumentos de padronização se pautaram nas suas características para o estabelecimento de suas instruções e regras catalográficas. O catálogo em livros consiste em um conjunto de representações encadernado e organizado em ordem alfabética de autor. Em um catálogo em livro, de modo geral, a descrição completa de um recurso informacional era apresentada apenas na entrada que iniciava com o ponto de acesso autorizado do responsável principal pelo recurso. Ao buscar pelo nome de um responsável que não fosse o responsável principal, por exemplo, o segundo autor, o usuário poderia encontrar uma descrição abreviada do recurso sob o nome do responsável buscado; essa descrição abreviada funcionava como uma remissiva, pois direcionava o usuário para a entrada na qual a descrição completa do recurso informacional estava presente. (ASSUMPÇÃO; SANTOS; ZAFALON, 2017a, p. 92). Panizzi foi responsável pela formalização do uso das remissivas como um elemento de ligação entre as descrições do catálogo ao especificar o “[...] uso de três tipos de remissivas: de nome para nome, de nome para obra e de obra para obra”. (ASSUMPÇÃO; SANTOS; ZAFALON, 2017a, p. 89). Os catálogos em livro eram impressos uma única vez, deixando-se espaço para que novas obras fossem atribuídas a um determinado autor ou para a descrição sucinta de novas edições de uma mesma obra; quando esse espaço era excedido, fazia-se necessário o acréscimo de folhas soltas ou de uma nova e custosa reimpressão. Nesse sentido, criou-se uma forte preocupação com a economia de espaço. Panizzi também contribui para o entendimento do recurso informacional como uma unidade composta por um conteúdo artístico ou intelectual – a obra, o que poderia ser considerado uma ideia visionária dos modelos conceituais, em especial, dos Requisitos Funcionais para Registros Bibliográficos (FRBR) desenvolvidos em 1998. Santos (2019, p. 73) elucida que “[...] Panizzi percebeu que uma ou mais publicações podiam ser edição ou tradução de uma obra determinada, por isso ele buscou contemplar tais aspectos nas 91 Regras”. Panizzi destaca-se ainda por ressaltar a importância de que as regras e, consequentemente os catálogos fossem construídos visando atender aos objetivos 37 dos usuários e pela formalização do uso da página de rosto como uma fonte formal de informações sobre o recurso (SALGADO, 2015; CASTRO, 2008; SERRA et al., 2017). Pode-se observar que os avanços atingidos por Panizzi são mais relacionados à formalização dos elementos do que a criação de novos dados bibliográficos. São exemplos disso o uso das remissivas, do conceito de obra e da página de rosto como fonte de informação. Esses dados bibliográficos já estavam presentes nos registros do período tipográfico, porém sua inclusão era feita de maneira intermitente e não estruturada. Panizzi se destaca por formalizar o uso desses elementos, estruturar a sua forma de construção, provendo consistência aos catálogos criados a partir de suas regras. O que pode ser observado em Castro (2012), ao dizer que as 91 regras de Panizzi estabelecem a base ontológica da Catalogação Descritiva, na definição conceitual dos elementos/metadados que constituem os catálogos. Baseado nas 91 regras de Panizzi, Charles Coffin Jewett elaborou em 1853, um código para o Smithsonian Institution dos Estados Unidos da América (FUSCO, 2010). Santos (2019) aponta Jewett como responsável pela inclusão das entidades coletivas, tais como instituições e organizações na autoria das obras e pela discussão a respeito do tratamento dado a obras escritas sob pseudônimo. O grande legado da obra de Jewett foi a proposição da catalogação cooperativa: A catalogação cooperativa proposta por Jewett apoiou-se na ideia de uma publicação ser catalogada apenas uma vez, preferencialmente em seu local de origem, e tal cooperação seria auxiliada pelo uso de recurso tecnológico (processo de estereotipia), o qual reduziria os custos da catalogação. (SANTOS, 2019, p. 75). Para Jewett, o catálogo em formato de livro impresso seria um limitador do serviço de catalogação coletiva, ele propôs então a utilização da estereotipia, uma forma de impressão em massa, que permitia a reprodução de múltiplas páginas partindo de uma matriz ou molde. Os registros seriam contidos então em fichas unitárias, permitindo que esses pudessem ser construídos de maneira individual. (MACHADO; ZAFALON, 2019; SANTOS 2019; CASTRO, 2008). “Na prática, a catalogação cooperativa de Jewett não prosperou, sobretudo por causa do custo do processo”. (SANTOS, 2019, p. 75). Contudo, a essência da ideia de catalogação cooperativa influenciou a popularização dos catálogos em ficha. Os catálogos em ficha passariam aos poucos a coexistir com os catálogos em livro, que acabariam sendo substituídos, com o tempo, por catálogos em ficha. Nos catálogos 38 em ficha as informações contidas nos acervos “[...] eram descritas no formato de fichas em papel, medindo 7,5 x 12,5 cm, armazenadas em gavetas e agrupadas basicamente por ordem alfabética, pelo nome de autores, títulos e assuntos”. (SERRA; SANTARÉM SEGUNDO, 2017, p. 170). Embora o espaço dentro de uma mesma descrição ainda se mantivesse limitado ao tamanho da ficha, a atualização do catálogo como um todo deixou de ser necessária. A adoção das fichas enfatizou os conceitos de cabeçalho e de entrada principal. Nos catálogos em fichas, a ficha que iniciava com o ponto de acesso autorizado para o responsável principal era denominada entrada principal. Para prover pontos de acesso adicionais referentes aos demais responsáveis, aos títulos e aos assuntos do recurso informacional, a entrada principal era reproduzida e, no topo de cada cópia, era acrescentado o cabeçalho referente a um responsável, a um título ou a um assunto. (ASSUMPÇÃO; SANTOS; ZAFALON, 2017a, p. 93). É no contexto da popularização dos catálogos em ficha que Ammi Cutter publica em 1876 as 369 Rules for a Printed Dictionary Catalogue. O código de Cutter era composto por regras para compor a “[...] entrada de autor e título, parte descritiva, cabeçalhos de assunto, alfabetação e arquivamento de fichas”. (FARIA, 2018, p. 37). A literatura levantada aponta que a principal contribuição de Cutter para a Catalogação Descritiva não está propriamente nas suas 369 regras, e sim nos princípios elaborados para embasá-las, “[...] pois as regras são entremeadas com as explicações das soluções e com observações diversas”. (FUSCO, 2010, p. 40). As regras de Cutter destacam-se pelas discussões em torno da construção de entradas para título e autor e da ordenação dos registros de acordo como essas entradas (BARBOSA, 1978). É ainda com o estabelecimento do código de Cutter que a elaboração de dados de autoridade passa a ser demandada (ASSUMPÇÃO; SANTOS; ZAFALON, 2017a). Os dados de autoridade se constituem em dados bibliográficos criados antecipadamente para a padronização das informações de autor e de assunto, esses dados são mantidos em um catálogo de autoridade para serem aplicados na construção das entradas (e posteriormente dos pontos de acesso) dos catálogos bibliográficos, garantindo assim a uniformidade dos mesmos. 39 Outro ponto importante da obra de Cutter foi a divisão dos “[...] catálogos em curto, médio e completo (ou bibliográfico), com níveis variantes de informações para cada um deles”. (MACHADO; ZAFALON, 2019, p. 6). As obras desses três teóricos resultaram na publicação de muitos códigos locais e nacionais. São exemplos de destaque no período as Instruções Prussianas, os códigos elaborados em conjunto e individualmente pela American Library Association (ALA) e pela Library of Congress (LC) e Código da Biblioteca da Vaticana, de 1920 (FUSCO, 2010). Em conjunto com os estabelecimentos desses códigos tem início um movimento para aplicação prática das ideias de catalogação cooperativa de Jewett. Ao abordar as primeiras tentativas realizadas com esse propósito Santos (2019, p. 80) aponta que: À semelhança da experiência de Jewett, tais iniciativas não tiveram continuidade nem foram bem sucedidas, segundo Jordan (1904), porque esbarraram em certas dificuldades, dentre as quais citamos: não tiveram apoio suficiente para compensar as despesas do empreendimento; resistência por parte dos profissionais em modificar métodos de trabalho; len- tidão de entrega das fichas devido à demora por parte dos publicadores em enviar os livros; incompatibilidade das fichas impressas com as existentes nas bibliotecas, muitas das quais com cabeçalhos desnecessários ou indesejáveis; dentre outros entraves. A ALA e a LC insistiram na criação de um serviço de distribuição de fichas e trabalharam de maneira concomitante na produção de um código de catalogação que pudesse apoiar esse processo. Santos (2019) aponta que, tanto a ALA como a LC publicaram muitos materiais na tentativa de alcançar uma catalogação mais simples e eficiente, mas esses materiais seguiram em um rumo contrário, levando ao aumento das regras e de sua complexidade, a inclusão de regras criadas para situações locais, excepcionais, e ainda, a regras contraditórias entre si. Mesmo assim, o serviço de distribuição de fichas da LC prosperou, evidenciando ainda mais a necessidade dos instrumentos de padronização para a Catalogação Descritiva. O período tradicional passa então a ser marcado por uma série de críticas às práticas de catalogação vigentes e seus instrumentos de padronização, que têm início com a publicação do artigo de Andrew Osborn, The crisis in Cataloging, em 1941. A repercussão do artigo na comunidade catalográfica dos Estados Unidos foi tamanha, que marcou, com efeito, o início desse período de crítica às práticas catalográficas, o qual se estendeu pelas décadas de 40 1940 e 1950, momento em que despontaram estudos questionadores do processo catalográfico regulamentado pelas regras da vertente anglo-americana publicadas nesse período: códigos da ALA, publicados em 1941 e em 1949, e as Rules for Descriptive Cataloging in the Library of Congress (RDC), publicada em 1949. (SANTOS, 2019, p. 92). Outro marco das avaliações críticas ocorridas durante o período tradicional foram os estudos publicados por Seymour Lubetzky, em 1953, a respeito da relevância das regras contidas nos códigos vigentes. Ao analisar fichas catalográficas daquele tempo, Lubetzky observou que as entradas inscritas nas fichas eram inapropriadas: no conteúdo, por estarem carregadas de repetições, limitadas no tocante à aplicação metodológica em situações bibliográficas similares e com dados complexos que poderiam ser indicados de modo mais simples; na organização dos elementos bibliográficos da entrada, sob a qual tais elementos se mostravam inconsistentes, irracionais e sem funcionalidades; no objetivo, por estarem mais voltadas para a descrição e a preservação das informações de páginas de rosto do que para os livros subjacentes a elas. (SANTOS, 2019, p. 104). As críticas aos códigos vigentes, somadas à busca por uma forma de tornar mais viável e eficiente o serviço de catalogação cooperativa gerou inquietação no universo bibliográfico. Passou-se a sentir a necessidade de princípios internacionais para reger o processo de catalogação descritiva. Essa busca por princípios internacionais e pelo aprimoramento da catalogação cooperativa são os marcos do próximo período. 2.2.4 Os dados bibliográficos e o início da mecanização O período pré-mecanizado tem início na realização da Conferência de Paris (1961) e término com a realização da Reunião Internacional de Especialistas em Catalogação (RIEC) em 1969 (ALVES, 2010). Esse curto período foi marcado por muitas mudanças, como o início das discussões em âmbito internacional, pela busca de princípios para nortear o processo de catalogação descritiva e ainda, pelo início das tentativas de adaptação dos catálogos às tecnologias advindas da computação. De 1959 a 1960 várias instituições nacionais foram incentivadas a criar comissões e a discutir documentos previamente elaborados, dentre os quais a prévia de uma Declaração de Princípios que deveria reger o processo de catalogação 41 descritiva (BARBOSA, 1978). Essas comissões foram criadas como preparatório para a realização da Conferência de Paris. Há um consenso na literatura científica sobre o papel da Conferência de Paris ou Conferência Internacional sobre os Princípios de Catalogação, realizada em 1961 e decorrente das inquietações advindas das críticas aos instrumentos de padronização disponíveis até então. Entende-se que essa Conferência foi a responsável pelos primeiros passos em busca de uma padronização internacional “[...] incluindo tanto aspectos relativos aos objetivos e funções do catálogo quanto a sua organização”. (SALGADO, 2015, p. 41). O documento então foi discutido pelos representantes das comissões e aprovado, resultando na primeira Declaração dos Princípios Internacionais de Catalogação, também conhecido como Princípios de Paris. Esses princípios têm sido constantemente atualizados, sendo a última edição datada de 2016, com tradução para o português de Marcelo Votto Texeira, responsável pelo Grupo de Trabalho de Catalogação, da Federação Brasileira de Associações de Bibliotecários, Cientistas de Informação e Instituições (FEBAB). Seu objetivo de servir como base para a normalização internacional da catalogação foi alcançado: a maioria dos códigos de catalogação que se desenvolveu no mundo desde então seguiram estritamente os Princípios ou, ao menos, em grande parte. (DECLARAÇÃO, 2016, p. 4). Já no aspecto relacionado à organização do catálogo, os principais pontos discutidos foram “[...] relacionados aos pontos de acesso para nomes pessoais e títulos uniformes, sendo considerada a precursora da padronização dos pontos de acesso das obras”. (SALGADO, 2015, p. 40). A Conferência de Paris não teve por objetivo a criação de um código internacional, sendo uma de suas recomendações a de que países falantes de uma mesma língua deveriam se organizar para elaborar ou atualizar seus códigos, para que atendessem aos princípios estabelecidos, levando em consideração às especificidades regionais (BARBOSA, 1978). Ainda assim, dessa conferência resultaram dois produtos importantes para a busca por uma internacionalização do processo de catalogação descritiva: o programa de Controle Bibliográfico Universal (CBU), sob responsabilidade da International Federation of Library Associations and Institutions (IFLA) e a primeira edição do código Anglo-American Cataloging Rules (AACR). 42 Na Conferência de Paris, criou-se o programa básico da IFLA, um programa de longo prazo, chamado Controle Bibliográfico Universal (CBU). Por meio dele, pretendia-se que cada serviço nacional de catalogação se responsabilizasse pela aquisição das novas publicações editadas em seu território, as catalogasse e distribuísse a outros países. Ou seja, a criação de um sistema mundial de controle e troca de informações, em que cada país se responsabiliza-se pelo registro de suas próprias publicações, contribuindo nacionalmente para o sistema universal. (GARRIDO ARILLA, 1996, p. 46, tradução nossa). A formalização desse programa incentivou o interesse pela busca por padrões internacionais para a Catalogação Descritiva. O AACR (Anglo-American Cataloging Rules) foi publicado em 1967, como um resultado da colaboração entre a ALA, a Canadian Library Association e pela Library Association da Inglaterra (ALVES, 2010). Barbosa (1876) aponta que o novo código criava regras visando atender a diversos tipos de bibliotecas, abrangia múltiplos suportes informacionais, como microformas, manuscritos e mapas, por exemplo. Esses dois pontos demonstram a preocupação em se adequar ao contexto social e tecnológico vigente, como a criação ou a expansão de novos tipos de bibliotecas durante o período, a crescente importância das bibliotecas públicas e universitárias e o espaço adquirido por novos suportes, que aceleraram ainda mais a reprodução da informação. O AACR foi publicado em duas versões, uma inglesa e uma norte americana, por divergências quanto às regras para a criação de cabeçalho de autor e era dividido em três partes, como aponta Corrêa (2013, p. 44): Os textos estavam divididos em três partes: a) Parte I: entrada e cabeçalho baseada nos Princípios de Paris [...], regras do Código da ALA de 1949 e o relatório de Lubetzky; b) Parte II: descrição: formada pelas regras da Library of Congress revistas c) Parte III: outros documentos: contém regras para escolha da entrada e descrição baseadas nas regras da LC. Além disso, Corrêa (2008) e Fusco (2010) apontam para o caráter flexível do AACR, que inclui diferentes níveis de descrição, contendo recomendações não taxativas, deixando espaço para a tomada de decisão do catalogador. Passa-se cada vez mais a exigir uma profissionalização do ofício de catalogador, mediante à complexidade dos novos cenários e instrumentos. 43 Formaliza-se o conceito de granularidade na descrição, sendo que “[...] a granularidade de um conjunto de dados está vinculada ao número de atributos que o compõem e a diversidade de seus conteúdos”. (SANTOS; SANT’ANA, 2013, p. 206). Quanto mais atributos e mais diversificados eles forem, mais granular é a descrição. Dados bibliográficos mais granulares significam uma maior possibilidade de ligação, de identificação dos recursos buscados pelos usuários e de descoberta acidental de registros bibliográficos. O AACR passa a adotar diferentes níveis de descrição, onde as descrições mais granulares são direcionadas a bibliotecas maiores ou para público especializado, que requerem uma complexidade maior do catálogo, enquanto bibliotecas menores e de uso geral podem adotar uma descrição mais simples e, portanto, menos granular. A década de 1960 também é marcada pela busca por inserir as tecnologias computacionais no processo de catalogação descritiva. Arakaki, Simionato e Santos (2017, p. 7) apontam que é nesse contexto de expansão das tecnologias computacionais que “[...] foi criado o formato de intercâmbio de dados, denominado Machine Readable Cataloging (MARC), que proporcionou o compartilhamento de registros bibliográficos legíveis por máquinas.” Segundo Serra et al. (2017, p. 59), os objetivos iniciais do MARC foram: 1 criação de registros bibliográficos legíveis por máquina; 2 inclusão de todos os dados presentes nas fichas impressas, além de informações adicionais que favoreçam o multiuso; 3 estabelecimento de acordo na comunidade bibliotecária sobre os elementos que devem ser incluídos nos registros. O objetivo inicial do MARC foi, portanto, o de proporcionar a reprodução dos conteúdos das fichas impressas em formato legível por computador/máquina. Essa proximidade com os formatos analógicos reflete-se inclusive em sua estrutura. O formato MARC foi desenhado para acomodar os elementos presentes no AACR e, portanto, ser aderente aos princípios de descrição. Apesar de ser uma comunicação de elementos descritivos legíveis por máquinas, sua concepção e tipo de funcionamento ainda possuem forte resquício analógico [...]. (SERRA et al., 2017, p. 65). Esse reflexo da estrutura do AACR garantiu rigor na padronização das informações inseridas no formato, no entanto, fez com que se mantivessem preocupações que eram inerentes do ambiente analógico. Essas preocupações, relacionadas com às limitações físicas dos catálogos analógicos – em livro e em ficha – foram aplicadas ao preenchimento de informações em MARC, como a redução do 44 espaço ocupado pelos dados bibliográficos, utilizando-se de abreviações e de seleção de um número limitado de autores para cada responsabilidade intelectual relacionada à obra. Além disso, foram limitados os pontos de acesso e mantida a ideia de entrada principal. Embora o impulso inicial para a criação do MARC tenha sido agilizar o processo de catalogação descritiva e permitir a visualização dos registros bibliográficos em formato computacional, há um consenso na literatura sobre o fato de que o seu potencial se mostrou no intercâmbio de registros bibliográficos. Ao receber um registro bibliográfico em formato que pudesse ser alterado, com inclusão, edição e exclusão de tags pela biblioteca diretamente no computador, o intercâmbio de registro encontrou cenário favorável para importação massiva, alterando metadados quando necessário, uma vez que ao dado importado era possível realizar ajustes ou aplicar instrumentos adotados pela instituição. (SERRA; SANTERÉM SEGUNDO, 2017, p. 173). Dumer (2019) aponta que a mudança para o ambiente tecnológico foi responsável por impulsionar a criação das redes de catalogação, que levaria à necessidade de internacionalização dos instrumentos de padronização, o que marca o início do próximo período. 2.2.5 Os dados bibliográficos com o uso dos computadores e da Web Esse período tem início com a realização da RIEC (Reunião Internacional de Especialistas em Catalogação), realizada em 1969, que de acordo com Barbosa (1978) teve por objetivos: 1) discutir a aplicação dos Princípios de Paris, que foram amplamente adotados, mas estavam sendo mal interpretados e aplicados; 2) fomentar a elaboração de regras internacionais para a descrição bibliográfica; e 3) discutir e fomentar os programas de catalogação compartilhada e de uso de computadores no processo de catalogação descritiva. Um dos marcos da busca por internacionalização dos processos de representação foi a proposta do Controle Bibliográfico Universal (CBU). Em relação ao CBU, Alves (2010, p. 36) aponta que: Os ideais do CBU vão muito ao encontro das idéias estabelecidas por Jewett no período tradicional. Dessa forma, percebe-se que esses ideais foram buscados por diversos profissionais ao longo do tempo, contudo não existiam condições suficientes para que pudessem ser 45 efetivados. Essas condições estavam pautadas basicamente na uniformidade dos registros e no uso de tecnologias de informática. Dada à identificação de que os instrumentos de padronização possuem um papel fundamental para atingir aos ideais do CBU, grupos de trabalho foram criados para discutir a padronização e a internacionalização desses instrumentos. Um dos resultados desses grupos foi a publicação da International Standard Bibliographic Description (ISBD), ou Descrição Bibliográfica Internacional Normalizada, um documento elaborado com o propósito de nortear a catalogação a nível internacional, visando fomentar a catalogação compartilhada e a adaptação ao uso de computadores. “As ISBDs definem os elementos necessários numa descrição bibliográfica, prescrevem a sua ordem de apresentação e a pontuação que os delimitam [...]”. (FUSCO, 2010, p. 48). A ISBD inovou ao regular a especificação dos elementos necessários para a descrição de um documento; ordenação e os agrupamentos mais adequados dos elementos da descrição; e a separação destes elementos por pontuação fixa. (ORTEGA, 2011, p. 102). A especificação dos elementos necessários para compor um registro bibliográfico passa a ser considerada na elaboração de futuros códigos de catalogação, estabelecendo quais os tipos e os dados bibliográficos que um registro deve conter para representar adequadamente um recurso. Ao estruturar as informações seguindo uma ordem pré-estabelecida e utilizando uma pontuação para delimitar o final de cada tipo de informação, a ISBD fornece a sintaxe necessária para facilitar a conversão dos dados bibliográficos de diferentes fontes e ainda, facilita o rompimento de barreiras linguísticas, pois passa a ser possível, a partir das pontuações, identificar onde cada tipo de informação está contido na estrutura de um registro bibliográfico. Garrido Arrila (1999, p. 51, tradução nossa) apresenta a estrutura de pontuação da ISBD: -- Indica a separação entre as diferentes áreas = Indica a repetição da mesma informação [] Indica interpolação ou que a informação foi obtida fora da fonte principal ... indicam a suspensão de partes de elementos / Indica menção de responsabilidade em relação ao elemento precedente : Indica um elemento complementar do anterior ; Indica a repetição de uma mesma classe de elemento 46 Garrido Arrila (1999) aponta que a primeira ISBD foi publicada em 1974, e tinha por objetivo estabelecer a descrição de recursos monográficos - ISBD (M), essa edição foi seguida por outras elaboradas para serem aplicadas em múltiplos materiais. Posteriormente, uma ISBD geral, agrupando as anteriores, seria publicada visando à aplicação em diversos tipos de recursos – ISBD (G). Um dos resultados da publicação da ISBD foi a atualização do AACR, que ainda visou unificar as duas versões do código (inglesa e norte americana), levando em consideração as críticas da comissão ao AACR 1 e a buscar a internacionalização do código. (GARRIDO ARRILA, 1999). A Comissão da IFLA responsável pela revisão do AACR iniciou seus trabalhos pela comparação do seu capítulo 6 com a ISBD(M). À medida que as ISBDs foram sendo elaboradas os capítulos do AACR foram adequando-se às mesmas, e foram criados novos capítulos complementares. Em 1978 foi publicado o Anglo-American Cataloguing Rules, Second edition (AACR2), unificando os dois textos anteriores: o dos Estados Unidos e o britânico. O AACR2 manteve os pontos de acesso em conformidade com os Princípios de Paris, e a descrição passou a incorporar o padrão ISBD. (CORRÊA, 2008, p. 28). Dividida em duas partes, uma para reger a descrição bibliográfica e outra para o estabelecimento dos pontos de acesso, Ortega (2011, p. 49) pontua que uma das grandes rupturas com a forma de se elaborar códigos até então foi na ordenação desses capítulos, que “[...] pela primeira vez em 90 anos, um código de catalogação tem seu início pela descrição dos documentos para depois partir para a indicação dos pontos de acesso à mesma”. O código AACR2 conta ainda com apêndices, contendo recomendações complementares quanto ao uso de abreviações, de maiúsculas e de numerais, e com três níveis de descrição. O formato MARC também passou por atualizações, sendo criadas versões para atender à necessidade de cada país. Com o objetivo de unificar essas versões e ainda atender ao contexto tecnológico vigente, caracterizado pela expansão dos tipos documentais e pela popularização do uso de computadores, foi iniciada uma série de discussões para a criação de um novo formato MARC, resultando no lançamento, em 1999, do MARC21, sendo 21 uma menção à eminente chegada do século XXI (ALMEIDA, 2015). A partir da disseminação do uso dos computadores proliferam as áreas de utilização e consequentemente os tipos de documentos, de modo que cada documento possuía requisitos diferentes, exigindo conjuntos 47 específicos de anotações. Tal cenário evidenciou a necessidade de padronizar a forma de inserir, processar e manipular as anotações dos documentos. (RAMALHO; MARTINS; SOUSA, 2018, p. 23). O surgimento dos sistemas online e dos microcomputadores ampliaram as possibilidades de acesso aos catálogos, que passaram a ser disponibilizados online e com acesso público, os chamados Online Public Access Catalog (OPAC). Com “[...] a disponibilização do Online Public Access Catalogue (OPAC) na Web, o alcance dos Catálogos foi ampliado”. (SERRA; SANTARÉM SEGUNDO, 2017, p. 173). O ambiente Web foi proposto para possibilitar o compartilhamento de recursos multimídia e a interligação desses, de forma a permitir ao usuário navegar dentro de um mesmo recurso ou além desse. O documento Web é construído sobre um pequeno conjunto de padrões simples: Identificadores Uniformes de Recursos (URIs) como mecanismo de identificação globalmente único, o Protocolo de Transferência de Hipertexto (HTTP) como mecanismo de acesso universal e a Linguagem de Marcação de Hipertexto (HTML) como formato de conteúdo amplamente utilizado. Além disso, a Web se baseia na ideia de configurar hiperlinks entre documentos da Web que podem residir em diferentes servidores Web. (HEATH; BIZER, 2011, não paginado, tradução nossa). Com os catálogos online, as bibliotecas se beneficiaram das possibilidades oferecidas pelo HTML e pelo hiperlink, embora as ligações com fontes externas ainda não sejam tão frequentes, a ligação entre informações de um mesmo OPAC é o que permite que o usuário navegue no catálogo e obtenha as informações de seu interesse. As próprias remissivas deixaram de indicar outras informações relevantes e passaram a consistir em hiperlinks que levam, com um clique, o usuário diretamente para a próxima informação de interesse. Embora o acesso tenha sido ampliado, os dados bibliográficos seguem majoritariamente sendo construídos com base nos instrumentos de padronização criados para atender o ambiente offline, como MARC21, ou ainda para o ambiente analógico, como as ISBD e o AACR2. Dessa maneira apresenta-se uma sistematização dos principais acontecimentos identificados nos períodos discutidos. 48 2.2.6 Marcos tecnológicos, instrumentos e estruturas dos catálogos e registros bibliográficos A partir da análise pormenorizada realizada foram reunidos os principais pontos de cada período, para isso foram levantados os marcos tecnológicos que influenciaram as mudanças no processo de elaboração dos dados bibliográficos, os instrumentos de padronização, a estrutura dos catálogos resultantes dessas mudanças e ainda, quais as principais alterações em relação aos dados contidos nos registros bibliográficos. O Quadro 2 apresenta o resultado dessa síntese. 49 Quadro 2: Marcos da evolução dos registros e dos dados bibliográficos à luz das tecnologias. Período Principais marcos tecnológicos Instrumentos de padronização Estrutura dos catálogos Estrutura dos registros bibliográficos Primeiros recursos bibliográficos Desenvolvimento dos primeiros suportes para o registro da informação como papel, tabuletas de argila e papiro. Não existentes ou rudimentares. Escritos utilizando-se dos suportes disponíveis, estruturados para inventariar a coleção das bibliotecas e refletir sua estrutura física. Construída de maneira inconsistente, de acordo com cada catalogador, relacionados à organização física das bibliotecas e voltada à descrição do item. Os dados bibliográficos desses registros eram mais focados em representar os proprietários e o escriba, do que os responsáveis pelo conteúdo intelectual ou artístico das obras. Período tipográfico Aprimoramento das técnicas de impressão, modificando a relação com recursos bibliográficos impressos, decorrente da multiplicação de traduções e de edições das obras. Primeiros processos de mecanização. Primeiros códigos e princípios formais de catalogação, criação de códigos por instituições e de códigos adotados a nível nacional. Catálogos impressos em formato de livro, organizados inicialmente por categorias pouco representativas. Após a formalização dos instrumentos de padronização passaram a ser organizados de maneira sistemática, por autor, título ou em forma de catálogo dicionário. Catálogos em ficha, com atualização mais constante e a possibilidade Formalização dos dados bibliográficos que devem estar presentes em um registro. Remissivas direcionando: 1) de um autor para outro correlato, 2) de um autor para as suas obras e 3) de uma obra para outra correlata. Dados sobre impressão e edição. Dados registrando a fonte de informação consultada. Criação de registros de autoridade para embasar o estabelecimento dos pontos de acesso. 50 Período Principais marcos tecnológicos Instrumentos de padronização Estrutura dos catálogos Estrutura dos registros bibliográficos de duplicação das informações, que tornou possível às bibliotecas duplicarem os registros de um mesmo recurso, criando diferentes arranjos, mantendo catálogos por assunto, título e autor em uma mesma biblioteca. Possibilidade de cópia impressa das fichas para distribuição entre diversas bibliotecas, incentivando à catalogação compartilhada. Criação de diferentes níveis de descrição para atender a bibliotecas com necessidades diferentes. Período tradicional Aprimoramento das técnicas de impressão, modificando a relação com recursos bibliográficos impressos, decorrente da multiplicação de traduções e de edições das obras. Primeiros processos de mecanização. Primeiros códigos e princípios formais de catalogação, criação de códigos por instituições e de códigos adotados a nível nacional. Catálogos impressos em formato de livro, organizados inicialmente por categorias pouco representativas. Após a formalização dos instrumentos de padronização passaram a ser organizados de maneira sistemática, por autor, título ou em forma de catálogo dicionário. Formalização dos dados bibliográficos que devem estar presentes em um registro. Remissivas direcionando 1) de um autor para outro correlato, 2) de um autor para as suas obras e 3) de uma obra para outra correlata. Dados sobre impressão e edição. Dados registrando a fonte de informação consultada. Criação de registros de autoridade para embasar o estabelecimento dos pontos de acesso. Criação de diferentes níveis de descrição para atender a bibliotecas com necessidades diferentes. 51 Período Principais marcos tecnológicos Instrumentos de padronização Estrutura dos catálogos Estrutura dos registros bibliográficos Catálogos em ficha, com atualização mais constante e a possibilidade de duplicação das informações, que tornou possível às bibliotecas duplicarem os registros de um mesmo recurso, criando diferentes arranjos, mantendo catálogos por assunto, título e autor em uma mesma biblioteca. Possibilidade de cópia impressa das fichas para distribuição entre diversas bibliotecas, incentivando à catalogação compartilhada. Início da mecanização Fitas magnéticas e tecnologias computacionais. Os instrumentos deixam de ser de responsabilidade de indivíduos – como durante o período tradicional – e passam a ser publicados por instituições ou conjuntos de instituições, com a criação ainda de códigos adotados em âmbito nacional. Ampliação do uso dos catálogos em ficha em detrimento dos catálogos em livro durante o início do período, fomentado principalmente pelo serviço de distribuição de fichas da LC. Início da utilização de catálogos automatizados, Estabelecimento dos pontos de acesso de autor e de título para à identificação dos registros bibliográficos. Aumento da importância da granularidade nos códigos de catalogação. Os dados bibliográficos passam a ser registrados em um formato computacional, com campos criados para a inserção de cada tipo de dado bibliográfico. 52 Período Principais marcos tecnológicos Instrumentos de padronização Estrutura dos catálogos Estrutura dos registros bibliográficos Estabelecimento de princípios internacionais para reger o processo de catalogação. Criação do formato MARC que se estabelece como um formato de intercâmbio de registros bibliográficos. com registro em fitas magnéticas. Nota-se que as mudanças causadas nos registros bibliográficos do período são mais voltadas à sua estruturação, do que ao seu conteúdo propriamente dito. Início do uso dos computadores e da Web. Ampliação do uso de computadores, desenvolvimento da internet e do ambiente Web. Internacionalização dos códigos de catalogação, com estabelecimento da ISBD e do AACR2, estabelecimento do MARC21 como formato/padrão internacional para o intercâmbio de recursos bibliográficos. Catálogos automatizados e, posteriormente, OPACs permitindo à consulta dos catálogos fora do ambiente das bibliotecas. Estabelecimento internacional dos dados bibliográficos que devem estar presentes em um recurso informacional. Estabelecimento de uma estrutura, pautada em pontuações, para permitir a delimitação do espaço que deve ocupar cada dado bibliográfico dentro de um registro. Estabelecimento do formato MARC21, que formaliza a estrutura do registro bibliográfico a nível internacional. Conversão de determinados dados bibliográficos – como os pontos de acesso e as remissivas – ao formato de hiperlink, facilitando a navegação entre registros bibliográficos. Fonte: Autora (2021). 53 A partir do conteúdo exposto é possível observar que, a trajetória evolutiva dos dados e dos registros bibliográficos sempre esteve atrelada ao desenvolvimento tecnológico vigente em cada momento e o aspecto da inovação é também percebido nas mudanças de estruturas de armazenamento desses registros e dados bibliográficos. Nesse sentido, as alterações do ambiente Web e a importância que esse locus tem para os usuários da informação, também influenciam a forma como devem ser construídos os registros bibliográficos e a elaboração dos instrumentos utilizados para a sua padronização. A próxima seção discutirá o conjunto de práticas para a ligação de dados na Web – Dados Abertos Conectados – e os potenciais de aplicação dessas práticas no universo bibliográfico. 54 3 DADOS ABERTOS E CONECTADOS Essa seção discorre sobre a publicação de Dados Abertos Conectados e as melhores práticas propostas para permitir essa publicação. Parte-se de uma breve contextualização da estrutura original de disponibilização de recursos na Web, seguida da apresentação da proposta da Web Semântica, dos princípios de Dados Conectados, do conceito de Dados Abertos e ao final são discutidas as 10 MPs para a publicação de DAC. O hipertexto, conceito cunhado por Theodore Nelson para representar a “ideia de leitura/escrita não-linear em sistemas informatizados” (DIAS, 2019, p. 272) foi o precursor para muitos projetos, dentre os quais destaca-se a criação do ambiente Web. Em 1989, o físico inglês Sir Timothy John Berners-Lee, no CERN, inventou a WWW (World Wide Web) a partir da proposição de três tecnologias fundamentais: o HTML (Hypertext Markup Language), o servidor HTTP (Hypertext Transfer Protocol) e o URI (Unified Resource Identifier). (ISOTANI; BITTENCOURT, 2015, p. 25). A linguagem de marcação Hypertext Markup Language (HTML) foi desenvolvida para descrever as estruturas das páginas criadas na Web, permitindo a inserção de recursos informacionais e a criação de hiperlinks, ou seja, a ligação entre os recursos contidos em uma mesma página ou em páginas diversas. Por meio do HTML são criados links, “um link é uma conexão de um recurso da Web para outro (W3C, 2018, não paginado, tradução nossa). A ligação de recursos informacionais em HTML acontece da seguinte maneira: Um link tem duas extremidades - chamadas âncoras - e uma direção. O link começa na âncora "source" e aponta para a âncora "destination", que pode ser qualquer recurso da Web (por exemplo, uma imagem, um videoclipe, uma frase de áudio, um programa, um documento HTML, um elemento dentro de um documento HTML etc.). (W3C, 2018, não paginado, tradução nossa). A HTML foi estruturada para ser de fácil compreensão e com foco na apresentação dos conteúdos, 55 Contudo, sua concepção baseada em marcações fixas trouxe limitações para a representação de informações uma vez que, sendo uma linguagem de marcação voltada, principalmente, para a apresentação dos documentos em ambientes digitais, HTML apenas define a forma como a informação é exibida não se preocupando com o significado da palavra. (RAMALHO; MARTINS; SOUZA, 2017, p. 25). Nesse arcabouço, os links são capazes de relacionar os documentos, mas não possuem características que permitam aos computadores inferir o significado dessas relações, dificultando a recuperação dos recursos informacionais, principalmente no contexto tecnológico vigente, caracterizado pelo aumento exponencial da disponibilização de recursos e dados heterogêneos na Web. (ISOTANI; BITTENCOURT, 2015). Heath e Bizer (2011) apontam que, como forma de possibilitar a atuação de sistemas computacionais no processo de busca na Web podem ser aplicados os microformatos, adaptações em padrões existentes para a solução de problemas específicos na Web e Application Programming Interface (APIs) – conjunto de rotinas e de padrões que permitem que aplicativos possam se comunicar e realizar atividades de maneira automatizada sem a intervenção dos usuários humanos. Os microformatos permitem “[...] representar dados sobre um pequeno conjunto de tipos diferentes de entidades”. (HEATH; BIZER, 2011, não paginado, tradução nossa), enquanto que “[...] a existência de uma API especializada para cada conjunto de dados cria um cenário em que um esforço significativo é necessário para integrar cada conjunto de dados original em um aplicativo”. (HEATH; BIZER, 2011, não paginado, tradução nossa). Apresentada no artigo The Semantic Web, publicado em 2001 por Berners-lee, Hendler e Lassila, a Web Semantica foi proposta como uma extensão da Web original cujo objetivo é fornecer significado para as informações e as relações entre infomações contidas na Web de maneira formal, permitindo que os agentes computacionais relizem atividades complexas por meio de inferências. (BERNERS-LEE; HENDLER; LASSILA, 2001). Para tornar essa proposta possível, a [...] Web Semântica busca utilizar recursos provenientes da Inteligência Artificial (como agentes inteligentes e representação de conhecimento), Engenharia de Software (como frameworks e plataformas), Computação Distribuída (como web services), 56 entre outros, para executar atividades na Web que antes só eram possíveis por agentes humanos. (ISOTANI; BITTENCOURT, 2015, p. 27). A organização das tecnologias computacionais que compõem a Web Semântica pode ser sistematizada em forma de pilha, também chamada de “bolo de noiva”, por sua estrutura em forma de camadas, como pode ser observada na Figura 2: Figura 2: Pilha de tecnologias da Web Semântica. Fonte: Isotani e Bittencourt (2015, p. 30) baseado em Nowack (2009). Como forma de promover o desenvolvimento da Web Semântica e ampliar o uso e o reuso dos metadados, o World Wide Web Consortium (W3C), consórcio cujo principal objetivo é “[...] desenvolver protocolos e diretrizes que garantam crescimento de longo prazo para a Web”. (W3C, 2019, não paginado), elaborou um conjunto de princípios para embasar a publicação e a conexão desses dados, chamado Linked Data (Dados Conectados). A proposta inicial dos Dados 57 Conectados consiste em 4 (quatro) práticas para a publicação de dados conectados, sendo elas: 1. Use URIs como nomes para as coisas. 2. Use HTTP URIs, para que as pessoas possam procurar esses nomes. 3. Quando alguém procura um URI, forneça informações úteis, usando os padrões (RDF, SPARQL). 4. Inclua links para outros URIs, para que eles possam descobrir mais coisas. (BERNERS-LEE, 2006, não paginado, tradução nossa). Os Uniform Resource Identifier (URIs) são identificadores que servem para representar documentos, locais, endereços da Web, figuras ou até mesmo pessoas. Além dos URIs, dois conceitos são relacionados à identificação na Web, o Uniform Resource Locator (URLs) e o Uniform Resource Name (URN). Enquanto o URL é utilizado para marcar a localização na Web, o URN é utilizado para especificar o nome do recurso. Para o W3C (2011), o espaço URI é particionado entre URL e URN com o objetivo de identificar de maneira única o nome e a localização dos recursos na Web, ou seja, o “[...] URI é um padrão conjunto que abarca os conceitos de Uniform Resource Locator (URL) e do Uniform Resource Name (URN), de modo que pode ser representado por qualquer um destes, ou por ambos”. (RAMALHO, 2006, p. 32). O Hypertext Transfer Protocol (HTTP), de maneira geral é um protocolo de solicitação/resposta, de uso padrão, que permite acesso às informações contidas no ambiente Web, realizando a conexão entre dois computadores conectados à Internet. (W3C, 2018, não paginado, tradução nossa). Ou seja, o HTTP é o protocolo que orienta como deve ocorrer a troca de informações entre o servidor, onde a informação está contida e o cliente/usuário que deseja ter acesso a essa informação. “Assim, o segundo princípio dos Dados Conectados aponta o uso de URIs HTTP para identificar objetos e conceitos abstratos, permitindo que esses URIs sejam desreferenciados, ou seja, pesquisados”. (HEATH; BIZER, 2011). A próxima recomendação dos Dados Conectados é o uso do modelo Resource Description Framework (RDF). O modelo foi proposto em 1999 com o objetivo de promover interoperabilidade e padronização dos recursos hospedados na Web. 58 O RDF baseia-se na ideia de que as coisas que estão sendo descritas têm propriedades que possuem valores e que esses recursos podem ser descritos ao se fazer declarações [...]. O RDF usa uma terminologia específica para falar sobre as várias partes das declarações. Especificamente, a parte que identifica o assunto da declaração é chamada de assunto. A parte que identifica a propriedade ou característica do assunto que a instrução específica (criador, data de criação ou idioma nesses exemplos) é chamada de predicado e a parte que identifica o valor dessa propriedade é chamada de objeto. (W3C, 2004, não paginado, tradução nossa, grifo nosso). Existem dois tipos principais de declarações em RDF, aquelas que descrevem as propriedades de um recurso, nas quais o objeto é representado em linguagem natural, chamados de triplas literais e as declarações que representam as ligações existentes entre dois recursos, onde o objeto é outro URI, chamados Links RDF. (HEATH; BIZER, 2011). Segundo o W3C (2004), o RDF é um modelo utilizado quando as relações entre os dados precisam ser descritas de maneira formal. Para que ele atenda a esse objetivo, os seguintes pontos precisam ser levados em consideração: • As coisas descritas (assunto) e as propriedades (predicado) precisam ser representadas utilizando URIs; • O valor das declarações (objetos) pode ser descrito usando um URI ou um literal (números, nomes, palavras, frases em linguagem natural); • Para cada nova propriedade do assunto é criada uma nova tripla; • Para ser legível por máquinas ele precisa do suporte de uma linguagem computacional - um formato de serialização; e • É necessário criar e utilizar vocabulários controlados para descrever as propriedades das coisas descritas. A linguagem computacional utilizada para a serialização e o vocabulário utilizado para descrever as propriedades dos assuntos podem variar de acordo com as necessidades da instituição que pretende disponibilizar seus dados em RDF. A instituição pode inclusive optar por disponibilizar seus dados em diferentes formatos de serialização, o que amplia a possibilidade de reuso desses dados. Nesse sentido, observa-se que tal como o hiperlink que interliga recursos em HTML contidos em uma mesma página ou em páginas distintas, os links em 59 RDF podem fornecer ligações entre dados de uma mesma fonte ou com dados de fontes externas. Observa-se ainda que, URIs de fontes distintas podem ser usados para representar uma mesma entidade e que vocabulários distintos podem ser utilizados em uma mesma descrição, de acordo com o que se deseja representar. Os vocabulários são criados para atender a domínios específicos. O W3C (2016) recomenda que sempre que possível sejam adotados vocabulários existentes, podendo-se inclusive misturar vocabulários diferentes em uma mesma descrição. Quando as propriedades necessárias não são encontradas em nenhum vocabulário, um novo pode ser criado e é recomendado que esse seja amplamente divulgado, para que possa ser reutilizado por outras entidades pertencentes ao mesmo domínio. Aliado ao conceito de Dados Conectados tem-se o conceito de Dados Abertos e Conectados (DAC). O conceito de Dados Abertos consiste em ampliar as possibilidades de reuso dos dados disponíveis na Web, a partir da disponibilização desses dados por uma licença aberta. Os Dados Abertos e Conectados consistem numa junção dos princípios de Dados Abertos e Dados Conectados (ARAKAKI, 2016). Para mensurar o nível de abertura dos dados, foi estabelecido o sistema de 5 estrelas, o qual pode ser visto na Figura 3. Figura 3 : Sistema de 5 estrelas de Dados Abertos. 60 Fonte: Isotani e Bittencourt (2015, p. 30) baseado em CafePress (2011). Como pode ser observado na Figura 3, nesse sistema os dados classificados com mais estrelas são considerados mais passíveis de serem reutilizados. Os dados atingem seu nível máximo de reutilização quando estão em consonância com a proposta de Dados Abertos e Conectados. Em 2014 foram disponibilizadas pelo W3C (2014), as 10 Melhores Práticas (MPs) para a publicação de Dados Abertos e Conectados, que podem ser visualizadas no Quadro 3. Quadro 3: Melhores Práticas para a publicação de DAC. Recomendação Descrição 1. Preparar as partes interessadas Envolver e habilitar a equipe, que será responsável pela criação e manutenção dos dados. 2. Selecione um conjunto de dados Selecionar dados coletados ou publicados exclusivamente pela instituição. 3. Modele os dados Descrever os dados que serão publicados, estabelecendo as principais entidades e os relacionamentos presentes entre essas entidades. 4. Especifique uma licença apropriada Estabelecer uma licença de dados abertos para os conjuntos de dados publicados. 5. Estabeleça bons URIs Estabelecer URIs HTTps consistentes e confiáveis, pautados em uma política de persistência. 6. Utilize vocabulários-padrões Reutilizar, sempre que possível, vocabulários consolidados. Caso seja necessário criar um vocabulário, disponibilizá-lo para uso de outras instituições. 7. Converta os dados em dados conectados Mapear os dados de origem, converter os dados para RDF, estabelecer um formato de serialização e conectá-los a outros conjuntos de dados. 8. Promova acesso aos dados conectados Promover formas de acesso aos dados, especialmente para os agentes computacionais. 9. Anuncie os dados disponibilizados ao público Tornar pública a disponibilização do conjunto de dados abertos conectados, diversificando os meios de divulgação. 10. Estabeleça um contrato de responsabilidade como publicador Afiançar a estabilidade do conjunto de dados, garantindo sua disponibilidade de maneira persistente no local indicado, avisando aos usuários sobre alterações inevitáveis. Fonte: Adaptado de W3C (2014). A adoção de cada uma dessas MPs envolve uma série de tomadas de decisão, que serão baseadas em parte nos objetivos da instituição ao publicar os dados como DAC, nos instrumentos e nas ferramentas tecnológicas disponíveis para cada domínio do conhecimento. 61 A publicação de dados bibliográficos como DAC foi discutida no relatório Library Linked Data Incubator Group: final report, resultado de um conjunto de discussões realizadas entre maio de 2010 a agosto de 2011 no âmbito do W3C, sobre como incluir as bibliotecas na Web of Data. (W3C INCUBATOR GROUP, 2011). O relatório indicou uma série de vantagens, de desafios e de recomendações para ampliar a participação das bibliotecas no contexto de DAC, e destaca que “Bibliotecas e instituições de memória em geral estão em uma posição única para fornecer metadados confiáveis para recursos de importância cultural de longo prazo como dados na Web”. (W3C INCUBATOR GROUP, 2011, não paginado, tradução nossa). Nesse contexto as bibliotecas podem se tornar fontes de dados a serem utilizadas por terceiros (publicadoras de dados) e por outro lado podem se beneficiar dos dados disponibilizados por outras fontes (consumidora de dados), onde cada papel pode ser realizado de maneira independente e ser relacionado a um conjunto de desafios diferentes (JESUS; CASTRO; RAMALHO, 2021). A experiência das bibliotecas no estabelecimento de elementos que permitem a criação de metadados estruturados e padronizados implica em dados confiáveis e qualificados e, portanto, de importância capital para o desenvolvimento do ambiente Web. De acordo com Clarke (2014), para as bibliotecas a publicação dos dados bibliograficos como DAC significa ainda uma roptura com a estrutura dos catálogos. Como discutido na seção 2, com a adoção das tecnologias computacionais e do uso da Web esses catalogos passaram a ser disponíbilizados para a acesso online, porem, maioritariamente em formatos não projetados para serem recuperados por meio dos buscadores da Web. Com a publicação dos dados como DAC, as unidades básicas dos catálogos tornam- se os dados, que podem ser estruturados em RDF. A Figura 4 apresenta essa mudança de estrutura. 62 Figura 4 : Impacto da publicação dos dados bibliográficos como DAC na estrutura do catálogo bibliográfico. Fonte: Autora (2021). Essa estrutura de catálogo, baseada em DAC, faz com que os dados das bibliotecas estejam visíveis para os buscadores da Web, amplia as possibilidades de combinação e de apresentação desses dados, culminando em resultados mais granulares e significativos para os usuários finais. Nessa seção foram descritas as Melhores Práticas para a publicação de Dados Abertos Conectados, bem como a relevância da publicação de dados bibliográficos como DAC. A próxima seção apresenta o percurso metodológico estabelecido nessa pesquisa, a fim de analisar as iniciativas de publicação de dados bibliográficos como DAC, à luz das 10 Melhores Práticas apresentadas. 63 4 PROCEDIMENTOS METODOLÓGICOS Do ponto de vista de sua natureza, essa pesquisa caracteriza-se como aplicada, tendo por objetivo “[...] gerar conhecimentos para aplicação prática dirigidos à solução de problemas específicos”. (PRODANOV; FREITAS, 2013, p. 51). Do ponto de vista de seus objetivos, a pesquisa se caracteriza como exploratória e descritiva, tendo como finalidade proporcionar a construção de um referencial teórico e metodológico sobre a publicação de dados bibliográficos como dados abertos e conectados. Como método de pesquisa, para alcançar os objetivos propôs-se a realização de uma Revisão Sistemática da Literatura (RSL) e a condução de um estudo empírico. A RSL consiste em uma revisão bibliográfica acrescida de critérios e de etapas que visam garantir a consistência e a representatividade dos documentos analisados e que preza pelo registro das tomadas de decisão do pesquisador em cada etapa, de forma a permitir que a pesquisa possa ser auditada, replicada e continuada do ponto em que foi interrompida. Uma revisão sistemática aborda uma questão específica, utiliza métodos explícitos e transparentes para realizar uma busca bibliográfica completa e avaliação crítica de estudos individuais, e tirar conclusões sobre o que atualmente sabemos e não sabemos. Sistemática significa simplesmente que os revisores seguem um design apropriado (mas não padronizado ou rígido) e que comunicam o que fizeram. (BRINER; DENYER, 2012, p. 112, tradução nossa). A Revisão Sistemática da Literatura foi conduzida em três etapas principais, conforme apresentado na Figura 5: 64 Figura 5 : Etapas da Revisão Sistemática da Literatura . Fonte: Jesus e Castro (2019, p. 47) O software StArt (State of the Art through Systematic Review), desenvolvido pelo Laboratório de Pesquisa em Engenharia de Software (LAPES), do Departamento de Ciência da Computação, da Universidade Federal de São Carlos (UFSCar) foi utilizado para auxiliar em todas as etapas da RSL. O StArt conta com um protocolo sistematizado em campos, nos quais são registradas as informações importantes como palavras-chave, critérios de inclusão e de exclusão, bases de dados consultadas e categorias de análise. As buscas e a sistematização dos resultados foram baseadas no protocolo representado no Quadro 4. Quadro 4: Preenchimento do protocolo de busca no StArt. Protocolo da Revisão Sistemática Objetivos Identificar o estado da arte e as iniciativas de publicação de dados bibliográficos como Dados Abertos e Conectados. Questão Principal Como tem sido abordada a publicação de dados bibliográficos como DAC na literatura científica da Ciência da Informação? Questão secundária Quais são as iniciativas de publicação de dados bibliográficos como DAC? 65 População Resultados de projetos de adequação de dados bibliográficos aos DAC que permitam desenvolver um corpus teórico entre os princípios DAC e os dados bibliográficos. Intervenção Estudos conceituais ou práticos da publicação de dados bibliográficos como DAC. Controle Análise exploratória do tema, considerando artigos, teses e dissertações publicados sobre a temática. Resultados Deseja-se a construção de uma base teórico-metodológica consolidada que embase a construção de recomendações para a publicação de dados bibliográficos como DAC. Aplicação Profissionais da Ciência da Informação que trabalhem com Catalogação Descritiva e a modelagem de ambientes/sistemas informacionais. Palavras-chave • Linked Data (Dados Ligados; Dados Conectados; Dados Interligados; Datos Vinculados; Datos conectados); • Linked Open Data (Dados Abertos Ligados; Dados Abertos Conectados; Datos Abertos Interligados; Datos Abiertos Conectados; Datos Abiertos Vinculados); • Catalog (Bibliographic Catalog; Catálogo; Catálogo Bibliográfico) • Bibliographic Data (Dados Bibliográficos, Datos bibliográficos) • Bibliographic Control (“Controle Bibliográfico” ""Control bibliográfico) • Cataloguing (Cataloging; Descriptive Cataloging; Descriptive Cataloguing; Subject Cataloging; Subject Cataloguing; Catalogação; Catalogação Descritiva; Catalogação de Assunto; Catalogación; Catalogación Descriptiva; Catalogación por Materias); • Authority Data (Dados de Autoridade; Datos de autoridade) • Authority File (Authority Files; Arquivo de autoridade; Archivo de autoridad); • Authority Work"(Trabalho de autoridade; trabajo de autoridade) • Knowledge Organization Systems (KOS; Sistemas de organização do conhecimento; SOC; Sistemas de organización del conocimiento); • Functional Requirements for Bibliographic Records (FRBR); • Bibliographic Framework (BIBFRAME); • Functional Requirements for Authority Data (FRAD); • Library Reference Model (IFLA LRM); • Functional Requirements for Subject Authority Data (FRSAD); • Resource Description and Access (sigla RDA não incluída por recuperar ruídos). Critérios de seleção de fontes Artigos científicos publicados em periódicos da área de Biblioteconomia e Ciência da Informação. Linguagem dos estudos Inglês, português e espanhol. 66 Métodos de seleção Leitura do título e do resumo dos documentos, aplicação dos critérios de inclusão e de exclusão, leitura da introdução e da conclusão ou ainda, do documento completo, nos casos em que as análises anteriores se mostrarem inconclusivas para a seleção. Bases de dados Information Science & Technology Abstracts - ISTA (EBSCO); Library and Information Science Abstracts - LISA (ProQuest); Library, Information Science & Technology Abstracts with Full Text - LISTA; Base de Dados em Ciência da Informação – BRAPCI. Criterios de inclusão (I) e exclusão (e) (I) Abordar a publicação de dados bibliográficos como DAC; (I) Discutir o papel de instrumentos tradicionais da Biblioteconomia e da Ciência da Informação na publicação de dados bibliográficos como DAC; (E) Não estar nos idiomas estabelecidos (PT, ENG, ESP); (E) Não estar no formato estabelecido (artigo); (E) Não abordar ou apenas mencionar a temática de interesse; (E) O documento completo não estar disponível via portal de periódicos, vinculação institucional com a UFSCar ou não pode ser localizado com acesso gratuito no ambiente Web. Tipos documentais Artigos de periódicos, sem restrição do período de publicação. Estudos iniciais Não se aplica ao estudo. Avaliação de qualidade dos estudos A avaliação da qualidade dos documentos será feita a partir da análise da metodologia dos estudos aceitos. Campos para avaliação da qualidade • Metodologia do estudo; • Método de avaliação do periódico. Campos de extração • Projeto de adequação de dados bibliográficos aos princípios de DAC; • Projeto de adequação de instrumentos de padronização aos princípios de DAC; • Enfoque dos documentos. Sumarização dos resultados. Após extração de dados, realizada seguindo o roteiro proposto no campo “campos de extração”, os dados foram agrupados em quadros de acordo com a categoria de análise, os resultados semelhantes serão agrupados permitindo a realização de uma análise quantitativa e a elaboração de inferências que permitirão responder à pergunta de pesquisa. Fonte: Autora (2021) Para possibilitar a análise dos resultados da RSL foram estabelecidas 3 categorias de análise, que devem atuar como um roteiro para a leitura dos documentos, auxiliando na extração de dados, a saber: • Exemplos e características de projetos de publicação de dados bibliográficos como DAC; • Etapas, formatos, códigos, regras e ferramentas relacionados à publicação de dados bibliográficos como DAC; 67 • Enfoque dos documentos. Segundo Briner e Denyer (2012) analisar os documentos permite examiná-los individualmente, enquanto ao sintetizar os resultados de diversos estudos, esses são observados como um conjunto, permitindo inferências que não são aparentes na análise individual desses documentos. Nesse sentido, os dados extraídos dos documentos aceitos na RSL foram sistematizados em quadros-resumo contendo título, o autor e o ano de publicação dos documentos e as informações localizadas de acordo com as categorias de análise. O estudo empírico consistiu na análise das iniciativas de publicação de dados bibliográficos como DAC oriundas da RSL, as quais foram compiladas, sendo identificadas e excluídas as duplicatas. Foram aceitas para compor o estudo, instituições com projetos em diferentes estágios, incluindo os em fase de planejamento, definindo como critério único, a existência de documentação registrada das etapas já realizadas. As informações sobre as iniciativas foram coletadas a partir dos sites oficiais, dos documentos técnicos e bibliográficos publicados a respeito dos projetos, sendo utilizadas as recomendações das 10 Melhores Práticas do W3C, como base para a seleção das informações coletadas. A análise de cada MP teve o objetivo de avaliar: 1) Se as instituições seguiram as recomendações da MP; 2) Quais as informações fornecidas pelas instituições a respeito da temática tratada pela MP; e 3) Quais os instrumentos, as ferramentas e as referências teórico- metodológicas utilizados para embasar o processo de publicação. Com base nos resultados da análise minuciosa, detalhada e exaustiva de cada caso foram elaboradas recomendações teórico-metodológicas, com informações sobre quais os procedimentos adotados pelo Universo Bibliográfico para adoção de DAC, quais os instrumentos, as ferramentas e as referências que podem auxiliar nesse processo. Dessa forma, a próxima seção apresenta a análise e a discussão dos resultados obtidos com base na RSL e a identificação e a sistematização das 68 iniciativas de publicação de dados bibliográficos como Dados Abertos e Conectados. 69 5 RESULTADOS DA REVISÃO SISTEMÁTICA DA LITERATURA As buscas nas bases de dados ocorreram no mês de setembro de 2019 e resultaram em 1474 documentos5. Durante a etapa de seleção foram identificados 476 documentos duplicados (32%), 304 documentos aceitos (21%) e 694 documentos rejeitados (47%), conforme apresentado na Figura 6. Figura 6 : Preenchimento do protocolo de busca no StArt. Fonte: Dados de pesquisa (2021). Durante a etapa de execução foram excluídos 150 documentos (49%) e aceitos para análise 154 documentos (51%), como apresentado na Figura 7. 5 Os arquivos da RSL, contendo lista de documentos recuperados, processo de seleção e aplicação dos critérios de inclusão e de exclusão serão publicados na versão final da dissertação, onde os dados resultantes da pesquisa serão disponibilizados no Repositório Institucional da Universidade Federal de São Carlos (UFSCar), como Dados Abertos. Dados temporariamente disponíveis em: https://drive.google.com/file/d/1Fz- iKpD9a5kpilCQ9EGnwC_mJwDzw1vh/view?usp=sharing. 70 Figura 7: Proporção de documentos aceitos, rejeitados e duplicados na fase de execução. Fonte: Dados de pesquisa (2021). A quantidade de documentos rejeitados se justifica pelo fato de que, para a inclusão dos documentos, não bastava que esses mencionassem os termos que compõem a estratégia de busca, mas que fossem discutidos6 os critérios estabelecidos nessa pesquisa, ou seja, que debatessem o processo de publicação de dados bibliográficos como DAC. Justifica-se também pela escolha de construção de uma estratégia de busca mais ampla, visando à obtenção de resultados mais abrangentes da temática de interesse. Para compreender como a relação entre dados bibliográficos e DAC tem sido abordada em artigos publicados em periódicos indexados pelas bases temáticas da Ciência da Informação procedeu-se à leitura desses documentos, a fim de identificar seus objetivos, resultados e assuntos discutidos. Esses documentos foram agrupados por objetivos semelhantes em categorias gerais; como resultado desse agrupamento foram obtidas 20 categorias. O Quadro 5 apresenta a relação entre as categorias e o número de ocorrência. 6 Para essa pesquisa foram consideradas as definições do dicionário Michaelis de língua portuguesa onde discutir é definido como “Debater, examinar, investigar, tendo em vista provas e razões pró e contra”, enquanto mencionar é descrito como “Mencionar o nome de; aludir, apontar, referir”. 71 Quadro 5: Proporção de documentos aceitos, rejeitados e duplicados na fase de execução. Categoria Enfoque N° de ocorrências 1 Discute um projeto/projetos de publicação de dados bibliográficos como DAC. 32 2 Discute a relação entre instrumentos de padronização do universo bibliográfico e os princípios de DAC. 25 3 Discute os impactos da publicação de dados bibliográficos como DAC. 24 4 Discussão metodológica sobre a publicação de dados bibliográficos como DAC. 13 5 Discute um projeto de publicação de dados de autoridade como DAC. 11 6 Discute os princípios de DAC e sua relação com as instituições do patrimônio cultural (arquivos, bibliotecas, museus e galerias de arte). 10 7 Analisa os impactos dos avanços tecnológicos no universo bibliográfico, abordando o papel dos princípios de DAC nesse contexto. 8 8 Analisa um Dataset de DAC como possível fonte de dados bibliográficos. 7 9 Estuda a perspectiva dos profissionais da informação sobre DAC. 5 10 Aborda a relação entre dados de autoridade DAC. 4 11 Discute a publicação de dados bibliográficos em formato RDF. 4 12 Discute a aplicação de DAC na publicação de dados bibliográficos de publicações seriadas. 4 13 Aborda a relação entre informações socialmente construídas e DAC. 2 14 Levanta casos de aplicação de DAC em bibliotecas e centros de informação. 2 15 Estuda a qualidade de dados bibliográficos publicados de acordo com os princípios de DAC. 2 16 Discute a questão do controle bibliográfico universal no contexto de DAC. 1 17 Discute a relação entre bibliotecas e os buscadores da Web, abordando o papel de DAC nesse contexto. 1 18 Discute a questão do identificador único atribuído a dados bibliográficos. 1 19 Discute o impacto dos avanços tecnológicos e de DAC no ensino dos processos de organização do conhecimento. 1 20 Discute a questão da privacidade no contexto da publicação de dados bibliográficos como DAC. 1 Fonte: Autora (2021). 72 Procedeu-se uma análise individual de cada categoria em ordem decrescente de ocorrência, com exceção da categoria 1, que discute projetos de publicação de dados bibliográficos como DAC (32 artigos) e da categoria 5 (11 artigos) – que discute projeto de publicação de dados de autoridade como DAC. Ambas as categorias reúnem estudos voltados para apresentar resultados de projetos e publicação de dados bibliográficos como DAC e, portanto, optou-se por incluí-las em uma categoria diferente para poder mapear, em que medida os dados de autoridade têm se destacado nos estudos que buscam a publicação. O Quadro 6 apresenta os artigos de ambas as categorias, as abordagens e as iniciativas estudadas. 73 Quadro 6: Proporção de documentos aceitos, rejeitados e duplicados na fase de execução. Título Autor Abordagem Caso analisado A strategy for integrating printed catalog cards from three cuban libraries into the open linked data space Gonzalez (2019) Relato – dados bibliográficos Integração dos catálogos de bibliotecas cubanas utilizando DAC. Identification of entities in the linked data collection “Rainis and Aspazija” (runa) Goldberga et al. (2019) Relato – dados bibliográficos Resultados de um estudo piloto Rainis and Aspazija, realizado para a conversão de dados na Biblioteca Nacional da Letônia. Recursos audiovisuais na web de dados: a construção do portal semântico audiovisual. Coneglian et al. (2018) Relato – dados bibliográficos Criação do Portal Semântico Audiovisual, que reúne dados de diversas bases de DAC. Preparing for the future: national library of medicine’s project to add mesh rdf uris to its bibliographic and authority records Boehr; Bushma (2018) Relato – dados de autoridade Projeto de adequação de dados de autoridade da Biblioteca Nacional de Medicina. Library metadata on the web: the example of data.bnf.fr Lapôtre (2017) Análise – dados bibliográficos Resultados do projeto data.bnf.fr, lançado pela Biblioteca Nacional da França. The canadian linke data summit: developing canada’s linked data future through cooperative alliances. Browning et al. (2017) Relato – dados bibliográficos Resultados da Iniciativa de publicação de DAC do Canadá. Using linked open data to enhance the discoverability, functionality and impact of emblematica online Cole et al. (2017) Relato – dados bibliográficos Projeto piloto para a conversão de dados bibliográficos de emblemas para DAC. O virtual international authority file: viaf e a agregação de valores por metadados de autoridade Romanetto, Santos; Alves (2017) Análise- dados de autoridade Analisa o projeto Virtual International Authority File. 74 Using openrefine’s reconciliation to validate local authority headings Carlson; Seely (2017) Relato – dados de autoridade Projeto de adequação de dados de autoridade organizado pelo departamento de Catalogação e Serviços de Metadados da Fondren Library da Rice University. Bibframe transformation for enhanced discovery Jin; Hahn; Croll (2016) Relato – dados bibliográficos Conversão de dados do formato MARC21 para o BIBFRAME, da Biblioteca da Universidade de Illinois em Urbana-Champaign. Aplicación del modelo de datos rdf na las bibliotecá digitales de bibliotecas, archivos y museos de españa Sulé et al. (2016) Análise – dados bibliográficos Análise de 51 repositórios digitais relacionados ao patrimônio cultural na Espanha. Piloting linked open data on artists’ books: a case study in interoperability and sustainability. Mathews; Smart (2016) Relato – dados bibliográficos Projeto para o enriquecimento de dados bibliográficos relacionados a livros de arte das bibliotecas da Universidade da Califórnia, em Irvine (UCI). Coordination of special and specialized libraries of turin: (cobis): linked open data bibliot. Morando; Secinaro (2016) Relato – dados bibliográficos Projeto piloto para a publicação como DAC, dos dados bibliográficos da iniciativa CoBiS (rede de 65 bibliotecas especializadas). From notes to annotations: dedications as data in the library of jacques derrida at princeton university. Thompson et al. (2016) Relato – dados bibliográficos Projeto piloto para a adequação de dedicações manuscritas da coleção especial Jacques Derrida, Universidade de Princeton como DAC. Initial bibframe 2.0 modeling for the library information spotlight opera planet. Xu et al. (2016) Relato – dados bibliográficos Publicação DAC de dados bibliográficos do Opera Planet, uma coleção de livretos de ópera, partituras, vídeos, gravações de som, mídia de streaming, dentre outros formatos relacionados à opera. Authority control in Serbia. Savié (2016) Relato – dados de autoridade Projeto para a construção do banco de dados de nomes pessoais de autoridades sérvias. La automatización de los servicios bibliotecários de la biblioteca nacional de biblio: antecedentes, situación actual y perspectivas de futuro Martínez Serrano; Pedrazuela (2015) Análise – dados bibliográficos Projeto para a publicação como DAC, de dados bibliográficos espanhóis promovido pelo serviço de banco de dados bibliográficos e pelo serviço de projetos bibliográficos da Espanha. Linked data @nlb. Hussein (2015) Relato – dados bibliográficos Resultados do Sistema de Gerenciamento de Dados Vinculado (DACMS), do Conselho Nacional de Bibliotecas de Cingapura. 75 Work in progress: the linked open bibliographic data project. Welsh et al. (2015) Relato – dados bibliográficos Projeto Linked Open Bibliographic Data, da Universidade UCL de Londres. Publishing the british national bibliography as linked open data. Deliot (2014) Relato – dados bibliográficos Projeto de conversão da British National Bibliography (BNB), da British Library, para o DAC. Notes on operations: visual representation of academic communities through viewshare Ilik (2014) Relato – dados de autoridade Projeto para publicação de dados de autoridade do corpo docente Texas A&M University (TAMU), organizado pela rede de bibliotecas da universidade. Linking library metadata to the web: the german experiences Mebmer (2013) Análise – dados bibliográficos Resultado da publicação dados bibliográficos de bibliotecas da Baviera, Berlim e Brandemburgo como DAC. Linked heritage experience in linking heritage information McKenna (2013) Relato – dados bibliográficos Linked Heritage, projeto para integração de dados do patrimônio cultural. Library marc records into linked open data: challenges and opportunities. Cole et al. (2013) Relato- dados bibliográficos Projeto piloto de publicação de dados bibliográficos ao da Biblioteca da Universidade de Illinois em Urbana- Champaign (UIUC), como DAC. Moving our data to the semantic web: leveraging a content management system to create the linked open library Thompson; Richard (2013) Relato – dados bibliográficos Projeto de conversão de dados bibliográficos ao Dados Abertos Conectados da Smithsonian Libraries. Three case studies in linked open data Mitchell (2013) Análise – dados bibliográficos Projeto Biblioteca Digital Europeia, Biblioteca Pública Digital da América; e a iniciativa BIBFRAME. Linked open data for new library services: the example of data.bnf.fr Wenz (2013) Análise – dados de autoridade Estudo do projeto data.bnf.fr, da Biblioteca Nacional da França. Enhancing a OAI-PMH service using linked data: a report from the sheet music consortium Davison et al. (2013) Análise – dados de autoridade Projeto para a publicação de dados de partituras como DAC. Cataloguing in the open – the disintegration and distribution of the record Malmsten (2013) Análise – dados de autoridade Estudo da publicação de dados de autoridade da Biblioteca Nacional Sueca. Using semantic web technologies to collaboratively collect and share user- generated content in order to enrich the presentation of bibliographic Holgersen; Preminger; Massey (2012) Relato – dados bibliográficos Protótipo da Öppna bibliotek para utilização de informações socialmente construídas no enriquecimento de dados bibliográficos. 76 records-development of a prototype based on rdf, d2rq, jena, sparql and wordaccat’s frbrization web service Oclc’s linked data initiative: using schema.org to make library data relevant on the web Fons; Penka; Wallis (2012) Análise – dados bibliográficos e de autoridade Discute diversos projetos de adequação de dados bibliográficos e de autoridade. Linked Data and the locah project Ruddock (2011) Relato – dados bibliográficos Projeto LOCAH financiado pela JISC (Linked Open Copac e ArchivesHub), voltado para a conversão de dados bibliográficos e arquivísticos para DAC. Data aggregation and dissemination of authority records through linked open data Agenjo; Hernández; Viedma (2011) Relato – dados de autoridade Publicação de dados de autoridade DAC da Biblioteca Virtual Polymath, cujo objetivo é reunir dados sobre polímatas espanhóis, hispano-americano, brasileiros e portugueses. Improving the presentation of library data using FRBR and linked data. Westrum; Talleras (2011) Relato – dados de autoridade Projeto piloto “Pode”, para a publicação de dados de autoridade em FRBR e Dados Abertos Conectados, uma das iniciativas para a construção de uma nova biblioteca pública em Oslo. Fonte: Autora (2021). 77 As iniciativas apresentadas no Quadro 6 compõe o estudo empírico e serão discutidas na seção 6. A categoria 2 inclui documentos que discutem a relação entre instrumentos de padronização do universo bibliográfico e os princípios de DAC, nela estão incluídos 25 documentos. O Bibliographic Framework (BIBFRAME), um modelo de dados e vocabulário DAC para a publicação de dados bibliográficos, aparece como objeto de estudo de 13 documentos, enquanto o Resource Description and Access (RDA), um conjunto de diretrizes para a criação de metadados no universo bibliográfico, é discutido em 11 documentos. Além disso, 7 documentos discutem ambos os instrumentos simultaneamente. A discussão do BIBFRAME e do RDA se mostra de grande importância para as iniciativas, tendo em vista que foram projetados para substituir AACR2r e o formato/padrão de metadados MARC21 que, ao longo dos anos estabeleceram-se como padrões para a descrição de recursos bibliográficos no ambiente das bibliotecas, sendo os responsáveis pela padronização e automação da publicação de dados bibliográficos, respectivamente. Ressalta-se também que, os trabalhos incluídos nessa categoria discutem o papel dos modelos conceituais criados pela IFLA, tal como a família FR e o IFLA LRM (11 documentos). A categoria 3 discute os impactos da publicação de dados bibliográficos como DAC e contempla 24 artigos. Esses trabalhos buscam apresentar como a adoção de DAC pode afetar a publicação de dados bibliográficos, analisando vantagens, desvantagens e desafios relacionados a essa adequação. A categoria 4 discute as questões metodológicas sobre a publicação de dados bibliográficos como DAC, sendo contemplada por 17 artigos. Essa categoria reúne artigos cujo objetivo foi discutir questões técnicas relacionadas à publicação de dados bibliográficos como Dados Abertos e Conectados, tais como: a seleção dos dados que serão publicados, a escolha das fontes de informação, a escolha da licença para publicação dos dados e de ferramentas utilizadas durante o processo. A categoria 6 discute os princípios de DAC e sua relação com as instituições do patrimônio cultural (arquivos, bibliotecas, museus e galerias de arte) e reúne 10 artigos, os quais analisam como a adoção de DAC amplia as 78 possibilidades de colaboração entre essas instituições, antes limitado por conta da utilização de padrões de metadados distintos. A categoria 7 analisa os impactos dos avanços tecnológicos no universo bibliográfico, abordando o papel dos princípios de DAC nesse contexto. A categoria inclui 8 artigos, cujo enfoque maior é discutir como o contexto tecnológico vigente tem afetado as necessidades dos usuários da informação e como a adoção de DAC pode contribuir para auxiliar no atendimento dessas demandas. A categoria 8 analisa datasets DAC como possíveis fontes de dados bibliográficos. Abordado por 7 artigos, ela inclui documentos cujo foco foi estudar Datasets, ou bancos de dados que publicam metadados como DAC e que podem contribuir para o aumento da granularidade dos dados bibliográficos, sendo relevantes para o processo de publicação de DAC, pois seu impacto deriva justamente das possibilidades de colaboração entre fontes de informação de diferentes setores. A categoria 9 estuda a perspectiva dos profissionais da informação sobre DAC e reúne 5 documentos que abordam como Dados Abertos e Conectados tem sido percebidos pelos profissionais da informação; analisam quais são as dificuldades desses profissionais frente aos novos instrumentos de padronização, a necessidade de atualização para lidarem com as mudanças e o posicionamento deles a respeito do conjunto de melhores práticas. A categoria 10, que inclui 4 documentos, aborda a relação entre dados de autoridade DAC e reúne documentos que trazem uma abordagem geral das vantagens, das desvantagens e dos desafios de adequar dados de autoridade aos Dados Abertos e Conectados. A categoria 11 discute a publicação de dados bibliográficos em formato RDF e inclui 4 documentos, os quais tiveram como objetivo analisar os impactos do formato RDF, uma das bases dos princípios de DAC, na publicação de dados bibliográficos, apontando as semelhanças e as diferenças desse modelo com os padrões de metadados tradicionais do universo bibliográfico, assim como as vantagens que esse formato tem a oferecer. Na categoria 12 discute-se a aplicação de DAC na publicação de dados bibliográficos de publicações seriadas. A categoria foi abordada por 4 artigos voltados para entender, de que maneira os Dados Abertos e Conectados podem 79 contribuir para melhorar a representação e a recuperação de publicações seriadas. A categoria 13 aborda a relação entre informações socialmente construídas e DAC na qual se encaixam 2 documentos, que discutem as possibilidades de reaproveitar informações elaboradas pelos próprios usuários no processo de catalogação descritiva e como o uso de Dados Abertos e Conectados pode facilitar essa reutilização. Esse tipo de fonte de informação tem sido mais comumente relacionado aos processos de tratamento temático da informação, com a finalidade de representação do conteúdo/assunto do recurso. Na categoria 14 são reunidos 2 artigos que levantaram casos de aplicação de DAC em bibliotecas e centros de informação. Pennington e Cagnazzo (2019) realizaram um estudo das bibliotecas nacionais da Europa visando identificar em quais delas existe a adoção de Dados Abertos e Conectados ou projetos para realizar essa adoção no futuro. Wahid, Warraich e Tahira (2018) realizaram uma Revisão Sistemática da Literatura com meta análise, para identificar casos de aplicação de DAC em centros de informação; esse estudo contou com 12 documentos analisados. As 12 iniciativas levantadas e discutidas a partir dessa RSL foram consideradas para o estudo de caso. A categoria 15 foi elaborada para reunir 2 artigos que estudam a qualidade e a consistência de dados bibliográficos publicados como DAC. As últimas 5 categorias são compostas por apenas um artigo cada, buscando analisar: o papel do controle bibliográfico universal (CBU) em ambientes de DAC; as formas como o uso de DAC por bibliotecas podem melhorar a recuperação de seus dados em buscadores tradicionais da Web; a relação entre URIs, um dos pilares dos Dados Abertos e Conectados, e o universo bibliográfico; como os currículos dos cursos de Biblioteconomia devem ser afetados pelas mudanças causadas pelos avanços tecnológicos; e, por último, discutir a questão da privacidade no contexto da publicação de dados bibliográficos como Dados Abertos e Conectados. Apresentados os resultados da RSL, a próxima seção aborda os dados do estudo empírico e a análise das iniciativas de publicação de dados bibliográficos como Dados Abertos e Conectados. 80 6 ANÁLISE DAS INICIATIVAS DE PUBLICAÇÃO DE DADOS BIBLIOGRAFICOS À LUZ DAS 10 MELHORES PRÁTICAS Essa seção apresenta os resultados da análise das iniciativas dos casos de publicação de dados bibliográficos como DAC e a discussão aprofundada da relação do estudo dessas instituições com as 10 (dez) Melhores Práticas publicadas pelo W3C (2014). Inicialmente foram identificados, a partir da RSL, 58 (cinquenta e oito) projetos que foram avaliados, sendo excluídas as iniciativas em fase inicial que não publicaram a documentação desse processo. Ao final foram selecionadas 34 (trinta e quatro) iniciativas para compor o estudo, as quais podem ser visualizadas no Quadro 7. Quadro 7: Casos de dados bibliográficos publicados como DAC. CASOS SELECIONADOS TIPO DE UNIDADE PAÍS Biblioteca Apostolica Vaticana (BAV) Biblioteca Nacional Vaticano Biblioteca Digital Brasileira de Teses e Dissertações (BDTD) Biblioteca Temática / coleção especial Brasil Biblioteca Virtual Miguel de Cervantes Biblioteca Temática /coleção especial Espanha Biblioteca Nacional de Espanã (BNE) Biblioteca Nacional Espanha Bibliothèque Nationale de France (BnF) Biblioteca Nacional França British National Bibliography (BNB) Biblioteca Nacional Reino Unido B3Kat Grupo Alemanha Canadian Linked Data Initiative (CLDI) Grupo Canada Cornell University Library Biblioteca Universitária Estados Unidos da América Digital Public Library of America (DPLA) Grupo Estados Unidos da América Deutsche Nationalbibliothek (DNB) Biblioteca Nacional Alemanha Europeana Grupo - Finnish National Bibliography (FENNICA) Biblioteca Nacional Finlândia Gutenberg Project Biblioteca Temática /coleção especial Estados Unidos da América Koninklijke Bibliotheek (KB) Biblioteca Nacional Países Baixos Library Information System of Swedish National Union (LIBRIS) Biblioteca Nacional Suécia Library of Congress (LC) Biblioteca Nacional Estados Unidos da América 81 Linked Data For Libraries (LD4L) Grupo Estados Unidos da América Linked Data for Production (LD4P) Grupo Estados Unidos da América Linked Logainm Grupo Irlanda LOCAH Grupo - National Library of Iran (NLAI) Biblioteca Nacional Iran National Library of Medicine (NLM) Biblioteca Temática /coleção especial Estados Unidos da América National Széchényi Library (NSZL) Biblioteca Nacional Hungria Polymath Virtual Library Biblioteca Temática /coleção especial Espanha Rainis e Aspazija (RUNA) Biblioteca Temática /coleção especial Letônia Sheet Music Consortium Grupo Estados Unidos da América Swissbib Grupo Suíça Texas A&M University Library (TAMU) Biblioteca Universitária Estados Unidos da América University of California Library Catalog (BIBFLOW) Biblioteca Universitária Estados Unidos da América University of Nevada Las Vegas Library (UNLV) Biblioteca Universitária Estados Unidos da América Virtual International Authority File (VIAF) Grupo Estados Unidos da América Washington University Library Biblioteca Universitária Estados Unidos da América WorldCat Grupo Estados Unidos da América Fonte: Autora (2021) As bibliotecas foram organizadas por tipologia e relacionadas, quando possível, ao seu país de origem. Foram classificados como “Grupo” os projetos ligados a organizações e grupos de bibliotecas que criaram consórcios para publicar os dados bibliográficos em conjunto. As análises tiveram como base os sites oficiais das iniciativas e os recursos bibliográficos e documentais publicados sobre o projeto. A análise inicial desses projetos demonstra que eles estão em diferentes níveis de implantação, desde aqueles que estão na fase de planejamento, como é o caso do NLAI, até os que já passaram por diversos projetos pilotos e estão na fase oficial de publicação dos dados, como a EUROPEANA, BNE e LC. Os projetos em fase mais avançada de implementação contribuem ativamente para acelerar o processo de publicação de dados bibliográficos como 82 DAC, fornecendo seus dados para que sejam reaproveitados por novas iniciativas, elaborando materiais que descrevem o passo-a-passo da publicação dos seus dados, desenvolvendo modelos conceituais, vocabulários e ferramentas que podem ser potencialmente aplicados no processo de conversão dos dados. As próximas subseções relacionam as análises dessas iniciativas às Melhores Práticas para a publicação de DAC, disponibilizadas pelo W3C (Quadro 3). 6.1 Prepare as partes interessadas Essa MP apresenta recomendações sobre como preparar as pessoas envolvidas direta (membros da equipe) e indiretamente (como os gestores da instituição) com o projeto. Segundo o W3C (2014), a adoção dessa MP tem impacto na continuidade do projeto a longo prazo, já que o entendimento dos benefícios e das etapas de publicação dos DAC faz com que a equipe se mantenha motivada. De acordo com o W3C (2014), a preparação dos envolvidos com o projeto contempla: • Compartilhar os benefícios da publicação DAC; • Relacionar esses benefícios aos objetivos e missões da instituição; • Garantir que a equipe esteja familiarizada com os conceitos-chave de Dados Abertos e Conectados. Os objetivos e as vantagem de adotar DAC tem um papel importante na justificativa de realização do projeto para a equipe gestora e para a entidade mantenedora da biblioteca, bem como no processo de motivação e de preparo da equipe envolvida. Nesse sentido, os recursos bibliográficos e documentais publicados a respeito dos projetos foram analisados visando identificar os objetivos iniciais que as levaram a adotar DAC, bem como as vantagens apresentadas por essas instituições para justificar a realização dos projetos, conforme demonstrado no Quadro 8. 83 Quadro 8: Relação entre as iniciativas e justificativas que embasam a adoção de DAC. INICIATIVA OBJETIVOS VANTAGENS BNE - Aumentar o valor dos recursos e a visibilidade dos autores a partir da conexão dos dados. (BNE, 2019). - Melhorar a capacidade de descoberta dos dados da biblioteca por buscadores e navegadores, ampliando sua visibilidade na Web. (BNE, 2019). BNF - Adaptar-se às novas práticas de busca dos usuários, focadas em buscadores da Web; - Tornar a ação pública mais transparente e eficiente ao racionalizar a criação de dados públicos, através da difusão e da obtenção de dados; - Fomentar a atividade econômica, disponibilizando informação reutilizável e útil, para uso comercial e não comercial; - Objetivos relacionados com a missão da biblioteca, de permitir que o maior número possível de pessoas tenha acesso às coleções, inclusive a partir do acesso remoto aceito pelas tecnologias da Web. (BNF, 2018). - Tornar as informações produzidas pelas bibliotecas mais acessíveis na Web. - Economia de recursos ao disponibilizar dados para serem reutilizados. (BNF, 2018). B3KAT - Tornar os dados locais e regionais visíveis em todo o mundo; - Completar e aumentar o valor dos dados a partir de fontes externas estabelecidas na Web; - Fornecer dados para fontes externas; - Contribuir ativamente com o movimento de acesso aberto. (MEBMER, 2013). 84 CLDI - Fornecer uma estrutura para compartilhar dados semanticamente ricos de uma maneira amigável para a Web; - Permitir que as bibliotecas façam parte da Web de Dados. (VAN BALLEGOOIE, 2015). CORNELL UNIVERSITY LIBRARY - Atender ao planejamento estratégico da instituição; - Verificar se a produção dos dados de acordo com DAC é mais eficiente do que depender da transformação de dados legados; - Reavaliar os custos e os benefícios associados à descrição de nossas coleções; - Testar se a adoção de DAC: - Melhora a descoberta e fornece maior contexto para coleções de bibliotecas; - Somada a tecnologias relacionadas pode alcançar melhores fluxos de trabalho; - Pode ser aplicada com sucesso a uma ampla gama de tipos de coleção; e - Tem impacto direto sobre os usuários. (NAUN; KOVAR; FOLSOM, 2015). - A pandemia de COVID-19 afetou o acesso aos espaços físicos fazendo com que ampliar o acesso eletrônico, por meio dos mecanismos de busca da Web, torne-se mais importante. (CORNELL UNIVERSITY LIBRARY, 2020). - Resolver uma série de problemas de busca, ao permitir um refinamento melhor das pesquisas e criar possibilidades de busca; - Tornar o conhecimento implícito em explicito, por meio de inferência; - Facilitar o compartilhamento de dados para a descoberta de recursos; - Beneficiar os usuários externos, ao prover serviços aprimorados e internos, ao promover maior consistência dos dados e eficiência; - Aprimorar o ambiente de descoberta a partir da utilização de dados de fontes externas; - Expor de forma mais eficaz as coleções, aumentando a visibilidade na Web; - Evitar a criação de dados redundantes para entidades já descritas na Web como DAC. (NAUN; KOVAR; FOLSOM, 2015). DNB - Trazer melhorias decisivas na estabilidade e confiabilidade da nuvem de dados conectados; 85 - Tornar-se um dos pilares da Web de Dados. (DNB, 2019). EUROPEANA - A adoção de DAC foi prevista como parte do planejamento estratégico da instituição. (EUROPEANA, 2017); - Identificar e reunir possíveis provedores de conteúdo, provendo grandes quantidades de dados advindos dos setores públicos e privados para a Europeana; - Demonstrar melhor qualidade do conteúdo, em termos de riqueza, potencial de reutilização e exclusividade; - Aprimorar a pesquisa, a recuperação e a utilização dos conteúdos da Europeana; - Promover consulta, construção e compartilhamento de perspectivas e prioridades; - Identificar os padrões mais apropriados e úteis; - Promover treinamento e divulgação de DAC para capacitar profissionais relacionados ao patrimônio cultural. (EUROPEANA, 2014). - Permitir que os dados se tornem facilmente acessíveis usando tecnologias da Web; - Permitir que os usuários possam acessar, reutilizar, enriquecer e compartilhar os dados publicados; - Permitir que os metadados sejam conectados e enriquecidos, de forma que diferentes representações do mesmo conteúdo possam ser encontradas e relacionadas. (EUROPEANA, 2017). FENNICA - Aumentar a visibilidade dos dados, inclusive internacionalmente; - Melhorar a qualidade e interoperabilidade dos dados da biblioteca. (SUOMINEN, 2017). - Nenhuma das desvantagens encontradas é desmotivadora o bastante. (SUOMINEN, 2017). LC - Compartilhar metadados, facilitando a vinculação fora do catálogo; - Maior visibilidade, descoberta e localização das informações. (HALLA, 2013). 86 LD4L - Reunir uma equipe para promover a adoção de DAC em bibliotecas; - Desenvolver ferramentas, ontologias, serviços e abordagens que usam DAC para melhorar a descoberta, o uso e a compreensão de recursos informacionais; - Fornecer suporte direto para projetos de instituições participantes do Programa LD4P. (WOODS, 2019). LD4P - Os objetivos foram elaborados como metas a serem cumpridas em um período específico; - Desenvolver padrões, diretrizes e infraestrutura para produzir metadados DAC de forma comunitária; - Contribuir com o desenvolvimento do BIBFRAME; - Desenvolver recomendações para modelagem; - Avaliar ferramentas de DAC e criar um protótipo de infraestrutura para produção cooperativa. (BRANAN; FUTORNICK, 2020). LIBRIS - Permitir que os dados bibliográficos sejam usados fora do Universo Bibliográfico; - Ampliar a capacidade de reutilização de dados de fontes externas. (AXELSSON, 2018). LINKED LOGAINM - Permitir que os dados sejam totalmente explorados por colaboradores, desenvolvedores da Web, cientistas da computação, comunidade do patrimônio e profissionais da informação; 87 - Incentivar a disseminação internacional de topônimos em língua irlandesa. (GRANT; LOPES; RYAN, 2013). LOCAH - Ampliar as possibilidades de conexões; - Melhorar as experiências de pesquisa dos usuários; - Encorajar outras instituições a expor seus dados bibliográficos e de arquivo como DAC; - Diminuir a burocracia. Não há necessidade de pedir a outras partes da universidade seus dados, desperdiçando seu tempo, se já tiverem sido publicados centralmente. (RUDDOCK, 2011). NLAI - Aumentar a presença e a descoberta dos dados na Web; - Enriquecer os dados da biblioteca com dados advindos de fontes externas. (ESLAMI; VAGHEFZADEH, 2013). NLM - Contribuir para o desenvolvimento do BIBFRAME. - Incentivar a ênfase na criação de novos dados em vez da conversão de dados legados; - Manter os objetivos a curto prazo modestos e alcançáveis. (NLM, 2015). NSZL - Lidar com o aumento rápido de publicações criadas em todos os campos; - Lidar com a quantidade de dados não estruturados gerados por máquina; - Disponibilizar dados estruturados, significativos e contextualizados para o público. (NSZL, 2019). - Ampliar as possibilidades de cooperação para um público, abrangendo: cidadãos, cientistas e instituições. (NSZL, 2019). 88 POLYMATH VIRTUAL LIBRARY - Reunir, de maneira mais eficiente e granular, dados e informações de diversas fontes DAC, sobre obras de pensadores espanhóis, hispano-americanos, brasileiros e portugueses; - Aumentar a visibilidade e a reutilização dos dados da coleção. (AGENJO; HERNÁNDEZ; VIEDMA, 2011). RUNA - Buscar variedade e qualidade em prol da quantidade, descrevendo e conectando os objetos com a maior precisão possível; - Desenvolver um novo recurso para as humanidades digitais; - Verificar a viabilidade de publicar os dados da biblioteca como DAC; - Testar capacidades de cooperação com outras instituições do patrimônio cultural; - Avaliar os instrumentos de padronização compatíveis com DAC desenvolvidos no âmbito do universo bibliográfico. (GOLDBERGA et al., 2018). SHARE-VDE - Reunir e disponibilizar para busca dados bibliográficos produzidos por diversas bibliotecas; - Apresentar os objetivos em forma de metas a serem atingidas. (SHARE-VDE, 2019a); - Enriquecer os dados da biblioteca a partir de URIs; - Ampliar a descoberta de recursos pelos usuários finais; 89 - Acompanhar os avanços tecnológicos; - Colaborar com a iniciativa LD4P; - Acompanhar o desenvolvimento da iniciativa BIBFRAME e dos avanços do universo bibliográfico no âmbito de DAC. (SHARE-VDE, 2019b). SWISSBIB - Integrar o catálogo da biblioteca à Web a partir da criação de DAC. (SWISSBIB, 2018). - Melhorar a interoperabilidade, tornando mais flexível a reutilização de dados de fontes externas. (SWISSBIB, 2018). TAMU - Objetiva utilizar DAC nos dados de autoridade, como forma de lidar com os problemas de ambiguidade aos quais esses dados são suscetíveis. (HO, 2019). UNLV LIBRARIES - Publicar um projeto piloto, visando avaliar viabilidade de um processo que permita a transformação dos dados bibliográficos das coleções digitais em DAC e que preserve a expressividade e a riqueza dos dados originais. (SOUTHWICK; LAMPERT; SOUTHWICK, 2015). - Melhorar a descoberta e as conexões com conjuntos de dados de fontes externas. (SOUTHWICK; LAMPERT; SOUTHWICK, 2015). WORLDCAT - Adequar os dados bibliográficos ao contexto tecnológico vigente; - Ampliar a reutilização dos dados fora do domínio bibliográfico; - Ampliar as possibilidades de representação com o uso dos modelos e dos vocabulários advindos de diversos domínios. (SMITH-YOSHIMURA, 2020). Fonte: Autora (2021). 90 A partir do Quadro 8 é possível observar que a apresentação de vantagens da publicação de dados bibliográficos como DAC tem um papel importante na construção dos objetivos e das justificativas dos projetos. Dentre as vantagens listadas pelas iniciativas destacam-se: • Ampliar a visibilidade e a recuperação dos dados bibliográficos nos buscadores Web; • Possibilitar o reaproveitamento dos dados bibliográficos por entidades não pertencentes ao universo bibliográfico; • Otimizar as possibilidades de busca; e • Enriquecer os dados bibliográficos com dados de fontes externas, evitando retrabalho. Outra tendência identificada é a de alinhar os objetivos com a missão e o planejamento estratégico da instituição, e ainda alinhá-los com o objetivo maior da instituição mantenedora da biblioteca, como o governo - no caso de bibliotecas públicas -, ou a universidade, no caso de bibliotecas universitárias. A BNB apresenta um exemplo dessa relação, onde a adoção de DAC é feita com o objetivo de contribuir com o governo, que estabeleceu a meta de ampliar a disponibilização de dados DAC. Dentre os exemplos de objetivos destacam-se o caso da TAMU, onde a publicação de dados bibliográficos como DAC foi formulada com o objetivo de solucionar um problema específico que a instituição enfrentava, nesse caso lidar com as questões de ambiguidade de dados de autoridade. Para tornar os objetivos mais compreensíveis, a NLM e do SHARE-VDE dividiram os objetivos em metas com prazos bem estabelecidos, focando em atividades alcançáveis a curto prazo. Outra estratégia para preparar as partes interessadas, observada no Quadro 8, é a realização de um projeto piloto. Como um adicional a essas estratégias, Stevenson (2011) ao abordar formas de apresentar o projeto aos gestores da biblioteca, acrescenta as seguintes orientações: • Verificar se sua instituição pode contribuir com algum projeto – essa recomendação vai de encontro com os resultados do Quadro 8, nele é possível observar iniciativas de grupos de bibliotecas atuando em conjunto ou de projetos cujo objetivo principal é o de contribuir com iniciativas mais consolidadas. 91 O que é condizente com o princípio de cooperação dos dados conectados, mesmo quando os dados são de produção individual da biblioteca, eles são pensados para cooperar com outras instituições. (STEVENSON, 2011, não paginado, tradução nossa). • Facilitar o fornecimento de dados que podem ser utilizados como parte dos esforços de dados vinculados por terceiros e vender a ideia a consumidores em potencial, ampliando assim o interesse no desenvolvimento do projeto; e • Designar as tarefas difíceis para as pessoas que estão motivadas e que possuem o conhecimento necessário. Após apresentar as vantagens, traçar os objetivos, alinhá-los ao planejamento estratégico da biblioteca e da instituição mantenedora e familiarizar a equipe com as etapas de um projeto de publicação de DAC, a próxima preocupação, de acordo com o W3C (2014), é a seleção do conjunto de dados. 6. 2 Selecione um conjunto de dados Esta Melhor Prática discute o processo de seleção dos dados que serão publicados como DAC. A MP recomenda que “Ao publicar um conjunto de dados, selecione dados coletados ou criados exclusivamente pela sua organização”. (W3C, 2014, não paginado, tradução nossa). Nesse sentido, buscou-se no referencial bibliográfico e documental informações sobre o processo de seleção dos dados dos projetos analisados e os critérios utilizados nesse processo. Nem todas as instituições atingiram a etapa de publicação dos dados e nem todas as instituições apresentaram informações a respeito do processo de seleção. O Quadro 9 apresenta uma análise das instituições já em fase de publicação e que forneceram, a partir do referencial bibliográfico ou documental, informações sobre o processo de seleção dos dados. Quadro 9: Análise do processo de seleção de dados para a publicação como DAC. INICIATIVA DADOS SELECIONADOS PARA A PUBLICAÇÃO BDTD - Projeto piloto para a publicação DAC de dados da Biblioteca Nacional de Teses e Dissertações. (DINIZ; LIMA; MACULAN, 2017). - Aponta que a Bibliografia Nacional Britânica (BNB) é uma fonte confiável de informações sobre publicações do Reino Unido de 1950 ao presente, e que por ser uma coleção mais abrangente pode ser de interesse para um número maior de consumidores; 92 BNB - Os dados são razoavelmente consistentes e bem conservados, os registros têm números de classificação e os títulos geralmente estão sob controle de autoridade. - Outra justificativa para a seleção do conjunto é de que ele apresenta uma quantidade significativa de dados - cerca de 3 milhões de registros em vários idiomas; - Os direitos anexados a este conjunto de dados eram claros. Quando os metadados não eram de criação própria, estavam estruturados com direitos de distribuição perpétua, permitindo que a BNB fosse capaz de disponibilizar os resultados como dados abertos. (DELIOT, 2014). BNE - Publicação de um projeto piloto (dados relacionados a todas as obras do autor Miguel de Cervantes, bem como as entidades a ele relacionadas); - Transformação completa dos registros de autoridade e um subconjunto do catálogo bibliográfico; - Os dados foram analisados para identificar seus propósitos, tipologia (bibliográficos ou de autoridades), os instrumentos de padronização utilizados em sua elaboração, as principais entidades descritas e como elas se relacionam. (VILA-SUERO; GÓMEZ- PÉREZ, 2013). BNF - A BNF é responsável pelo depósito legal na França, elaborando a descrição das publicações realizadas no território nacional, tornando os seus dados únicos e de interesse para a comunidade; - Foram selecionados os dados da coleção especial de Arquivos e Manuscritos da BNF e a Gálica - biblioteca digital. (LAPÔTRE, 2017). EUROPEANA - Coleção que reúne dados e diversas instituições contando com [...] fornecedores diretos da Europeana, abrangendo mais de 200 instituições culturais de 15 países. Eles cobrem uma grande variedade de objetos do patrimônio cultural. (EUROPEANA, 2017, não paginado, tradução nossa). FENNICA - Bibliografia Nacional da Finlândia. (NATIONAL LIBRARY OF FINLAND, 2020). - Foram priorizados dados de coleções exclusivas, sendo exemplos: - Catálogo de títulos curtos Holanda, bibliografia nacional retrospectiva da Holanda para o período de 1540-1800; - Biblioteca Digital para Literatura Holandesa, coleção digital de textos pertencentes à literatura, linguística e história cultural holandesa desde os primeiros tempos até os dias atuais; - Publicação dos editores reconhecidos no 'Depot of Dutch', bem como uma grande parte das publicações holandesas que aparecem fora dos canais reconhecidos, a chamada literatura cinzenta; 93 KB - Dicionário de sinônimos holandês de nomes de autores; - Tesauro holandês de nomes de autores; - Dicionário de sinônimos; - Tópicos Brinkman, tesauro de assuntos; - Índice de Assunto Comumuns; - Dicionário de Palavras-Chave. (KB, 2021). LINKED LOGAINM - Bancos de autoridade para nomes irlandeses. - Abre um canal para pedidos de dados que podem ser de interesse para a comunidade. (GRANT et al., 2013). LOCAH PROJECT - Dados do COPAC – um catálogo cooperativo que unifica dados de bibliotecas nacionais, acadêmicas e especializadas, fornecendo um único ponto de pesquisa. (STEVENSON, 2012). NLAI - Projeto piloto para publicação como DAC dos dados de autoridade da bibliografia nacional. (ESLAMI; VAGHEFZADEH, 2013). NLM - Dados de assunto de um vocabulário especializado da saúde, utilizados para enriquecer os dados bibliográficos e de autoridade. (NLM, 2015). NSZL - Dados do Catálogo nacional húngaro MOKKA. (NSZL, 2019). POLYMATH VIRTUAL LIBRARY - Conjunto de dados de uma coleção especial, criada para fomentar o acesso e a valorização de obras de pensadores espanhóis, portugueses, brasileiros e latino-americanos (polímatas), a partir de uma perspectiva histórica. (AGENJO; HERNÁNDEZ; VIEDMA, 2011). RUNA - Projeto piloto, com resultados abertos ao público; - Seleção de dois autores relevantes na Lêtonia (Rainis e Aspazija); - A biblioteca possui uma coleção especial, com primeiras edições das obras, anotações, e outros materiais de texto, incluindo correspondência entre os autores. Essas correspondências e anotações também foram representadas como DAC. - Também foram descritos o contexto histórico e a conexão com fatores externos, como pessoas, instituições, locais, eventos. - A próxima etapa do projeto é publicar a bibliografia nacional como DAC. (GOLDBERGA et al., 2014). SHEET MUSIC CONSORTIUM - Dados de partituras musicais, resultantes de uma parceria entre diversas instituições; - Objetivou publicar dados raros ou únicos, que pudessem contribuir para a vinculação com DAC já publicados por outras bibliotecas e organizações relacionadas; 94 - Para a o projeto piloto foram selecionados os dados de autoridade de nomes de editores, já que esses geralmente não são controlados, mas possuem um alto potencial de ligação. (SHEET MUSIC CONSORTIUM, [2020], não paginado, tradução nossa). VIAF - Conjunto de dados de autoridade advindos de bibliotecas nacionais, agrupados em clusters e disponibilizados sob um único URI. (OCLC, 2021). Fonte: Autora (2021). Com base na análise do Quadro 9 é possível observar que as Bibliotecas Nacionais estão em uma posição privilegiada para disponibilizar dados exclusivos, principalmente aquelas que são responsáveis pelo depósito legal em seus países. No processo de seleção dos conjuntos destacam-se ainda os dados de coleções especiais, como os de manuscritos, de obras raras, relacionados a fundos de autores, de nomes de autoridade locais e de teses e dissertações. Destacam-se também, os catálogos coletivos que reúnem e disponibilizam dados advindos de diversas fontes. Dentre os exemplos apresentados destaca-se o caso da BNE discutido por Vila- Suero e Gómez-Pérez (2013), ao apontarem que no caso dos dados da BNE onde além de selecionar dados exclusivos, foi feita a seleção de dados que seriam convertidos dentro do registro MARC21, essa decisão foi tomada porque o conjunto já era representativo o suficiente e ainda porque facilitaria o processo de tratamento dos dados que seriam convertidos. Deliot (2014) aponta ainda a importância de avaliar a licença original dos dados antes da seleção, para saber se ao final da conversão, eles poderão ser disponibilizados como Dados Abertos Conectados. Novamente se destaca a importância de um projeto piloto, como no caso da MP 1 - Preparar as partes interessadas. Um exemplo de seleção de dados para o projeto piloto é o caso da iniciativa Sheet Music Consortium, que selecionou dados que normalmente não são publicados de maneira estruturada, mas que se relacionam com dados de muitas fontes da área musical. Outra questão em relação aos pilotos é de que eles devem seguir todas as etapas de publicação, sendo inclusive disponibilizados de maneira aberta para a comunidade, como ocorre no projeto RUNA, por exemplo. Após tratar do processo de seleção, a próxima MP discute o processo de modelagem dos dados. 95 6.3 Modele os dados Essa MP discute o processo de modelagem dos dados, que de acordo com o W3C (2014) inclui: • A seleção da equipe que irá participar da modelagem; • A descrição dos dados que serão publicados; • O estabelecimento das principais entidades e dos relacionamentos presentes entre essas entidades. Em relação à equipe que irá participar do processo de modelagem dos dados, o W3C (2014) orienta que essa deve ser multidisciplinar, incluindo representantes da gestão da instituição, os responsáveis pelo estabelecimento das políticas de dados das instituições e o responsável pela gestão do banco de dados, por exemplo. Ainda de acordo com o W3C (2014, não paginado, tradução nossa), “Um especialista no assunto de Dados Conectados deve facilitar o processo de modelagem e ser capaz de explicar os Princípios de Dados Conectados e o ciclo de vida dos dados”. O Quadro 10 apresenta o resultado da análise que teve por objetivo avaliar quais as instituições disponibilizam um modelo de dados, quais as informações apresentadas nesses documentos e se esses modelos são baseados em algum dos modelos conceituais estabelecidos no universo bibliográfico. As buscas por esses modelos foram realizadas nas páginas oficiais dos projetos. Quadro 10: Análise dos modelos de dados apresentados pelas instituições. Iniciativa Informações presentes no modelo Link para o modelo BNB - Divisão em dois modelos: um para livros e um para publicações seriadas; - Diagrama do modelo de dados. https://www.bl.uk/bibliogr aphic/pdfs/bldatamodelci p.pdf http://www.bl.uk/bibliogra phic/pdfs/bldatamodelbo ok.pdf BNE - Mapeamento do FRBR para RDF; - Um modelo RDF para registros MARC21; - Estrutura da ISBD utilizada para descrição, apresentada em RDF; - Lista dos vocabulários utilizados; http://www.bne.es/es/Inic io/Perfiles/Bibliotecarios/ DatosEnlazados/Modelo s/ 96 - Indicação dos mapeamentos realizados, sendo eles: - Mapeamento entre campos e subcampos MARC21, para identificação de entidades FRBR. Realizados apenas nos dados de autoridade; - Mapeamento para identificação dos potenciais relações entre as entidades, a partir de análise de campos e subcampos MARC21. Realizados nos dados bibliográficos e de autoridade; e - Mapeamento das combinações entre campo e subcampo MARC21 e a ontologia BNE. Realizado nos dados bibliográficos e de autoridade. BNF - Descrição do projeto; - Fontes originais dos dados; - Fontes externas utilizadas para enriquecer os dados; - Formas de recuperação e obtenção dos dados; - Estrutura dos URIs (sufixos utilizados); - Estrutura do FRBR, no qual a modelagem foi baseada; - Esquema do modelo de dados; - Vocabulários utilizados; - Descrição da BnF onlogy (bnf-onto); - Mapeamentos entre o formato INTERMARC (utilizado nos dados originais) e a estrutura RDF adotada. https://data.bnf.fr/en/sem anticweb DNB - Introdução, com apresentação do projeto; - Vocabulários utilizados; - Modelos internos utilizados no processo; - Mapeamento entre campos e subcampos MARC21 e o modelo proposto; - Estrutura do URIS. https://www.dnb.de/Shar edDocs/Downloads/EN/ Professionell/Metadaten dienste/linkedDataModel lierungTiteldaten.pdf?__ blob=publicationFile&v= 2 EUROPEANA - Indicação para outros documentos sobre o modelo; - Histórico de desenvolvimento do modelo; https://pro.europeana.eu /page/linked-open-data https://pro.europeana.eu 97 - Mapeamento das entidades; - Formatos de serialização; - Lista de propriedades; - Estrutura dos URIs. /files/Europeana_Profes sional/Share_your_data/ Technical_requirements/ EDM_Documentation/E DM_Primer_130714.pdf FENNICA - Introdução sobre o projeto; - Instruções sobre como acessar os dados; - Estrutura dos URIs; - Diagrama do modelo; - Tabelas com detalhes das classes e propriedades. https://www.kiwi.fi/displa y/Datacatalog/Fennica+ RDF+data+model LC - Diagrama do modelo; - Breve explicação das classes e entidades. https://www.loc.gov/bibfr ame/docs/bibframe2- model.html SWISSBIB - Elaborado para levar em consideração as necessidades dos usuários finais dos dados; - Descrição dos dados originais; - Formatos de serialização; - Diagrama do modelo; - Vocabulários utilizados. https://swissbib.blogspot. com/2016/04/swissbib- data-goes-linked-teil- 1.html Fonte: Autora (2021). Dentre as 34 instituições selecionadas para o estudo, foi possível localizar o modelo de dados de apenas 8 casos. Uma análise dos modelos localizados demostra que entre as informações frequentes estão: • Descrição do projeto, seus objetivos e dados contemplados; • Fontes e formatos originais dos dados; • Apresentação dos vocabulários, modelos e ontologias aplicados; • Descrição da estrutura desses instrumentos, contemplando a apresentação das classes e das propriedades utilizadas; • Mapeamento do formato original dos dados, como MARC21 para RDF; • Diagrama do modelo de dados; • Estrutura dos URIs. 98 Embora as informações presentes nesse documento possam ser localizadas de maneira dispersa nas fontes de informação das demais instituições, a publicação do modelo é uma forma eficiente de compreender a estrutura de dados utilizada, facilitando assim a sua reutilização. Observou-se ainda que mesmo as instituições que não disponibilizaram o modelo de dados forneceram informações sobre os instrumentos do domínio bibliográfico que auxiliaram no processo de modelagem dos dados. Após discutir a modelagem dos dados, a próxima MP discute o estabelecimento da licença dos dados. 6.4 Especifique uma licença apropriada Essa MP está relacionada ao estabelecimento da licença de uso dos dados. É a licença que vai definir o proprietário original dos dados e as maneiras como esses dados podem ser reutilizados. Rautenberg et al. (2018, p. 35) indicam algumas questões que podem nortear a seleção da licença adequada, sendo elas: • Serão permitidas alterações nos dados? • Os dados podem ser utilizados para fim comercial? • Os direitos autorais anteriores devem ser mantidos? • Os resultados da utilização desses dados devem manter a licença? O W3C (2014, não paginado, tradução nossa) aponta como fonte para a seleção da licença o site do creative commons7, iniciativa responsável por “desenvolver, apoiar e administrar a infraestrutura legal e técnica para publicação de conteúdo digital”. No site do creative commons, respondendo a um questionário é possível identificar qual a licença mais apropriada para o conjunto de dados e os procedimentos para atribuir essa licença aos dados. O W3C (2014) aponta ainda que estabelecer e disponibilizar a licença dos dados aumenta as suas chances de reuso, pois os futuros consumidores saberão como manipular esses dados, tendo em mente o que pode ser feito e quais são as restrições de uso. 7 Disponível em: https://creativecommons.org/. Acesso em: 20 jan. 2021. 99 É importante destacar que, para que os dados sejam abertos e conectados é necessário que seja estabelecida uma licença de acesso aberto, inclusive para fins comerciais. Nesse sentido, buscou-se verificar as licenças adotadas pelas instituições, sendo consultadas preferencialmente as páginas oficiais dos projetos; nos casos em que a informação não estava presente foram consultados ainda o referencial bibliográfico publicado a respeito do projeto e a plataforma da nuvem de DAC. O resultado dessa análise é apresentado no Quadro 11. Quadro 11: Licença para abertura de dados adotado pelas iniciativas. Caso Licença BnF (France) Licença aberta para todos os tipos de usos, inclusive com fins comerciais. (BNF,2014). BNE CC0 - Creative Commons Public Domain Dedication. (VILA-SUERO; GÓMEZ- PÉREZ, 2013) DNB CC0 1.0 - Creative Commons Zero terms. (DNB, 2019) KB ODC-BY (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). NSZL Open Definition (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). BNB CC0 1.0 (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). RUNA Abertos para reutilização (GOLDBERGA et al., 2018), Fennica CC0 license (NATIONAL LIBRARY OF FINLAND, 2020). NLAI Dados não publicados LC Não localizado, classificado como no- license-metadata (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). LIBRIS CC0 license (AXELSSON, 2018). The Cornell University Library Dados não publicados. University of Washington Libraries CC0 1.0 (UNIVERSITY OF WASHINGTON LIBRARIES, 2020). TAMU Dados não publicados. BIBFLOW Dados não publicados. 100 Biblioteca Virtual Miguel de Cervantes CC0 1.0 (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). The Polymath Virtual Library CC0 (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). National Library of Medicine Não localizado B3Kat CC-by (MEBMER, 2013). WorldCat Não localizado. Linked Logainm Open Database License (ODbL) v 1.0 (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). Europeana CC0 (EUROPEANA, 2017) Sheet Music Consortium Não localizado. VIAF Open Data Commons Attribution License (ODC-By). (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). CLDI Não localizado. LOCAH Open Data Commons license (RUDDOCK, 2011). LD4l / LD4P Dados não publicados. Swissbib CC0 (INSIGHT CENTRE FOR DATA ANALYTICS, 2020). UNLV Libraries Dados não publicados. BDTD Dados não publicados. Fonte: Autora (2020). Das 34 instituições analisadas não foi possível identificar a licença de 4 delas; 2 instituições não estabeleceram uma licença, mas indicaram que os dados são abertos para reutilização, inclusive com fins comerciais. Existe ainda o caso de 8 instituições, cujos dados ainda não foram publicados. Todas as instituições que atribuíram uma licença aos dados escolheram licenças de acesso aberto, permitindo a utilização e a modificação dos dados, inclusive para fins comerciais. 101 As principais diferenças identificadas foram em relação à especificidade, sendo as licenças do Creative Commons voltadas para recursos de maneira ampla e as licenças da Open Knowledge Foundation voltadas especificamente para bancos de dados, separando a licença dos dados da licença e dos seus conteúdos. Outra diferença identificada foi em relação aos requisitos de reuso dos dados, existindo instituições que optaram ou não por renunciar à atribuição de autoria dos dados. Outro ponto-chave foi o de estabelecer se os recursos resultantes, devem ou não ser submetidos à mesma licença que os dados originais. A licença de escolha mais destoante é a Free Art License, uma licença voltada para obras de conteúdo artístico, entretanto não foi localizada uma explicação da instituição para a atribuição dessa licença aos dados. É relevante mencionar o caso da KB onde diferentes conjuntos de dados recebem licenças diferentes. Das 4 questões apontadas por Rautenberg et al. (2018), duas delas não se aplicam a DAC, já que a publicação de dados abertos implica na possibilidade de realização de alterações nos dados e a sua utilização para fins comerciais. Às questões restantes, sendo elas: (a) os direitos autorais anteriores devem ser mantidos? e (b) os resultados da utilização desses dados devem manter a licença? acrescentam-se também (c) qual a licença original dos dados? e (d) é necessário diferenciar a licença dos dados da licença do conteúdo do banco de dados? Outro ponto que pode ser acrescentado em relação à atribuição da licença é que em muitos casos, a licença dos dados não foi apresentada de forma visível, sendo necessário consulta aprofundada da documentação das instituições ou ainda das informações presentes na Nuvem de Dados Abertos Conectados para sua localização, o que é contrário à recomendação dos criadores das licenças, que enfatizam a necessidade de que a licença esteja visível e facilmente localizada. Após a discussão do estabelecimento da licença apropriada a próxima MP irá discutir a elaboração de URIs. 6.5 Estabeleça bons URIS Essa MP discorre a respeito do estabelecimento dos URIs. Para o W3C (2014) bons URIs devem: • Ser URIs HTTPs; 102 • Quando desreferenciados fornecerem ao menos uma versão legível por máquina; • Serem pautados em uma política interna e na formulação de um plano para sua implementação. A escolha de um determinado esquema de URI não oferece nenhuma garantia de que esses URIs serão persistentes. A persistência do URI é uma questão de política e compromisso por parte do proprietário do URI. (W3C, 2014, não paginado, tradução nossa). • Serem estáveis e para isso não conter informações que precisem ser alteradas; evitando informações descritivas em linguagem natural. Para serem persistentes, os URIS devem direcionar para o mesmo conjunto de dados, ainda que esses tenham sido alterados. Caso os dados não estejam mais disponíveis, devem remeter a uma informação que indique o destino desses dados. O W3C (2014a) aponta ainda que o HTML fornece soluções para garantir a persistência dos URIs, possibilitando o fornecimento de explicações sobre dados indisponíveis. Para realizar essa atividade, essas páginas podem retornar os erros pré-estabelecidos da linguagem HTML, por exemplo, o 303, que indica que a informação está disponível em outro lugar; 410 que indica que a informação foi definitivamente excluída; e o 503, que indica que a página está temporariamente indisponível. (W3C, 2017). Outro conceito relacionado à persistência de URIs é o de PURL, que permite realizar a curadoria dos URIs, caso o URL do URI seja alterado, o PURL realiza o direcionamento para a nova localização. Além das entidades, os conjuntos de dados devem receber URIs. Como muitos dados se enquadram em séries ou grupos naturais, por exemplo, os dados de autoridade contidos nos catálogos das bibliotecas, é importante que eles sejam agrupados e identificados com URIs. O W3C (2014a) recomenda ainda a leitura do documento “Architecture of the World Wide Web, Volume One”8, que discorre a respeito de questões técnicas relacionadas ao estabelecimento de URIs persistentes. Nenhuma das instituições analisadas fornece uma política completa sobre o estabelecimento dos URIs, entretanto muitas delas fornecem informações a respeito 8 Disponível em: https://www.w3.org/TR/webarch/#URI-persistence. Acesso em: 12 jan. 2021. 103 do processo de elaboração. O Quadro 12 apresenta as informações a respeito de URIs localizadas nos recursos bibliográficos, nos sites oficiais das iniciativas e ainda no modelo de dados das instituições que disponibilizaram esse documento. Quadro 12 : Informações a respeito do estabelecimento de URIs fornecidas pelas instituições. Instituição Informações sobre os URIs BNB - Optou por cunhar os próprios URIs mesmo quando identificadores de outras fontes para a entidade estavam disponíveis, avaliando que: • É mais confiável, já que as fontes podem deixar de existir; • As fontes não possuem todos as entidades descritas. - Disponibiliza um documento com a estrutura dos URIs por tipos de dados. (DELIOT, 2014). BNE - Os URIs da instituição são separados entre: - URIS de vocabulário, que representam os vocabulários adotados, as classes, as propriedades e os relacionamentos e são atribuídos pela entidade mantenedora dos vocabulários; e - URIs de dados, que representam os recursos que estão sendo publicados e que são estabelecidos pela instituição. - Os URIs do segundo tipo são cunhados seguindo os seguintes princípios: - São utilizados exclusivamente HTTPs URIs; - São utilizados “natural keys pattern”; - Foi incluído o termo “recurso” no namespace do segundo tipo, para que eles possam ser eventualmente diferenciados do primeiro tipo; - São utilizados URIs compactos, do tipo CURIES (www.w3.org/TR/curie/). (VILA-SUERO; GÓMEZ-PÉREZ, 2013). BNF - Utiliza o esquema de identificadores ARK, onde são estabelecidos os seguintes princípios: - Nenhum identificador pode ser reatribuído; - Os identificadores não devem conter informação semântica facilmente reconhecível; - A estrutura dos URIs garante que um usuário que cometeu um erro de digitação receberá uma resposta HTTP 400, contendo uma mensagem informando que o ARK fornecido está incorreto. (WENZ, 2013). 104 Instituição Informações sobre os URIs B3KAT - Os URIs são criados com base no número de identidade B3Kat, começando com BV seguido do namespace reservado especialmente para B3Kat com domínio registrado. (MEBMER, 2013). CLDI - Os URIs estão sendo inseridos nos registros MARC21. EUROPEANA - Deve-se tentar reutilizar URIs existentes e quando não for possível deve-se indicar links de co-referência; - Os URIs são criados a partir de declarações “owl: sameAs”, obtidas a partir do elemento “dc: Identifier” das instituições fornecedoras da EUROPEANA. (HASLHOFER; ISAAC, 2011). FENNICA - Aplica a estrutura: http://urn.fi/URN:NBN:fi:bib:me:Tnnnnnnnnnxx onde: T – Representa o tipo de entidade; Nnnnnnnnn - identificador numérico do registro MARC21 de onde a entidade se originou; e xx- sequência numérica de dois dígitos garantindo a exclusividade das entidades originadas do mesmo registro; - Os padrões de URIs estão em status de rascunho e ainda podem mudar; - Algumas entidades são representadas como nós em branco no gráfico RDF, mas podem receber URIs posteriormente. (NATIONAL LIBRARY OF FINLAND, 2020). KB - Destaca que os URIs não direcionam para objetos em si, mas sim para as suas representações. (NATIONAL LIBRARY OF THE NETHERLANDS, 2020). NLAI Utiliza a estrutura de http://linkeddata.nlai.ir/rasa/”identifier”, onde Identifier é um campo numérico que representa as entidades. (ESLAMI; VAGHEFZADEH, 2013). NSZL - Indica como base para as tomadas de decisão “Cool URIs for the Semantic Web - https://www.w3.org/TR/cooluris/”; - Cria os próprios namespaces; - São utilizados HTTPs URIs; - Os URIs são únicos e persistentes. (NSZL, 2019). RUNA - Os URIs são importados a partir dos identificadores do sistema da biblioteca, que por não permitir a exclusão de itens garante a persistência dos identificadores. (GOLDBERGA et al., 2018). SHEET MUSIC CONSORTIUM - Utiliza o serviço prestado pela California Digital Library (2013) chamado “EZID” para elaborar os URIs; - Utiliza a estrutura http://n2t.net/IDENTIFIER onde IDENTIFIER é um código alfanumérico sem significado semântico. (DAVISON et al., 2013). 105 Instituição Informações sobre os URIs VIAF - Utiliza a estrutura http://viaf.org/viaf/[numerical value] - Utiliza Cool URIs. (HICKEY, 2011). WORLDCAT - Aponta a necessidade de migrar do controle de autoridade para a gestão de identidade, abandonando o uso de strings de texto para representar as autoridades a favor da atribuição de URIs, geração de clusters e estabelecer relação entre eles; - Lidar com ambiguidade é uma atividade complexa do trabalho de autoridade e pré-requisito para atribuição de identificadores exclusivos; - Nem todas as autoridades utilizadas como pontos de acesso estão nos catálogos de autoridade, nesse caso apenas 30%, o que dificulta processos automáticos; - Aponta que uma das possibilidades para lidar com a ambiguidade é gerar um URI para cada forma de nome da entidade; - Aponta que é mais eficiente incluir URIs em registros de autoridade no início, do que os atribuir mais tarde; - Criar identificadores para obras é uma tarefa complexa, pois ainda existe discussão sobre que alterações no conteúdo levam ao estabelecimento de uma nova obra, o que dificulta a tarefa de criar Identificadores que possam ser usados em toda a comunidade. Os recursos podem ter várias cópias e versões que mudam com o tempo. Além disso, bibliotecas (bem como financiadores e esforços de avaliação nacional) desejam ser capazes de vincular recursos relacionados (como pré- impressões, dados suplementares e imagens) com a publicação. Vários DOIs apontando para o mesmo objeto representam um problema (SMITH-YOSHIMURA, 2020, p. 8, tradução nossa). - Os identificadores precisam ser imutáveis ao longo do tempo e independentes de onde os objetos digitais são armazenados; - Indica como fonte “Formulating and Obtaining URIs: A Guide to Commonly Used Vocabularies and Reference Sources”. (SMITH- YOSHIMURA, 2020). Fonte: Autora (2021). A análise do Quadro 13 permite observar que a estrutura dos URIs HTTPs é frequentemente apresentada pelas instituições. Essa estrutura geralmente é composta pelo URLs dos dados da instituição, o esquema de metadados quando adotado e um identificador (numérico ou alfanumérico), criado para cada entidade descrita. 106 Deliot (2014) aponta que identificar as entidades utilizando URIs é uma tarefa mais complexa do que parece e envolve uma série de decisões. Uma delas consiste em quais situações os URIs serão cunhados pela própria instituição. A BNB optou por elaborar os próprios URIs mesmo quando identificadores de outras fontes para as entidades estavam disponíveis, enquanto a EUROPEANA busca reutilizar URIs sempre que possível. Também é necessário estabelecer se os URIs serão elaborados a partir de algum campo de controle dos dados originais, um exemplo é a FENNICA que optou por gerar URIs com base nos campos de registro do MARC21, adicionando um código ao final para diferenciar entidades provenientes de um mesmo registro. Também é mencionado o processo de inclusão de URIs nos formatos de origem, como forma de auxiliar uma posterior conversão para RDF, porém não foi localizado um detalhamento sobre as formas como essa conversão ocorreria. Relacionado ainda com o estabelecimento de URIs a partir de dados legados, a OCLC (2020) discute os problemas de ambiguidade na representação de autoridade, sendo apontadas como soluções a atribuição de URIs para cada uma das formas de nome das autoridades e/ou agrupamentos dessas formas de nome em clusters, como ocorre no VIAF. Todas as decisões relacionadas a como resolver esses problemas precisam ainda ser documentadas resultando na política de Uris da instituição. Após a discussão sobre o processo decisório envolvido no estabelecimento dos URIs, a próxima MP discorre a respeito da seleção e do uso dos vocabulários. 6.6 Utilize vocabulários-padrões Essa MP aborda a reutilização, sempre que possível, dos vocabulários consolidados de cada domínio. O W3C (2014) fornece uma lista para auxiliar no processo de seleção ou criação dos vocabulários: • Ser preferencialmente publicado por um grupo ou organização confiável; • Possuir URIs permanentes; • Possuir uma política de controle de versão; • Possuir uma documentação clara e consistente; • Ser auto descritivo; 107 • Ser preferencialmente descritos em mais de um idioma; • Ser preferencialmente adotados por outros conjuntos de dados do mesmo domínio; • Fornecer garantias da persistência; • Possuir URLs persistentes. Como forma de localizar vocabulários, a MP sugere que sejam identificados os vocabulários utilizados por conjuntos de dados do mesmo domínio ou com características semelhantes aos dados que se pretende descrever. Nesse sentido, buscou-se levantar os principais vocabulários utilizados pelas instituições analisadas, essa busca foi feita a partir dos sites oficiais das iniciativas e do referencial teórico e documental. O resultado dessa análise é apresentado no Quadro 13. Quadro 13: Vocabulários adotados pelas instituições. VOCABULÁRIO Intituições N° de instituições SCHEMA.ORG BNF, BNE, DNB, KB, BNB, LIBRIS, VIAF e WorldCat 8 FOAF BNE, DNB, KB, NSZL, BNB e LIBRIS e VIAF 7 SKOS BNE, KB, NSZL, BNB, LC e LIBRIS e VIAF 7 BIBFRAME BNE, DNB, BNB, FENNICA, LC e LIBRIS 6 BIBO BNE, DNB, BNB, KB, NSZL e LIBRIS 6 DUBLIN CORE BNE, BNB, NSZL, LIBRIS e KB 5 RDA BNF, BNE, DNB, BNB e Biblioteca Virtual Miguel de Cervantes 5 ISBD BNE, DNB e BNB 3 MADS/RDF BNE, BNB e LIBRIS 3 RDFS BNB e VIAF 2 BIO BNB 1 BNF-ONTO BNF 1 GEO POSITIONING BNB 1 GND- ONTOLOGY DNB 1 METS LC 1 MODS LC 1 PREMIS LC 1 PROV LIBRIS 1 108 SCHEMA.ORG: LIBRARY EXTENSION TERMS DNB 1 Fonte: Autora (2021) Observa-se no Quadro 13, que muitas instituições fazem uso de mais de um vocabulário para representar seus dados, o que amplia as possibilidades de representação e diminuí a necessidade de criação de novos vocabulários dentro de uma mesma área. A BNB, por exemplo, utiliza 12 dos vocabulários levantados, enquanto a DNB utiliza 8. A quantidade de vocabulários utilizados pela instituição vai depender do nível de granularidade desejado e do modelo de dados da instituição. Observa-se ainda que não é uma prática comum a criação de vocabulários pelas instituições, e quando criados esses são complementares a outros vocabulários adotados e estão disponíveis para reuso, como é o caso da BNF. Após a discussão sobre a seleção dos vocabulários pertinentes e a apresentação da lista de vocabulários apontados pelas instituições analisadas, a próxima MP discute o processo de conversão dos dados originais para RDF. 6.7 Converta os dados em dados conectados Em relação à conversão dos dados, o W3C (2014) aponta que existe mais de uma forma de realizar esse processo, incluindo “[...] scripts, linguagens de mapeamento declarativas, linguagens que executam tradução de consulta em vez de tradução de dados”. (W3C, 2014, não paginado, tradução nossa). O processo de conversão inclui: • Mapeamento do formato de origem; • Estabelecimento do formato de serialização; • Fornecimento de metadados básicos; e • Elaboração de links com outras fontes. As iniciativas foram analisadas visando identificar etapas do procedimento de conversão, conforme apresentadas no Quadro 14. 109 Quadro 14: Análise do processo de conversão realizado pelas iniciativas. Iniciativa Procedimentos para conversão BNB - Parte de uma etapa de uniformização dos dados para garantir melhores resultados, considerando que os dados da BNB passaram por mudanças de política de catalogação e diferentes instrumentos de padronização, gerando problemas de consistência; - Os URIs cunhados são gerados nos registros MARC21 e vinculados a conjuntos de dados externos; - O arquivo MARC21 aprimorado é convertido para RDF/XML usando XSLT; - A qualidade dos dados em RDF é checada utilizando uma ferramenta - Jena Eyeball; - Os resultados são convertidos em N-Triples; - São criadas ligações automáticas entre os títulos da BNB e títulos equivalentes. (DELIOT, 2014). BNE Divide a conversão dos dados em três etapas: 1. Seleção e adaptação de tecnologias de conversão, na qual observou-se que as ferramentas disponíveis não atendiam a necessidade da biblioteca e foi elaborada uma nova ferramenta; 2. Mapeamento de vocabulários, onde foram identificadas as correspondências entre os vocabulários selecionados e o formato de origem dos dados; 3. Conversão para RDF – Utilizando o MARiMbA, ferramenta elaborada pela instituição - os dados são convertidos automaticamente gerando URIs para as entidades e descrições em RDF, utilizando os vocabulários selecionados. (VILA-SUERO; GÓMEZ- PÉREZ, 2013). BNF - Aponta a necessidade de limpeza dos dados, pois existem muitas duplicatas e irregularidades, por conta da longa história do catálogo, que passou por alterações de instrumentos de padronização. (LAPÔTRE, 2017). BIBLIOTECA VIRTUAL MIGUEL DE CERVANTES - Os dados contêm inconsistências derivadas dos processos decisórios e interpretativos dos catalogadores; - Foi elaborada uma lista das principais inconsistências e soluções; - Realizou-se um pré-processamento dos dados para normalizar campos-chave; - Os dados foram convertidos para FRBR e RDA. (CANDELA et al., 2015). 110 B3KAT - A conversão teve como base o MARCXML; - Foram atribuídos identificadores para as entidades; - Foram identificadas fontes externas para ligação. (MEBMER, 2013). EUROPEANA - Informações sobre o processo de conversão foram disponibilizadas no GitHub, contendo os scripts de conversão e as configurações; - Os dados foram convertidos com base no modelo de dados EDM; - Foram atribuídos URIs aos objetos resultantes; - Elaboração de uma folha de estilo XSLT 1.0, que resultou em representações RDF/XML dos metadados; - A conversão foi feita combinando valores de campos de metadados selecionados. (HASLHOFER; ISAAC, 2011). LC - Apresenta as especificações para a conversão do MARC21 para o BIBFRAME; - Apresenta ferramentas para conversão de MARC21 para BIBFRAME e BIBFRAME para MARC21. (THE LIBRARY OF CONGRESS [2021]). NLM - Foram incluídos URIs para autoridades, assunto e títulos, nos próprios registros MARC21; - Foram desenvolvidos dois programas: um para cunhar e adicionar os URIs ao MARC21 e um segundo programa para relacionar os URIs e os registros bibliográficos. (BOEHR; BUSHMAN, 2017). SHEET MUSIC CONSORTIUM - Realizou um refinamento dos dados. (DAVISON et al., 2013). Fonte: Autora (2021). Um ponto em comum observado entre as iniciativas foi a preocupação com a consistência e a qualidade do conjunto de dados originais. Uma vez identificadas as inconsistências, a ferramenta MARC Global, apontada por Deliot (2014), pode ser usada para identificar e substituir automaticamente informações inconsistentes em campos MARC21. Davison et al. (2013) apontam as ferramentas Google Refine and Voyeur para identificar e corrigir essas inconsistências. O Google Refine, renomeado em 2020 para Open Refine “é uma ferramenta poderosa para trabalhar com dados confusos: limpá-los, transformando-os de um formato para outro”. (OPEN REFINE, 2020). Candela et al. (2015) apontam que uma das etapas realizadas antes da conversão dos dados foi a mudança na estrutura de descrição dos dados para FRBR; 111 para realizar essa conversão foram utilizadas as ferramentas LibFRBR, que permite a conversão de dados bibliográficos para FRBR. Outro ponto comum entre as iniciativas é o mapeamento dos dados originais. Como apontado na seção 2, o MARC21 é o padrão de metadados mais adotado pelo domínio bibliográfico, sendo o dado de origem de boa parte das bibliotecas analisadas. Ao discutir o processo de mapeamento nos dados da BNE, Vila-Suero e Gómez-Pérez (2013) apresentam a estrutura de um registro MARC21, conforme a Figura 8. Figura 8: Estrutura de um registro MARC21. Fonte: Vila-Suero e Gómez-Pérez (2013, p. 583, tradução nossa). Para o processo de mapeamento e conversão dos dados de MARC21 para RDF, a BNE desenvolveu a ferramenta MARiMbA, que embasa as etapas de mapeamento, estabelecimento/validação dos URIs e conversão para o formato RDF. Foram identificados também scripts de conversão de dados bibliográficos para RDF, sendo eles: • MARC2RDRF - elaborado pela LibreCat; • MARC2BFRAME - elaborado pela LC; • bib2l - elaborado pela LD4L. 112 A EUROPEANA não tem como base de origem o formato MARC21, os dados são estruturados em formato próprio, baseados em Dublin Core, que podem ser exportados como XML. Para realizar a conversão, baseada no modelo de dados da instituição, foi utilizado script ESE2EDM Converter, também disponível com licença aberta. A ferramenta CubicWeb.5 foi utilizada pela BNF (LAPÔTRE, 2017), ela permite a integração de dados de origem em diferentes formatos, como MARC21, Dublin Core, EAD-XML e RDF, a combinação desses dados e a apresentação dos resultados em um banco de dados comum, em formato HTML, JSON ou RDF-XML. Outra etapa pertinente do processo é a checagem da qualidade dos resultados da conversão, visando identificar e corrigir possíveis inconsistências. A iniciativa LD4L disponibiliza o marc2rdf-validator, sob licença aberta, que pode ser utilizado para checar a validade dos resultados da conversão. Outra ferramenta que permite realizar a checagem da qualidade dos dados em RDF é o JENA EYEBALL, que possibilita a identificação de inconsistências como URIs mal formados, ausência de recursos e uso indevido de literais. A MP aponta ainda a criação de ligações com fontes externas como parte da etapa de conversão e, de acordo com Grant et al. (2013), as ferramentas SILK e LIMES ajudam a criar links entre diferentes conjuntos de dados RDF. Interessante destacar o fato e a preocupação do universo bibliográfico em adequar os dados bibliográficos ao DAC. Mesmo sendo desenvolvidas ferramentas tecnológicas para a conversão de dados bibliográficos, em especial, do padrão de metadados MARC21 pelas instituições, grupos e/ou consórcios de cooperação, não existem até o presente momento, iniciativas dos organismos oficiais que regem os padrões e princípios internacionais da Catalogação Descritiva, advindas da comunidade bibliotecária, na criação de um sucessor MARC21 para um possível MARCRDF. Castro (2012), apresenta um modelo para a modelagem de ambientes informacionais digitais interoperáveis, com base numa arquitetura para a representação e a descrição semântica de dados bibliográficos para a estrutura RDF. Após discutir a conversão, a checagem de consistência dos resultados e a ligação com fontes externas, a próxima MP apresenta recomendações sobre como fornecer acesso aos usuários em potencial. 113 6. 8 Promova acesso aos dados conectados Essa MP discorre sobre como promover acesso aos dados, focando no acesso por meio de máquinas. O W3C (2014) apresenta como exemplos de forma de acesso: • Acesso direto por meio dos URIs; • Download dos arquivos RDF; • Disponibilização de SPARQL endpoint; e • Uso de APIs; A recomendação geral a respeito da disponibilização de dados abertos é de que esses dados devem, sempre que possível, estarem atualizados, devem ser fornecidas informações sobre a periodicidade das atualizações e um controle de versões (W3C, 2017). Em relação ao download de arquivos, o W3C (2017) acrescenta que deve ser possível realizar o download em massa, ou seja, permitir que todo o conjunto de dados DAC seja baixado com uma única solicitação. Acrescenta ainda que devem ser disponibilizados subconjuntos para conjuntos de dados grandes, como todas as obras de um autor ou o arquivo de autoridade completo. Para compreender como de fato as instituições analisadas estão disponibilizando os seus dados foi realizada uma busca por esses dados nos sites oficiais das iniciativas e apresentada no Quadro 15. Quadro 15: Formas de acesso aos dados das iniciativas. INSTITUIÇÃO Formas de acesso aos dados Link da página de acesso aos dados BNB - Fornece duas interfaces SPARQL, um editor SPARQL e um terminal de serviço para consultas remotas; - Com o editor SPARQL é possível criar uma busca seguindo as instruções fornecidas ou utilizar um dos exemplos de busca disponíveis; - O terminal de consultas possui uma interface semelhante à de um buscador Web, incluindo sugestões de preenchimento automático; - É possível fazer download em massa ou optar por subconjuntos de dados, que são https://bnb.data.bl.uk / 114 divididos entre os conjuntos históricos, de literatura, musicais e outros. BNE - Download de subconjuntos é dividido em dados de autoridade, dados bibliográficos e cabeçalho de assunto. http://www.bne.es/es /Inicio/Perfiles/Bibliot ecarios/DatosEnlaza dos/DescargaFicher os/ BNF - Guia na página da iniciativa direcionando para informações sobre como baixar os dados; - Divide os dados em grupos como tipos de autoria (como pessoa ou entidade coletiva) e tipos de recursos (como recursos musicais e publicações seriadas); - Via SPARQl (indisponível); - Via negociação de conteúdo; - É possível realizar o download em massa do conjunto de dados. (BNF, 2020). https://api.bnf.fr/dum ps-de-databnffr BIBLIOTECA VIRTUAL MIGUEL DE CERVANTES - É possível realizar o download em massa de todos os registros; - Disponibiliza um editor SPARQL. http://data.cervantes virtual.com/sparql B3KAT - Fornece um controle de versões; - Download de todo o conjunto de dados, dividido em 31 partes. - Editor SPARQL, com orientações de uso, exemplos de busca e a frequência de uso. https://lod.b3kat.de/d oc/de/willkommen- beim- linkedopendata- service-des-b3kat- lodb3katde DNB - Os dados são disponibilizados em uma página que agrupa as formas de acesso; - Os dados são divididos em subconjuntos, a descrição dos subconjuntos está no nome dos arquivos, como “Authority- geografikum_lds.jsonld.gz” para dados de autoridade para nomes geográficos em formato jonson; - Apresenta a data de atualização dos dados; - A organização dos dados não é muito acessível para usuários humanos; - Não disponibiliza os dados como SPARQL. (DNB, 2019). https://url.gratis/5WS 3t EUROPEANA - Disponibiliza um editor SPARQL e orientações sobre o propósito de uso, o que o diferencia do API de pesquisa da instituição, que também permite pesquisas menos estruturadas; https://pro.european a.eu/page/linked- open-data 115 - O download em massa pode ser feito a partir da nuvem DAC. https://lod- cloud.net/dataset/hu ngarian-national- library-catalog FENNICA - Apresenta um editor SPARQL e exemplos de busca. https://data.nationalli brary.fi/bib/sparql KB - Os dados são divididos por subconjuntos, um para cada um dos conjuntos de dados apresentados na sessão 6.2; - Fornece um texto de ajuda com dicas sobre como reutilizar os dados (em holandês); - Fornece uma lista de APIs; - Fornece acesso a um buscador SPARQL. https://data.bibliothe ken.nl/ LC - É possível realizar busca pelos dados usando um buscador; - Os dados podem ser baixados em subconjuntos, existindo conjuntos para cada autoridade e vocabulários; - Não disponibiliza SPARQL. https://id.loc.gov/do wnload/ LIBRIS - Não foram localizados os dados na página, apenas na nuvem de DAC onde é possível acessar: - Um editor SPARQL; - Exemplos de busca; - Download em massa dos dados. https://lod- cloud.net/dataset/libr is LINKED LOGAINM - Os dados podem ser buscados e baixados em RDF individualmente; - Os dados podem ser baixados em massa e um editor SPARQL pode ser localizado na nuvem DAC. https://www.logainm. ie/en/inf/proj- machines https://lod- cloud.net/dataset/lin ked-logainm NLM - Disponibiliza o conjunto de dados por ano da versão. https://id.nlm.nih.gov /mesh/ NSZL - Fornece um buscador e um editor SPARQL; - Fornece exemplos de busca que retornam subconjuntos de dados, como dados de autoridade e de assunto. http://linkeddatacatal og.dws.informatik.un i- mannheim.de/datas et/hungarian- national-library- catalog POLYMATH VIRTUAL LIBRARY - Não foi localizado na página da iniciativa e sim com uma busca mais ampla; - É possível realizar o download em massa de todos os registros; https://old.datahub.io /pt_BR/dataset/poly math-virtual-library 116 - É possível baixar subgrupos que estão divididos por nacionalidade dos autores (brasileiros, espanhóis e portugueses). RUNA - Oferece um buscador onde podem ser localizadas informações de interesse divididas de acordo como modelo conceitual, podendo refinar a busca entre objetos e entidades. Quando a busca é feita por objetos é possível seguir o refinamento para o tipo de objetos; - Também é possível acessar a aba de cada um dos dois autores da coleção, onde são apresentadas algumas informações de destaque; - Para baixar os dados é necessário acessar a página de cada autoridade, obra, entidade etc. https://runa.lnb.lv/en/ SHARE-VDE - Interface de busca que permite baixar os dados em diversos formatos, inclusive RDF, mas não foi localizada uma forma de download em massa. https://share- vde.org/sharevde/re source?uri=UMICH0 10698873&v=l&dcnr =3 SWISSBIB - Interface de busca que utiliza uma API DAC; - Não localizei o conjunto de dados para download em massa ou SPARQL. https://data.swissbib. ch/ WORLDCAT - Apenas o esquema de busca, não foi possível localizar os dados para download. https://www.worldcat .org/ VIAF - Interface de consulta e dados disponibilizados em RDF; - Opções de download em massa disponibilizados na nuvem DAC; - Dados disponibilizados no datahub. https://lod- cloud.net/dataset/via f http://viaf.org http://datahub.io/dat aset/viaf Fonte: Autora (2021). Das 34 iniciativas selecionadas foram localizados para download os dados das 20 iniciativas incluídas no Quadro 15. Dentre as iniciativas nas quais os dados foram localizados, 8 disponibilizam subconjuntos de dados, a estrutura e o nível de refinamento desses subconjuntos variam de instituição para instituição. A BNB realiza uma divisão detalhada desses conjuntos, existindo subgrupos para livro, publicações seriadas, dados provenientes das editoras, uma série de conjuntos de dados históricos (como a coleção relacionada à carta magna, a Leonardo Da Vinci e as comunicações entre Karl e Eleanor Marx), 117 coleções de dados de autores de destaque na literatura mundial e ainda alguns temas de interesse (como teologia e recursos relacionados a música). A BNF também disponibiliza uma lista extensa de subconjuntos, sendo disponibilizados os dados de autoridade (para pessoa, para entidades coletivas e para nomes geográficos), tipos de publicação (publicação seriada, obras musicais) e publicações relacionadas a eventos históricos. A DNB disponibiliza uma série de subconjuntos, entretanto a interface na qual esses dados são disponibilizados não é amigável a usuários humanos, a distinção entre os conjuntos está no próprio nome do arquivo, como no exemplo: “authority- geografikum_lds.jsonld.gz” onde é possível identificar que se trata de dados de autoridade do tipo nomes geográficos e que esses estão disponíveis em jonson. A KB disponibiliza dados para cada uma das suas coleções publicadas em DAC, sendo elas: Dicionário de sinônimos holandês de nomes de autores; Tesauro holandês de nomes de autores; dicionário de sinônimos; tópicos Brinkman, tesauro de assuntos; índice de assuntos comuns; e dicionário de palavras-chave. A LC permite que após realizada a busca por determinada autoridade ou obra, seja realizado download do conjunto de dados. Também é possível localizar o conjunto de dados de autoridade e o cabeçalho de assunto. As instituições Polymath Virtual Library, BNE e NLM realizam uma divisão mais sucinta. A Polymath Virtual Library divide os conjuntos por autoria e ainda por nacionalidade dos autores, BNE disponibiliza dados bibliográficos, dados de autoridade e cabeçalhos de assunto e a NLM disponibiliza os conjuntos por data da versão. É possível identificar ainda uma tendência entre as iniciativas de fornecer instruções sobre como os dados podem ser baixados e reutilizados. Dentre as instituições que adotam o SPARQL como forma de acesso (9 instituições), observa- se que são apresentados exemplos de estratégias de busca. A iniciativa FENNICA, por exemplo, apresenta como modelos de busca: • Autores com mais de X obras; • E-books sobre o assunto X; • Pessoa presente em mais de X obras; • Trabalhos de autores nascidos depois de XXXX; • Trabalhos do autor X; 118 Após a disponibilização dos dados, a próxima MP discute a importância da divulgação desses dados para que eles sejam identificados pelos usuários. 6.9 Anuncie os dados disponibilizados ao público A MP está relacionada com informar aos interessados que os dados estão disponíveis. Como forma de auxiliar nesse processo, o W3C (2014) apresenta uma lista de verificação, visando garantir que os dados cheguem até aos interessados: • Diversificar os canais de comunicação, incluindo listas de mala direta, blogs e boletins informativos para anunciar os dados; • Descrever cada conjunto de dados publicado usado um vocabulário específico; • Definir a frequência de atualizações de dados; • Associar os dados a uma licença apropriada; • Planejar e implementar uma estratégia de persistência; • Garantir que os dados sejam precisos; • Fornecer um formulário para que as pessoas relatem dados problemáticos e forneçam feedback; • Fornecer um endereço de e-mail de contato; e • Garantir que a equipe tenha o treinamento necessário para responder ao feedback. As instituições foram analisadas visando verificar os meios de divulgação utilizados, se existia um formulário para que possíveis problemas ou sugestões a respeito dos dados fossem compartilhados e ainda, se um e-mail específico para informações sobre os DAC da instituição foi disponibilizado. Para isso foram analisadas as páginas oficiais das iniciativas, conforme podem ser visualizadas no Quadro 16. Quadro 16 : Sistematização das formas de divulgação adotadas pelas instituições. Iniciativa Canais de divulgação BNB - Disponibiliza um formulário para contato e um e-mail; - Os dados foram divulgados em conferências e artigos; -Dados disponibilizados na nuvem de DAC. - Os dados foram divulgados em artigos e apresentados como trabalhos em conferências; 119 BNE - Em seu ciclo de publicação inclui uma etapa voltada para a divulgação dos dados, composta por 3 tarefas, sendo elas: (1) publicar o conjunto de dados na Web; (2) publicar metadados que descrevem o conjunto de dados; e (3) permitir a descoberta eficaz do conjunto de dados. - As duas primeiras etapas estão relacionadas (e foram discutidas) na seção 6.8. - Em relação a garantir a descoberta eficaz do conjunto, a estratégia da BNE foi compartilhar os dados no DATAHUB, uma plataforma de gerenciamento de dados; - Dados disponibilizados na nuvem de DAC. BNF (FRANCE) - Foram publicados artigos e apresentados trabalhos em conferências a respeito da disponibilização dos dados; - Dados disponibilizados na nuvem de DAC; - Disponibiliza o e-mail e pede para que os usuários comuniquem possíveis erros. BIBLIOTECA VIRTUAL MIGUEL DE CERVANTES - Disponibiliza os dados em um DATAHUB; - Dados divulgados em artigo; - Dados disponibilizados na nuvem de DAC; - Disponibiliza um formulário para contato. B3KAT - Os dados foram divulgados em artigo; - Dados disponibilizados na nuvem de DAC; - Disponibiliza os dados em um DATAHUB. CLDI - Projeto divulgado em artigo; - Mantém um blog e realiza um evento para falar sobre o projeto. DNB - Oferece um e-mail para contato; - Dados disponibilizados na nuvem de DAC; - Foi criada uma lista onde os interessados podem se inscrever para receber informações. EUROPEANA - Disponibiliza os dados no GITHUB; - Os dados foram divulgados em artigos e apresentações; - Dados disponibilizados na nuvem de DAC. FENNICA - Criação de rede social para fomentar discussões sobre os dados; -Disponibiliza um e-mail para contato. - Os dados foram divulgados em conferências e artigos; 120 LC - Dados disponibilizados na nuvem de DAC; - Disponibiliza a inscrição em uma lista de discussão e divulgação de atualizações; - Fornece um formulário para contato. NLAI - Divulgação do projeto em andamento por meio de artigo. NSZL - Dados disponibilizados na nuvem de DAC; - Existe um canal de comunicação do projeto nas redes sociais. NLM - Os dados foram divulgados em artigo; - Dados disponibilizados na nuvem de DAC; - Dados disponibilizados no GITHUB; - Disponibiliza um canal para comunicação que direciona para perguntas frequentes, onde também é possível escrever para a biblioteca. POLYMATH VIRTUAL LIBRARY - Os dados foram divulgados em conferências e artigos; - Dados disponibilizados na nuvem de DAC; - Dados divulgados em iniciativas maiores, fazendo parte de um estudo do W3C e da EUROPEANA. RUNA - Dados disponibilizados na nuvem de DAC; - Divulgação dos dados em artigo; - Disponibiliza um e-mail para comunicação. SHARE-VDE - Disponibiliza um e-mail para contato. SHEET MUSIC CONSORTIUM - O projeto foi divulgado em um artigo. SWISSBIB - O projeto foi divulgado em um artigo. VIAF - Dados divulgados em artigo e apresentações; - Dados disponibilizados na nuvem de DAC; - Dados amplamente divulgados por outras instituições que utilizam do conjunto, como a LC e a EUROPEANA. WORLDCAT - Os dados foram divulgados em artigo e apresentações; -Dados disponibilizados na nuvem de DAC. Fonte: Autora (2021). A análise do Quadro 19 permite observar que a divulgação dos dados pode começar ainda no início do projeto, para atrair interessados e sugestões, como nos casos do NLAI, SHEET MUSIC CONSORTIUM e UNVL. Uma das formas de 121 divulgação mais adotadas pelas instituições foi a partir dos canais científicos de divulgação, como artigos, palestras, conferências e apresentações em eventos. Outra tendência observada no Quadro 11 é a de disponibilização dos dados em plataformas de iniciativas voltadas para agrupar e permitir busca por conjunto de dados, como por exemplo a nuvem de DAC, plataforma que reúne e conecta dados publicados como DAC, permitindo diversas possibilidades de busca. Muitas das informações que não puderam ser localizadas nas páginas oficiais das iniciativas, nos artigos e nas documentações, estavam disponíveis e agrupadas na plataforma. Em alguns casos, até mesmo os dados da iniciativa só foram localizados por meio da nuvem. Foram utilizados como canal de divulgação as listas de e-mails, como no caso da LC. Ao se inscrever em uma dessas listas, os usuários podem participar de discussões sobre o projeto e receber por e-mail as atualizações realizadas. Observou-se ainda que o canal de comunicação mais utilizado pelas bibliotecas para obter feedbacks foi o e-mail, entretanto a apresentação de um formulário de resposta, que permita comentários mais informais pode ser mais convidativa para os usuários. Após discutir os meios de divulgação dos dados, a próxima MP discorre a respeito de fornecer garantias aos usuários sobre os dados disponibilizados. 6.10 Estabeleça um contrato de responsabilidade como publicador Essa MP está relacionada com garantir a persistência e a consistência dos dados, fomentando assim a confiança nos consumidores. O ponto-chave para atender a essa MP e garantir que os dados permaneçam no local onde foram publicados de maneira duradoura, pois Se os editores moverem ou removerem dados que foram publicados na Web, aplicativos de terceiros ou mashups podem falhar. Isso é considerado rude por motivos óbvios e é a base para o "contrato social" dos Dados Conectados. (W3C, 2014, não paginado, tradução nossa). O próprio documento do W3C não se aprofunda muito nas recomendações a respeito de como garantir a estabilidade dos dados a longo prazo na Web, afirmando que: 122 Está além do escopo deste documento tratar de forma abrangente questões relacionadas à estabilidade de dados ao longo do tempo na Web. A menção é incluída para que os leitores possam considerar a estabilidade dos dados no contexto de uma determinada agência e região. (W3C, 2014a, não paginado, tradução nossa). O W3C (2014a) aponta ainda que essa não é uma preocupação exclusiva dos DAC, a persistência de dados na Web é uma questão emergente e que tem se tornado cada vez mais relevante. Nesse sentido, as iniciativas foram analisadas buscando por documentações e/ou informações voltadas para garantir a persistência a longo prazo dos DAC, entretanto não foi localizado nenhum documento semelhante a uma política de consistência ou contrato de responsabilidade nas instituições analisadas. É possível que essas instituições estejam preocupadas com as questões de persistência a longo prazo dos dados, mas que não tenham publicado documentos ou informações explicitando essa preocupação. Em sentido oposto ao recomendado pela MP, a DNB publica seus dados com a seguinte nota: Os metadados e as interfaces online são fornecidos sem garantia de que serão contínuos, pontuais, livres de erros ou completos, ou que não violem direitos de terceiros, por exemplo, direitos pessoais e direitos autorais. (DNB, 2019, não paginado, tradução nossa). No mesmo sentido, a LC ao se manifestar sobre o conjunto de dados publicados optou pela isenção de responsabilidade sobre a persistência e a consistência dos dados, como pode ser observado no trecho a seguir: “A Biblioteca do Congresso está fornecendo esses dados e estes serviços no estado em que se encontram e isenta-se de todas e quaisquer garantias, sejam explicitas ou implícitas”. (LC, 2020, não paginado, tradução nossa). Analisados e discutidos os resultados da relação entre as iniciativas selecionadas e as 10 MPs propostas pelo W3C, a próxima seção apresenta uma sistematização desses resultados na forma de recomendações, que podem contribuir para a publicação de dados bibliográficos como DAC. 123 7 PROPOSTA DE RECOMENDAÇÕES PARA A PUBLICAÇÃO DE DADOS BIBLIOGRÁFICOS COMO DAC Com base nas discussões e nas análises realizadas nas seções anteriores, foram elaboradas recomendações teórico-metodológicas para a publicação de dados bibliográficos em consonância com as 10 MPs para a publicação de DAC do W3C (2014) e uma sistematização para permitir a visualização do panorama geral da proposta. Para atender a MP1 e preparar as partes interessadas é pertinente que sejam reunidas e sistematizadas as vantagens que a publicação dos dados bibliográficos como DAC trará a instituição, reforçando os benefícios econômicos, de tempo, de recursos materiais e de mão de obra a longo prazo. Também é pertinente ressaltar as vantagens de cunho social da publicação desses dados, como eles podem impactar diretamente os usuários e a comunidade da biblioteca, principalmente no contexto da pandemia de COVID-19, que tem limitado o acesso presencial aos serviços oferecidos pelas bibliotecas. Além das vantagens apontadas pelas instituições analisadas (sistematizadas no quadro 8), o relatório intitulado Library Linked Data Incubator Group: final report (W3C INCUBATOR GROUP, 2011) apresenta uma série de vantagens da publicação de dados bibliográficos como DAC. Castro e Jesus (2018) disponibilizam ainda uma sistematização das vantagens identificadas na literatura científica da área da Ciência da Informação. Essas vantagens podem ser reunidas visando embasar a necessidade de elaboração de um novo projeto. Para preparar os interessados recomenda-se que sejam estabelecidos os objetivos do projeto. Uma forma de estabelecer esses objetivos é buscar alinhar as vantagens identificadas com a missão e o planejamento estratégico da instituição, e ainda com o objetivo maior da instituição mantenedora da biblioteca, como o governo no caso de bibliotecas públicas, ou a universidade no caso de bibliotecas universitárias. O projeto de publicação de dados bibliográficos como DAC pode ser formulado com o objetivo de: 124 • Solucionar um problema específico que a instituição esteja enfrentando e que pode ser resolvido usando DAC; • Contribuir com dados para iniciativas de publicação de DAC já consolidadas; • Aumentar a visibilidade de coleções especiais ou raras, que tipicamente seriam utilizadas por uma comunidade mais restrita, mas que com a adoção de DAC podem ter um uso mais amplo, fornecendo um maior embasamento para os recursos empregados na sua criação/manutenção. Para que a visualização dos objetivos se torne mais clara para os envolvidos, eles podem ser divididos em metas com prazos bem estabelecidos, sendo possível separar as metas naquelas alcançáveis a curto e longo prazos. Para auxiliar na divisão do projeto em tarefas, um ciclo de vida de DAC pode ser adotado ou adaptado para atender às necessidades dos projetos. Esses ciclos são compostos por etapas e pelas atividades que as constituem, fornecendo assim uma visão ampla do que se espera enfrentar em um projeto de publicação. Nesse sentido foi possível identificar 3 modelos de ciclo de vida propostos para o universo bibliográfico, sendo eles: • O modelo para a publicação de dados de autoridade como DAC, de Assumpção (2018); • O modelo adotado pela BNE na publicação de seus dados, de autoria de Vila-Suero e Gómez-Pérez (2013); e • O modelo proposto por Senso e Machado (2018), construído a partir de uma observação dos projetos da BNE, BL, BF, LC e Europeana. Todos esses modelos apresentam um detalhamento sobre como atingir as etapas que compõem o ciclo de vida, levando em consideração as necessidades de dados advindos do universo bibliográfico, como o histórico de uso de instrumentos de padronização e a estrutura dos dados de origem. Para atingir a MP2 e selecionar o conjunto de dados que será convertido recomenda-se que sejam priorizadas as coleções que contenham dados exclusivos, como coleções especiais, coleções de manuscritos, obras raras, bibliografias nacionais, coleções relacionadas a fundos de autores, nomes de autoridade locais e teses e dissertações. Embora essas coleções sejam únicas, e consequentemente 125 seus dados descritivos também sejam exclusivos em certo nível, é importante considerar que não existe a necessidade de converter todo o conjunto, dados de localização geográfica e temporal, por exemplo, podem ser obtidos de fontes externas. Nesse sentido é pertinente selecionar dentro das próprias coleções quais dados do conjunto precisam ser convertidos, abandonando a ideia de registro, onde os dados precisavam ser compartilhados como um todo. Um critério que também pode auxiliar na seleção dos dados é a sua possibilidade de reutilização, priorizando aqueles que sejam de interesse para a comunidade interna e externa, assim o potencial de reuso e de visibilidade dos dados publicados será ampliado. Recomenda-se ainda que, inicialmente seja selecionado um conjunto reduzido de dados, que irão compor um projeto piloto. O conjunto selecionado deve possuir um alto potencial de ligação dentro e fora do catálogo. O projeto piloto permite testar o ciclo de vida e a viabilidade do projeto, pode ainda auxiliar na familiarização da equipe com os conceitos de DAC e no teste das vantagens mencionadas. Outra vantagem da realização de um piloto é a identificação de possíveis empecilhos, permitindo que sejam apontadas soluções para esses desafios, melhorando assim a chance de aceitação e de efetividade do projeto. Os pilotos devem seguir todo o ciclo de vida DAC, sendo inclusive publicados de maneira aberta para que possam ser testados pela comunidade, permitindo que todas as funcionalidades sejam avaliadas. Após serem selecionados os dados é necessário realizar uma análise cuidadosa deles, visando identificar o nível de consistência dos dados originais, já que os dados bibliográficos passaram por diferentes instrumentos de padronização e a sua elaboração está sujeita a interpretação dos catalogadores, o que pode gerar inconsistências. Também é necessário identificar em quais formatos esses dados estão, quais os instrumentos de padronização utilizados durante a sua criação e sob qual licença esses dados foram publicados. Os resultados dessa análise devem ser documentados. Essa análise, que teve início na MP2, agora deve buscar identificar as principais entidades, as propriedades e as potenciais relações desses dados, tanto dentro da própria coleção como com outras fontes, como contexto histórico, geográfico, temporal, bancos de imagem, vídeo etc. 126 Para auxiliar nesse processo recomenda-se o uso dos instrumentos do universo bibliográfico, como base para a padronização da modelagem dos dados da instituição, que podem ser visualizados no Quadro 17. Quadro 17: Instrumentos que serviram como base para a modelagem de dados das instituições Modelo utilizado como base no processo de modelagem Descrição BIBFRAME O Bibliographic Framework é uma iniciativa da LC para permitir a publicação de dados bibliográficos como DAC. Ele é composto por um vocabulário em RDF e por um modelo de dados. (BIBLIOGRAPHIC FRAMEWORK INITIATIVE, 2016). Família FR - O termo Família FR é utilizado para fazer menção aos modelos conceituais do universo bibliográfico elaborados pela IFLA, sendo eles: - Functional Requirements for Bibliographic Records (FRBR) – dados bibliográficos; - Functional Requirements for Authority Data (FRAD)- para dados de autoridade; - Functional Requirements for Subject Authority Data (FRSAD) para dados de assunto; - Os modelos foram criados com o objetivo de possibilitar uma visão generalizada das entidades do universo bibliográfico e dos relacionamentos existentes entre elas. (IFLA, 2018a). RDA O RDA consiste em um conjunto de elementos de dados, diretrizes e instruções para a criação de metadados no universo bibliográfico, compatíveis a publicação de DAC. (RDA, 2017). Europeana Data Model Modelo de dados elaborado para permitir a publicação dos dados da EUROPEANA como DAC e disponibilizado para reuso em outras instituições do universo bibliográfico. (EUROPEANA, 2017) IFLA LRM Modelo conceitual IFLA Library Reference Model (LRM) desenvolvido pela IFLA com o objetivo de consolidar os modelos FRBR, FRAD e FRASAD. O IFLA LRM foi elaborado para ser aplicado no contexto de DAC. (IFLA, 2018b). Fonte: Autora (2021). O modelo de dados do BIBFRAME foi desenvolvido pela LC, entidade com grande influência na criação de dados bibliográficos desde os tempos do serviço de distribuição de fichas catalográficas, em 1901 e consolidado com o uso massivo do formato MARC21, elaborado pela instituição. Esse modelo foi desenvolvido para ser 127 adequado ao cenário de DAC e conta ainda com um vocabulário que permite a descrição das propriedades do universo bibliográfico. Em relação aos modelos da Família FR, embora esse conjunto não tenha sido elaborado com o objetivo de permitir a publicação de dados como DAC, a descrição das entidades e dos relacionamentos do universo bibliográfico fornece uma base para a modelagem de dados. Já o modelo IFLA LRM, traz essa descrição para o contexto dos DAC, entende-se que é uma tendência que as novas iniciativas tomem como base o IFLA LRM em detrimento à família FR. Esses instrumentos indicados podem contribuir para a modelagem dos dados ao fornecer um panorama geral das principais entidades e dos relacionamentos encontrados nos dados advindos do universo bibliográfico, ainda assim faz-se necessário verificar se a adoção desses modelos na íntegra é possível, ou se são necessários ajustes/criação de um modelo próprio. O modelo de dados contém informações importantes para os usuários em potencial, nesse sentido recomenda-se disponibilizar um documento com o modelo de dados da instituição. São exemplos de informação que podem compor esse documento: • Descrição do projeto, seus objetivos e dados contemplados; • Fontes e formatos originais dos dados; • Apresentação dos vocabulários, modelos e ontologias aplicados; • Descrição da estrutura desses instrumentos, contemplando a apresentação das classes e das propriedades utilizadas; • Mapeamento do formato original dos dados, como MARC21 para RDF; • Diagrama do modelo de dados; e • Estrutura dos URIs. Para atender a MP4 e especificar uma licença que seja apropriada ao conjunto de dados publicados, recomenda-se que sejam avaliadas as seguintes questões: • Qual a licença original dos dados? • É necessário diferenciar a licença dos dados da licença do conteúdo do banco de dados? • Os direitos autorais anteriores devem ser mantidos? • Os resultados da utilização desses dados devem manter a licença original? 128 Recomenda-se ainda que seja verificado, se existe a necessidade de atribuir licenças diferentes a diferentes conjuntos de dados. Para auxiliar no processo de seleção das licenças, o Quadro 18 apresenta as licenças adotadas pelas instituições, bem como uma breve descrição. Quadro 18: Mapeamento das licenças utilizadas pelas instituições. Licença Descrição Creative Commons Zero terms – 0 (CC0) - Permite que detentores de dados protegidos por direitos autorais renunciem a esse direito e não deve ser utilizada para marcar dados de origem aberta. (CREATIVE COMMONS, [2020]). - A licença permite disponibilizar os dados [...] no domínio público, para que outros possam desenvolver, aprimorar e reutilize as obras para quaisquer fins, sem restrições de direitos autorais ou de banco de dados. (CREATIVE COMMONS, [2020a], não paginado, tradução nossa). Creative Commons Zero terms 1.0 (CC0 1.0) - Licença para dados publicados originalmente em formato aberto que permite aos usuários dos dados “opinar, modificar, distribuir e executar o trabalho, mesmo para fins comerciais, tudo sem pedir autorização”. (CREATIVE COMMONS, [2020b], não paginado, tradução nossa). - A licença ainda exime os criadores originais da responsabilidade sobre os usos posteriores dos dados. (CREATIVE COMMONS, [2020b]). OPEN DATA COMMONS -by (ODC-BY) - É uma licença voltada para a disponibilização de bancos de dados, separando a licença do banco de dados como um todo, do conteúdo individual desse banco de dados. Os bancos de dados podem conter uma grande variedade de tipos de conteúdo (imagens, material audiovisual e sons todos no mesmo banco de dados, por exemplo) e, portanto, está licença rege apenas os direitos sobre o banco de dados, e não o conteúdo do banco de dados individualmente. (OPEN DATA COMMONS, [2021], não paginado, tradução nossa). - Essa licença permite que os usuários do banco de dados compartilhem, modifiquem e usem-no, e os conteúdos derivados, desde que sejam mantidas de maneira visível informações sobre os proprietários originais. (OPEN KNOWLEDGE FOUNDATION, [2021a]). Open Database License v1.0 (ODbL v1.0) - Licença aberta para bancos de dados, fornecendo a possibilidade de diferenciar, a licença dos dados, da licença do conteúdo do banco de dados. As notificações do banco de dados originais devem ser mantidas, os resultados devem ser submetidos à mesma licença. (OPEN KNOWLEDGE FOUNDATION, [2021a]). 129 Free Art License - Licença voltada para trabalhos artísticos, visando permitir o direito de copiar, de distribuir e de alterar livremente os trabalhos. Os trabalhos resultantes devem estar sujeitos a mesma licença e ao fornecimento de informações sobre os direitos originais. (OPEN KNOWLEDGE FOUNDATION, [2021b]). Attribution 2.0 Generic (CC BY 2.0) - É uma licença que permite aos usuários copiar, distribuir, alterar o suporte ou formato, remixar, transformar e criar materiais utilizando os dados originais, inclusive com fins comerciais. Os trabalhos resultantes devem ser marcados com a mesma licença, atribuir a autoria dos dados originais e descrever as alterações realizadas. (CREATIVE COMMONS, [2021c]). Fonte: Autora (2021). Os sites oficiais das iniciativas Creative Commons e Open Knowledge Foundation, instituições responsáveis pelas licenças adotadas no universo bibliográfico, fornecem informações detalhadas sobre essas licenças e apoio no processo de sua seleção. Recomenda-se que a licença (ou licenças, caso mais de uma seja necessária) adotada pela instituição seja disponibilizada de maneira visível, para que os usuários em potencial saibam a forma correta de reutilização desses dados. Para atender a MP5 e estabelecer bons URIs, as instituições devem tomar uma série de decisões que precisam ser documentadas e disponibilizadas na forma de uma política para o estabelecimento dos URIs, que servirá como base para garantir a persistência dos mesmos a longo prazo. Dentre as decisões que precisam ser tomadas, podem-se destacar: • Estabelecer a estrutura dos HTTPs URIs; • Selecionar esquema de URIs a ser seguido; • Estabelecer uma estratégia de persistência; • Definir se existe a necessidade de permitir a identificação de diferentes conjuntos a partir da estrutura dos URIs; • Definir em que situações serão reutilizados URIs de fontes externas e quais serão essas fontes; • Definir como será tratada a questão da ambiguidade; • Definir uma estratégia para o estabelecimento de URIs para obras; • Estabelecer se identificadores anteriores como código de controle dos registros MARC21 serão reaproveitados. 130 Em relação ao uso de esquemas de URIs, o esquema Archival Resource Key (ARK) foi um dos esquemas citados durante a análise das instituições. De acordo com a IFLA (2017), o ARK consiste em um protocolo para o estabelecimento de nomenclaturas para acesso persistente de objetos digitais, incluindo imagens, textos, conjuntos de dados e recursos de localização. Os URIs ARK são cunhados visando permitir 3 tipos principais de relações: • Direcionamento de acesso ao objeto (ou um substituto apropriado, como a página de um autor para substituir um autor); • Entre o objeto ou substituto e as informações administrativas; e • Entre o objeto ou substituto e os metadados descritivos. Outro esquema mencionado foi o Natural Keys Pattern, que de acordo com Dodds e Davis (2012) é um padrão para estabelecer URIs, cunhados algoritmicamente, a partir de identificadores exclusivos pré-existentes, podendo ser aplicado para criar URIs com base em registros MARC 21, tomando como modelo o campo “001” - número de controle, que é exclusivo para os registros do catálogo bibliográfico. Também é mencionado o uso de CURIE Syntax 1.0, uma estrutura desenvolvida para permitir a elaboração de URIs compactos (W3C, 2010). Por se tratar de uma etapa complexa e permeada por tomadas de decisão, as instituições apontaram as fontes utilizadas para auxiliar nesse processo, como apresentadas no Quadro 19. Quadro 19: Referências adotadas pelas instituições para auxiliar no estabelecimento de URIs. Título Autor Links Cool URIs for the Semantic Web W3C (2008). https://www.w3.org/TR/cooluris/ Designing URI Sets for the UK Public Sector Cabinet Office (2010). https://www.gov.uk/government/pu blications/designing-uri-sets-for- the-uk-public-sector Uniform Resource Identifier (URI): Generic Syntax Berners-Lee (2005). https://tools.ietf.org/html/rfc3986 Formulating and obtaining uris: a guide to commonly used vocabularies and reference sources Cooperative Cataloging Task Group On Uris In Marc (2015). https://www.loc.gov/aba/pcc/bibfra me/TaskGroups/formulate_obtain_ URI_guide.pdf Fonte: Autora (2021). 131 Além das fontes citadas, que detalham o processo de elaboração de URIs, foram mencionadas duas ferramentas que podem auxiliar nesse processo: • Asy-eye-dee ou EZID, é uma ferramenta desenvolvida pela California Digital Library que permite a criação de identificadores do tipo ARK. (CALIFORNIA DIGITAL LIBRARY, 2019). • MARCNext do MarcEdit, que permite aos usuários incorporar URIs HTTPs no MARC 21 (BOEHR; BUSHMAN, 2017). Para atender a MP6 e selecionar os vocabulários que irão ser utilizados, a primeira recomendação é a de que sejam consultados os vocabulários do universo bibliográfico buscando propriedades que atendam às necessidades descritivas do projeto. O quadro 20 apresenta uma lista dos vocabulários identificados durante a análise e dos links para as fontes oficiais. Quadro 20: Vocabulários adotados no universo bibliográfico. VOCABULÁRIO Link para mais informações BIBFRAME https://www.loc.gov/bibframe/ BIBO https://lov.linkeddata.es/dataset/lov/vocabs/bibo FOAF https://lov.linkeddata.es/dataset/lov/vocabs/foaf SKOS https://www.w3.org/TR/swbp-skos-core-spec/ DUBLIN CORE http://dublincore.org/documents/dces/ SCHEMA.ORG https://schema.org/ ISBD https://www.ifla.org/publications/node/10835 RDA http://rdvocab.info/ElementsGr2 MADS/RDF https://id.loc.gov/ontologies/madsrdf/v1.html BNF-ONTO https://data.bnf.fr/en/semanticweb GEO POSITIONING https://lov.linkeddata.es/dataset/lov/vocabs/geo GND-ONTOLOGY https://d-nb.info/standards/elementset/gnd ORG http://www.w3.org/TR/vocab-org/ ": METS https://www.loc.gov/standards/mets/mets- registry.html MODS http://www.loc.gov/standards/mods/modsrdf- primer.html RDFS https://www.w3.org/TR/rdf-schema/ OAI-ORE https://www.openarchives.org/ore/ PREMIS http://www.loc.gov/standards/premis/ontology/ PROV https://www.w3.org/TR/prov-o/ SCHEMA.ORG: LIBRARY EXTENSION TERMS http://docplayer.org/78683143-Linked-open- data-in-der-schweizerischen- nationalbibliothek.html Fonte: Autora (2021). 132 Essa análise deu-se a partir das fontes oficiais das iniciativas e dos recursos documentais e bibliográficos publicados a respeito desses projetos. Entende-se que, uma análise dos próprios dados das iniciativas pode contribuir para uma maior compreensão sobre o uso desses vocabulários no universo bibliográfico. Recomenda-se ainda que sejam consultados os vocabulários utilizados por projetos de outras áreas, mas que possuam características semelhantes aos dados que serão descritos, para isso pode ser consultada a nuvem de DAC. Para auxiliar no processo de seleção dos vocabulários pode ser aplicada a lista de verificação de vocabulários disponibilizada pelo W3C (2014) e apresentada no início da subseção 6.6. Caso seja necessário criar um vocabulário, esse deve ter por objetivo completar os demais vocabulários adotados, sendo composto pelas propriedades não identificadas no estudo. No caso de criação de vocabulários recomenda-se garantir que ele atenda aos pontos levantados pela já mencionada lista de verificação de vocabulários do W3C e que seja disponibilizado para reutilização por outras instituições. Recomenda-se ainda que, os vocabulários utilizados, bem como as propriedades de cada vocabulários sejam documentados no modelo de dados da instituição. Para atender a MP7 e converter os dados para RDF, a primeira recomendação é a que sejam analisados os dados. Embora os dados bibliográficos sejam construídos com base em instrumentos altamente padronizados, as mudanças desses instrumentos e a abertura para diferentes interpretações podem gerar inconsistências. Nesse sentido, torna-se pertinente analisar o conjunto de dados buscando verificar inconsistências, tais como representações duplicadas, ambiguidades, dados abreviados ou campos não preenchidos. Com base nessa análise podem ser aplicadas ferramentas que permitem mapear e solucionar essas inconsistências. Para atender a MP7, também é necessário realizar o mapeamento entre o formato original dos dados e as propriedades dos vocabulários selecionados. Com base nessa estrutura de campos e subcampos do MARC21, por exemplo, algumas decisões precisam ser tomadas. Segundo Vila-Suero e Gómez-Pérez (2013), as opções de mapeamento incluem: • Um campo pode ser mapeado para uma propriedade do vocabulário; 133 • Um campo pode ser mapeado para várias propriedades do vocabulário; • Um subcampo pode ser mapeado para uma propriedade; • Um subcampo pode ser mapeado para várias propriedades; e • Vários subcampos podem ser combinados e mapeados para uma propriedade. Não é necessário escolher uma única abordagem, sendo possível adotar diferentes abordagens para diferentes situações. Recomenda-se também que, seja eleita uma amostra significativa dos dados para que esses sejam analisados, permitindo a identificação e a correção de inconsistências. Durante a análise das iniciativas foram identificadas ferramentas que podem auxiliar no processo de conversão, as quais podem ser vistas no Quadro 21. Quadro 21: Ferramentas que podem auxiliar no processo de conversão de dados bibliográficos para DAC. Ferramenta Função OPEN REFINE Tratamento e conversão dos dados VOYEUR Tratamento dos dados MARC GLOBAL Tratamento dos dados MARIMBA Mapeamento, estabelecimento e validação de URIs e conversão dos dados MARC2RDRF Conversão de MARC21 para RDF MARC2BFRAME Conversão de MARC21 para BIBFRAME BIB2L Conversão de MARC21 para BIBFRAME ESE2EDM CONVERTER Conversão do formato original da Europeana para EDM MARC2RDF-VALIDATOR Validador de dados em RDF METAMORPH Conversão de dados para RDF JENA EYEBALL Validador de dados em RDF CUBICWEB.5 Agrupamento de dados de diferentes formatos de origem e disponibilização dos dados em RDF Fonte: Autora (2021). Como observado no Quadro 21, as ferramentas identificadas englobam o tratamento inicial dos dados, a busca e correção de inconsistências, o mapeamento dos dados originais, a conversão para RDF (tanto de dados em MARC21, como de dados em outros formatos) e ainda a checagem dos resultados. Para atender a MP8 e promover o acesso aos dados disponibilizados, a primeira recomendação é elaborar e fornecer um material para auxiliar os usuários em potencial na reutilização dos dados disponibilizados. Esse documento pode informar 134 aos usuários quais conjuntos de dados estão disponíveis, fornecer maiores detalhes sobre o processo de busca e download dos dados e sobre o uso de APIs. É pertinente que esse documento contenha ainda exemplos que permitam ao usuário identificar o potencial de busca dos dados da instituição, principalmente no caso de disponibilização de busca via SPARQL. Em relação à disponibilização dos subconjuntos de dados, é necessário que as instituições analisem qual a melhor forma para criar esses subconjuntos, de maneira a atender seu público-alvo. Para isso podem ser consultados os usuários quanto às suas demandas ou utilizados APIs, que permitam rastrear o uso dos dados identificando os padrões de busca. Sendo exemplos dessa divisão: • Divisão entre dados bibliográficos e de autoridade; • Divisão entre diversas coleções de uma mesma instituição; • Agrupamento de dados de uma mesma entidade; • Agrupamento de dados de uma mesma obra; • Agrupamento dos dados por versão de publicação; e • Agrupamento por temas de interesse (como acontecimentos históricos e tipos documentais). Recomenda-se ainda, que seja monitorado o uso dos dados da instituição, esse acompanhamento permite identificar as necessidades dos usuários e as possíveis melhorias no fornecimento dos dados. Para atender a MP9 e anunciar os dados publicados, a primeira recomendação é relacionada a disseminar os resultados dos projetos nos canais científicos de divulgação, como artigos, palestras, conferências e apresentações em eventos. Esses canais promovem contato com a comunidade do universo bibliográfico, elevando a visibilidade do projeto. Destaca-se, que essa divulgação pode ser feita ainda nas fases iniciais, permitindo o recebimento de sugestões da comunidade. Recomenda-se também, que sejam estabelecidos canais de comunicação direta com os usuários, como listas de e-mail, campos de comentários ou redes sociais. Esses canais de comunicação permitem, por um lado, que a instituição compartilhe mudanças e atualizações nos dados, os casos de uso de seus dados em instituições consolidadas e dicas de busca e de reutilização dos dados. Permite por outro lado, que os usuários em potencial compartilhem suas opiniões e dificuldades em relação à utilização dos dados. Permite ainda, que sejam identificadas possíveis 135 demandas que ainda não foram atendidas, como a disponibilização em DAC de uma coleção da biblioteca ou novas interfaces de busca. A última recomendação para atender a MP9, diz respeito a disponibilizar os dados em plataformas voltadas para agrupar e organizar DAC. A plataforma de maior adesão entre as iniciativas é a Nuvem de Dados Abertos Conectados, ambiente que permite a busca de dados por áreas do conhecimento, sendo uma fonte útil para diversas etapas da publicação de DAC. Outra plataforma utilizada nesse sentido foi a GITHUB, um ambiente que permite a hospedagem de projetos e de códigos fonte, disponibilizando esses dados em um sistema de colaboração (GITHUB, 2021). Também foi utilizado a DATAHUB, uma plataforma de gerenciamento internacional de dados (OPEN KNOWLEDGE INTERNATIONAL, 2013). Em relação ao atendimento da MP10, como discutido na seção anterior, não foram identificados documentos semelhantes a um contrato de responsabilidade como publicador, que possam embasar o atendimento a essa MP. Nesse sentido, a primeira recomendação em relação ao atendimento dessa MP é a de que as instituições que pretendem publicar seus dados bibliográficos como DAC realizem estudos sobre como garantir que essa MP seja atendida, buscando compreender quais os requisitos para garantir que os DAC se mantenham persistentes a longo prazo. Alguns questionamentos podem auxiliar na elaboração de um contrato de responsabilidade, sendo eles: • Quais são os principais problemas de instabilidade enfrentados por DAC e como evitá-los? • Como garantir que os DAC da instituição vão se manter persistentes a longo prazo? • Como informar aos usuários com antecedência, caso esses dados precisem ser movidos? Para atender a essa MP, recomenda-se que as informações resultantes desses estudos sejam registradas e publicadas na forma de um documento, que terá o papel de fomentar à confiança dos usuários em potencial. Apresentadas as recomendações para publicar dados bibliográficos que estejam em consonância com cada uma das MPs, elaborou-se uma sistematização dessas recomendações, a qual inclui ainda, o referencial bibliográfico que as 136 sustentam, as tecnologias e os instrumentos que podem auxiliar no processo de publicação de dados bibliográficos como DAC, de acordo com as MPs do W3C. Figura 9: Proposta de recomendações teórico-metodológicas para a publicação de dados bibliográficos como DAC. 137 1 Preparar as partes interessadas 2 Selecione um conjunto de dados 3 Modele os dados 4 Especifique uma licença apropriada 5 Estabeleça bons URIs • Selecionar instrumentos que possam auxiliar no processo; • Disponibilizar um documento com o modelo de dados da instituição, que contenha: a) Descrição do projeto; b) Fontes e os formatos originais dos dados; c) Vocabulários e ontologias adotados; d) Classes e as propriedades utilizadas; e) Mapeamento do formato original dos dados; f) Diagrama do modelo de dados; e g) Estrutura dos URIs da instituição. • Questionar: a) Os direitos autorais anteriores devem ser mantidos? b) Os resultados da utilização desses dados devem manter a licença original? c) Qual a licença original dos dados? d) É necessário diferenciar a licença dos dados da licença do conteúdo do banco de dados?; • Verificar a necessidade de atribuir licenças diferentes a diferentes conjuntos de dados; • Garantir que a licença atribuída seja visível e de fácil focalização. • Elaborar uma política para o estabelecimento dos URIs, que contenha: a) esquema de URIs; b) estratégias para persistência; c) estrutura dos HTTPs URIs; d) necessidade de permitir a identificação de diferentes conjuntos; d) informações sobre reutilização de URIs de fontes externas; e) Informação sobre como será tratada a questão da ambiguidade; estratégia de para o estabelecimento de URIs para obras. • Apresentar as vantagens reforçando os benefícios a curto e longo prazo; • Estabelecer objetivos relacionando-os à missão e ao planejamento estratégico da biblioteca e de sua instituição mantenedora; • Dividir os objetivos em metas alcançáveis a curto e longo prazo; • Estabelecer e discutir um ciclo de vida de DAC; e • Propor um projeto piloto. R E F E R Ê N C I A S : L I B R A RY L I N K E D D A T A I N C U B A T O R GR O U P : F I N A L R E P O R T ( W 3 C I N C U B A T O R GR O U P , 2 0 1 1 ) ; C A S T R O E J E S U S (2 0 1 8 ) . A S S U M P Ç Ã O ( 2 0 1 8 ) ; V IL A - S U E R O E GÓ M E Z - P É R EZ ( 2 0 1 3 ) ; S E N S O E M A C H A D O ( 2 0 1 8 ) . • Priorizar coleções únicas; • Priorizar dados de interesse para outras iniciativas; • Compor um piloto com um conjunto pequeno de dados com alto potencial de ligação; • Analisar os dados considerando: a) que dados precisam ser convertidos; b) qual o nível de consistência; c) quais os formatos originais; d) quais os instrumentos de padronização utilizados durante a sua criação; e) sob qual licença esses dados foram publicados. INSTRUMENTOS: • BIBFRAME; • RDA; • Família FR; • Europeana Data Model; e • IFLA LRM. SITES DAS INICIATIVAS: • CREATIVE COMMONS • OPEN KNOWLEDGE FOUNDATION FERRAMENTAS: • EZID; • MARCNEXT DO MARCEDIT. 10 Estabeleça um contrato de responsabilidade Avaliar: • Quais são os principais problemas de instabilidade enfrentados por DAC e como evitá-los? • Como garantir que os dados DAC da instituição vão se manter persistentes a longo prazo? • Como informar aos usuários com antecedência caso esses dados precisem ser movidos? • Documentar e publicar a política de persistência de dados da instituição. • Começar a divulgação dos resultados ainda nas fases iniciais do projeto; • Divulgar os resultados de cada etapa dos projetos nos canais científicos de divulgação; • Estabelecer um canal de comunicação direta com os usuários, como listas de e- mail ou redes sociais; • Disponibilizar os dados em plataformas voltadas para agrupar e organizar DAC. PLATAFORMAS DE DIVULGAÇÃO DE DADOS: • Nuvem de Dados abertos conectados • GITHUB • DATAHUB 9 Anuncie os dados disponibilizados 8 Promova acesso aos dados conectados 7 C o n v e r t a o s d a d o s e m d a d o s c o n e c t a d o s 6 Utilize vocabulários-padrões • Publicar informações para promover a reutilização dos dados, abordando os conjuntos disponíveis, e as formas de buscas; • Fornecer exemplos que permitam identificar o potencial de busca dos dados da instituição; • Definir a estratégia para criar subconjuntos; • Monitorar o uso dos dados da instituição, acompanhando as necessidades dos usuários, promovendo melhorias no fornecimento. • Buscar propriedades nos vocabulários utilizados no universo bibliográfico; • Consultar vocabulários utilizados por projetos de outras áreas, mas que possuam características semelhantes aos dados que serão descritos; • Documentar os vocabulários e as propriedades selecionadas no modelo de dados da instituição. • Analisar os dados, identificando padrões de inconsistência; • Aplicar ferramentas que permitam solucionar as possíveis inconsistências; • Realizar mapeamento entre o formato de origem; • Checar a qualidade dos resultados da conversão buscando possíveis padrões de inconsistências. REFERÊNCIAS: • Quadro 15 • Nuvem de DAC • Instrumentos: • Lista de verificação para seleção de vocabulários, disponibilizada pelo W3C (2014). FERRAMENTAS : MARC GLOBAL; OPEN REFINE; VOYEUR; MARIMBA; MARC2RDRF; MARC2BFRAME; BIB2L; ESE2EDM CONVERTER; MARC2RDF-VALIDATOR; METAMORPH; JENA EYEBALL; CUBICWEB.5; SILK; LIMES 138 Fonte: Autora (2021). Uma análise do panorama geral das recomendações permite observar que a publicação de dados bibliográficos como DAC não segue uma estrutura única, existindo ferramentas tecnológicas e possibilidades distintas para se atingir um mesmo objetivo. A publicação de DAC envolve a tomada de muitas decisões, como qual o modelo de dados será adotado, como serão estruturados os URIs, quais vocabulários serão utilizados e como será feito o mapeamento entre esses vocabulários e o formato de origem dos dados. Em muitos casos, não existe uma solução única, sendo necessário para tanto avaliar os objetivos e as limitações dos projetos, inclusive as limitações de recursos humanos e financeiros. Ao longo da seção 6 foram apresentadas informações, com base nas 34 iniciativas, de vantagens e justificativas para embasar novos projetos e sobre como as instituições selecionaram, modelaram, estabeleceram uma licença adequada, elaboraram seus URIs, selecionaram seus vocabulários, converteram os dados para RDF, disponibilizaram e anunciaram os seus dados. Essas iniciativas atuaram como base para a formulação das recomendações teórico- metodológicas para a publicação de dados bibliográficos como DAC, sistematizadas na Figura 9 e discutidas ao longo dessa seção. Para além de servirem como base na formulação das recomendações, os quadros e as discussões contidas ao longo dessa seção, fornecem uma série de exemplos que podem auxiliar na compreensão de cada uma das recomendações propostas, bem como sua aplicação. Em algumas das etapas recomenda-se que seja documentado e publicado esse processo decisório, o que resultaria em uma série de documentos distintos que, se publicados de maneira dispersa, podem dificultar sua localização pelos usuários em potencial. Nesse sentido, acrescenta-se uma última recomendação, a de que seja publicado um único documento, ou agrupados de maneira sistemática esses documentos, resultando assim em uma política de publicação de dados bibliográficos como DAC, contendo a formalização dos processos decisórios envolvidos durante a publicação dos dados, dentre eles, os vocabulários, as 139 ontologias, os modelos conceituais adotados, os instrumentos de padronização aplicados e a estrutura dos URIs. Apresentadas as recomendações para a publicação de dados bibliográficos como DAC, a próxima seção apresenta as considerações, as reflexões e os encaminhamentos que essa pesquisa alcançou. 140 8 CONSIDERAÇÕES FINAIS A presente pesquisa é norteada pelo objetivo de discutir o processo de publicação de dados bibliográficos de acordo com as 10 Melhores Práticas para a publicação de Dados e Conectados do W3C. Para atender a esse objetivo geral, partiu-se do objetivo específico “mapear as características e as especificidades dos dados bibliográficos”. Esse objetivo foi atendido na seção 2, onde realizou-se uma análise da evolução dos dados bibliográficos e dos catálogos, etapa importante para a compreensão teórico-conceitual das especificidades dos dados bibliográficos, que devem ser levadas em consideração no momento da sua publicação como Dados Abertos Conectados, tais como os principais instrumentos de padronização e as estruturas empregadas no armazenamento dos dados bibliográficos, sendo possível observar que esses instrumentos e estruturas evoluíram para acompanhar o desenvolvimento tecnológico e social. O objetivo específico “analisar e apresentar o estado da arte sobre a publicação de dados bibliográficos como DAC”, foi atendido na seção 5, que apresenta os resultados da Revisão Sistemática da Literatura. A RSL permitiu compreender como a relação entre Dados Abertos e Conectados e dados bibliográficos tem sido abordada em artigos publicados em periódicos nacionais e internacionais da Ciência da Informação. Os 154 artigos selecionados para compor o estudo puderam ser divididos em 20 categorias, ressaltando a pluralidade de abordagens temáticas. Essa pluralidade demonstra a existência de um amadurecimento das discussões na área, pois passou-se das pesquisas gerais e de caráter teórico para as discussões de temas mais específicos e aplicados. Em relação aos enfoques dos documentos, considera-se que existe uma preocupação da comunidade da Ciência da Informação em publicar os trabalhos de adequação de dados confeccionados em suas bibliotecas, em registrar as etapas deste processo, os desafios enfrentados e as vantagens advindas dessa adequação. Observou-se ainda, uma vertente dos estudos que se dedica a discutir os impactos dos Dados Abertos e Conectados nos instrumentos de padronização do universo bibliográfico, nos catálogos e na Catalogação Descritiva, demostrando o interesse da comunidade na aproximação entre esses instrumentos e o contexto dos DAC. 141 O objetivo específico “apresentar e discutir os casos de publicação de dados bibliográficos como DAC a partir da perspectiva das 10 Melhores Práticas do W3C” foi atingido na seção 6. Nessa seção procedeu-se uma análise das iniciativas de publicação de dados bibliográficos como DAC, identificadas a partir da realização da RSL. Para a verificação dos casos foram agrupadas todas as iniciativas citadas pelos artigos aceitos na RSL, eliminadas as duplicatas e as ações em fase inicial que não documentaram essa primeira etapa, sendo selecionadas 34 iniciativas. Essas iniciativas foram analisadas à luz das 10 MPs para a publicação de dados bibliográficos como DAC do W3C. Essa análise teve como base os sites oficiais das iniciativas, os recursos documentais e bibliográficos publicados a respeito dos projetos. A partir dessa análise compreende-se que, de maneira geral, as instituições do universo bibliográfico estão em consonância com as recomendações das MPs, sendo uma exceção a adoção da “MP 10 - Estabeleça um contrato de responsabilidade como publicador”, já que nenhuma das instituições estabelece de maneira explicitada o contrato de persistência dos dados. Os resultados da análise das iniciativas foram sistematizados para compor as recomendações teórico-metodológicas apresentadas na seção 7, atendendo assim ao objetivo “elaborar recomendações funcionais para a publicação de dados bibliográficos como DAC”. Nessa seção foram apresentadas as recomendações, as referências bibliográficas, os instrumentos e as ferramentas tecnológicas indicados pelas instituições para auxiliar no processo de publicação de dados bibliográficos como DAC. A elaboração dessas recomendações também permitiu responder à pergunta de pesquisa “Como publicar dados bibliográficos de acordo com as Melhores Práticas para publicação de Dados Abertos e Conectados?”. Durante a discussão da MP 1 – Prepare as partes interessadas, foram levantados as vantagens e os objetivos utilizados como justificativa das iniciativas para publicar dados bibliográficos como DAC, sendo destaque ampliar a visibilidade e a recuperação dos dados bibliográficos nos buscadores Web; possibilitar o reaproveitamento dos dados bibliográficos, por entidades não pertencentes ao universo bibliográfico e otimizar as possibilidades de busca. 142 Outra vantagem de destaque é o impacto social dessa publicação. A pandemia de COVID-19, enfrentada desde março de 2020, impossibilitou muitos dos serviços presenciais oferecidos pelas bibliotecas, evidenciando assim a necessidade de ampliar o acesso eletrônico, por meio da Web. Nesse sentido, entende-se que a adoção das MPs pelo universo bibliográfico é uma das possibilidades para ampliar os serviços não presenciais oferecidos pelas bibliotecas, pois permite que as bibliotecas garantam o ideal do acesso aberto e irrestrito aos dados, potencializando o compartilhamento, o uso e o reuso, primando pela democratização do conhecimento universal. É possível concluir que algumas MPs possuem um nível diferente de complexidade, envolvendo muitas etapas e questões técnicas de ordem computacional, como o estabelecimento dos URIs, a modelagem e a conversão dos dados, fazendo-se necessários estudos mais aprofundados sobre a melhor forma de atendê-las. O maior desafio no estabelecimento das recomendações foi em relação à MP 10 - estabeleça um contrato de responsabilidade como publicador, que trata da garantia de persistência dos dados publicados. Esse desafio ocorreu pela falta de uma documentação específica das iniciativas a respeito dessa MP. Nesse sentido, entende-se que são necessários estudos sobre como garantir que essa MP seja atendida pelas instituições do universo bibliográfico, buscando compreender quais são os requisitos para assegurar que os dados DAC das instituições permaneçam persistentes a longo prazo. As recomendações abordam diferentes etapas do processo de publicação, sendo muito heterogêneas em seus conteúdos, entretanto observa- se que a necessidade de registro das tomadas de decisão realizadas durante o processo, de forma documentada e publicada é unânime. Conclui-se que, a elaboração e a publicação de uma política para a publicação de dados bibliográficos como DAC cumpriria o papel de reunir todos os posicionamentos e as decisões da instituição, estabelecendo assim um documento norteador que possa embasar projetos futuros. A publicação dessa política também irá contribuir para promover o reuso dos dados, fomentando a confiança nos usuários em potencial. A heterogeneidade das próprias MPs e os já mencionados diferentes níveis de complexidade de cada recomendação exigem alguns 143 aprofundamentos. São exemplos de aspectos que podem ser explorados em estudos futuros: • Estudos aprofundados sobre os ciclos de vida para a publicação de DAC; • Processo de estabelecimento de URIs, contemplando discussões sobre a seleção de esquemas e a reutilização de identificadores nesse processo; • Discussões sobre a persistência dos dados e o estabelecimento de um contrato de responsabilidade como publicador; • Seleção de fontes de informação consistentes e confiáveis para a conexão de DAC; • Estudos sobre a elaboração e as funcionalidades do SPAQL; • Análise dos dados em RDF das iniciativas, visando um aprofundamento sobre o uso de vocabulários no universo bibliográfico; • Estudos sobre como a adoção dessa MPs pode impactar diretamente os usuários dos dados bibliográficos, discutindo as possibilidades de refinamento de busca, de fornecimento de resultados mais significativos aos usuários. Destaca-se ainda, que são necessários estudos sobre como efetivamente elaborar uma política de publicação de dados bibliográficos como DAC, abordando os conteúdos e a estrutura que devem possuir esse documento, para que ele supra as necessidades de informação da equipe responsável pela condução do projeto e dos consumidores de dados. Discutidos os resultados da pesquisa, entende-se que seu objetivo geral foi atendido, a partir da apresentação de uma base teórico-metodológica consolidada que embasa a construção da proposta de recomendações para a publicação de dados bibliográficos como DAC. As recomendações funcionais propostas nessa pesquisa fornecem uma aproximação entre essas MPs e o universo bibliográfico, partindo das características e das peculiaridades gerais para as especificidades desse domínio do conhecimento. 144 Assim, essas recomendações podem atuar como um ponto de partida para o universo bibliográfico, como uma referência nacional, pois contempla a base teórico-metodológica do processo, para que as bibliotecas possam publicar seus dados bibliográficos como DAC. Outrossim, apresenta o referencial bibliográfico, as ferramentas tecnológicas e os instrumentos utilizados, fornecendo exemplos próprios desse universo e uma perspectiva das vertentes temáticas que precisam ser discutidas e estudadas para ampliar as chances de efetividade e de persistência dos projetos. 145 REFERÊNCIAS AGENJO, Xavier; HERNÁNDEZ, Francisca; VIEDMA, Andrés. Data aggregation and dissemination of authority records through linked open data in a european context. Cataloging & Classification Quarterly, [S.l.], v. 50, n. 8, p. 803-829, nov. 2012. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/01639374.2012.711441. Acesso em: 10 set. 2020. AGANETTE, Elisângela Cristina; TEIXEIRA, Livia Marangon Duffles; AGANETTE, Karina de Jesus Pinto. A representação descritiva nas perspectivas do século XXI: um estudo evolutivo dos modelos conceituais. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 22, n. 50, p. 176-187, 06 set. 2017. Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2017v22n50p176. Acesso em: 08 set. 2020. ALMEIDA, Milene Rosa de. Padrão de descrição de informação: avaliação da capacidade representacional de bens materiais. 2015. 149 f. Dissertação (Doutorado em Ciência, Tecnologia e Sociedade) - Centro de Educação e Ciências Humanas, Universidade Federal de São Carlos, São Carlos, 2014. Disponível em: https://repositorio.ufscar.br/handle/ufscar/1135?show=full. Acesso em: 10 set. 2020. ALVES, Rachel Cristina Vesú. Metadados como elementos do processo de catalogação. 2010. 132 f. Tese (Doutorado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2010. Disponível em: https://www.marilia.unesp.br/Home/Pos- Graduacao/CienciadaInformacao/Dissertacoes/alves_rachel.pdf. Acesso em: 08 set. 2020. ARAKAKI, Felipe Augusto. Linked data: ligação de dados bibliográficos. 2016. 144 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2016. Disponível em: https://repositorio.unesp.br/bitstream/handle/11449/147979/arakaki_fa_me_mar .pdf?sequence=2&isAllowed=y. Acesso em: 08 set. 2020. ARAKAKI, Felipe Augusto; SIMIONATO, Ana Carolina; SANTOS, Plácida Leopoldina Ventura Amorim da Costa. Catalogação e tecnologia: interseções com a web semântica. Informação@profissões, [S.l.], v. 6, n. 2, p. 03-19, maio 2018. Disponível em: http://dx.doi.org/10.5433/2317-4390.2017v6n2p03. Acesso em: 20 jan. 2021. ARAÚJO, Aníbal Pereira. Catálogo da biblioteca: o objeto orientado ao usuário. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 17-28, jun. 2011. Disponível em: https://www.scielo.br/scielo.php?pid=S1413- 99362011000200003&script=sci_arttext&tlng=pt. Acesso em: 10 set. 2020. 146 ASSUMPÇÃO, Fabrício Silva. Modelo para a publicação de dados de autoridade como linked data. 2018. 154 f. Tese (Doutorado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2018. Disponível em: https://repositorio.unesp.br/bitstream/handle/11449/152759/assumpcao_fs_dr_ mar.pdf?sequence=3&isAllowed=y. Acesso em: 08 set. 2020. ASSUMPÇÃO, Fabrício Silva; SANTOS, Plácida Leopoldina Ventura Amorim da Costa.; ZAFALON, Zaira Regina. O controle de autoridade no universo bibliográfico: os catálogos em livros e em fichas. Biblios: Journal of Librarianship and Information Science, [S.l.], v. 1, n. 67, p. 84-98, dez. 2017a. Disponível em: http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S1562- 47302017000300002. Acesso em: 24 mar. 2020. ASSUMPÇÃO, Fabrício Silva; SANTOS, Plácida Leopoldina Ventura Amorim da Costa; ZAFALON, Zaira Regina. O controle de autoridade no universo bibliográfico: os catálogos digitais. Biblios: Journal of Librarianship and Information Science, [S.l.], n. 68, p. 22-33, dez. 2017b. Disponível em: https://biblios.pitt.edu/ojs/index.php/biblios/article/view/341. Acesso em: 08 set. 2020. AXELSSON, Peter. KB becomes the first national library to fully transition to linked data. 2018. Disponível em: https://www.mynewsdesk.com/se/kungliga_biblioteket/pressreleases/kb- becomes-the-first-national-library-to-fully-transition-to-linked-data-2573975. Acesso em: 30 dez. 2020. BAPTISTA, Dulce Maria. A catalogação como atividade profissional especializada e objeto de ensino universitário. Inf. Inf., [S.l.], v. 11, n. 1, p. 63-75, jan. 2006. Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/1700. Acesso em: 20 jan. 2021. BARBOSA, Alice Príncipe. Novos rumos da catalogação. Rio de Janeiro: Bng/brasilart, 1978. 245 p. BERNERS-LEE, Tim. Linked data, 2006. Disponível em: https://www.w3.org/DesignIssues/LinkedData.html. Acesso em: 08 set. 2020. BERNERS-LEE, Tim. Uniform resource identifier (URI): generic syntax. Generic Syntax. 2005. Disponível em: https://tools.ietf.org/html/rfc3986. Acesso em: 26 jan. 2021. BERNERS-LEE, Tim; HENDLER, James.; LASSILA, Ora. The semantic web. Scientific American, v. 284, n. 5, p. 34-43, 2001. 147 BIBLIOGRAPHIC FRAMEWORK INITIATIVE. Overview of the bibframe 2.0 model. 2016. Disponível em: https://www.loc.gov/bibframe/. Acesso em: 11 jan. 2021 BNE. Datos enlazados en la BNE. 2019. Disponível em: http://www.bne.es/es/Inicio/Perfiles/Bibliotecarios/DatosEnlazados/index.ht ml. Acesso em: 28 dez. 2020. BNF. Conditions d’utilisation des métadonnées de la Bnf. 2014. Disponível em: https://multimedia- ext.bnf.fr/pdf/metadonnees_bnf_cond_utilisation.pdf. Acesso em: 05 jan. 2020. BNF. About data.bnf.fr. 2018. Disponível em: https://data.bnf.fr/en/about. Acesso em: 28 dez. 2020. BNF. Dumps de data.bnf.fr. 2020. Disponível em: https://api.bnf.fr/dumps- de-databnffr. Acesso em: 13 jan. 2021. BOEHR, Diane; BUSHMAN, Barbara. Preparing for the future: national library of medicine's project to add mesh RDF URIS to its bibliographic and authority records. Cataloging & Classification Quarterly, [S.l.], v. 56, n. 2-3, p. 262- 272, 3 nov. 2017. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6202025/. Acesso em: 10 set. 2020. BRANAN, Bill; FUTORNICK, Michelle. Linked data for production. 2020. Disponível em: https://wiki.lyrasis.org/pages/viewpage.action?pageId=74515029. Acesso em: 29 dez. 2020. BRINER, Rob; DENYER, David. Systematic review and evidence synthesis as a practice and scholarship tool. New York: Oxford University Press, 2012. p. 328-374. BROWNING, Jennifer et al. The canadian linked data s summit: developing canada’s linked data future through cooperative alliances. Collaborative Librarianship, [S.l.], v. 1, n. 9, p.12-20, 2017. Disponível em: researchgate.net/publication/318215472_The_Canadian_Linked_Data_Summit _Developing_Canada's_Linked_Data_Future_through_Cooperative_Alliances. Acesso em: 08 set. 2020. BUCKLAND, Michael Keeble. Information as thing. Journal of The American Society For Information Science, [S.l.], v. 42, n. 5, p. 351-360, jun. 1991. Disponível em: https://asistdl.onlinelibrary.wiley.com/doi/10.1002/(SICI)1097- 4571(199106)42:5%3C351::AID-ASI5%3E3.0.CO;2-3. Acesso em: 08 set. 2020. 148 CABINET OFFICE. Designing URI sets for the UK public sector. 2010. Disponível em: https://www.gov.uk/government/publications/designing-uri-sets- for-the-uk-public-sector. Acesso em: 26 jan. 2021. CANDELA, Gustavo et al. Migration of a library catalogue into rda linked open data. LOS Press, [S.l.], v. 12, n. 1, p. 1-12, jan. 2015. Disponível em: http://www.semantic-web-journal.net/system/files/swj1162.pdf. Acesso em: 16 jan. 2021. CARLSON, Scott; SEELY, Amber. Using openrefine's reconciliation to validate local authority headings. Cataloging & Classification Quarterly, [S.l.], v. 55, n. 1, p. 1-11, nov. 2016. Disponível em: http://dx.doi.org/10.1080/01639374.2016.1245693. Acesso em: 10 set. 2020. CASTRO, Fabiano Ferreira de. Padrões de representação e descrição de recursos informacionais em bibliotecas digitais na perspectiva da Ciência da Informação: uma abordagem do marcont initiative na era da web semântica. 2008. 202 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2008. Disponível em: https://repositorio.unesp.br/handle/11449/93689. Acesso em: 10 set. 2020. CASTRO, Fabiano Ferreira de. Elementos de interoperabilidade na catalogação descritiva: configurações contemporâneas para a modelagem de ambientes informacionais digitais. 2012. 202 f. Tese (Doutorado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2012. Disponível em: https://www.marilia.unesp.br/Home/Pos- Graduacao/CienciadaInformacao/Dissertacoes/Castro,%20F.F._doutorado_CI_ 2012.pdf. Acesso em: 09 out. 2020. CASTRO, Fabiano Ferreira de. Catalogação Descritiva: necessidade de revisão em suas bases teórico-conceituais?. Informação & Informação, [S.l.], v. 25, n. 3, p. 107-134, out. 2020. Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/41888. Acesso em: 08 fev. 2021. CASTRO, Fabiano Ferreira de; JESUS, Ananda Fernanda de. Adequando dados bibliográficos ao linked data: requisitos necessários, vantagens e desafios. Informação & Sociedade: Estudos, [S.l.], v. 3, n. 28, p. 149-168, dez. 2018. Disponível em: https://periodicos.ufpb.br/index.php/ies/article/view/38288. Acesso em: 10 jan. 2021. CATARINO, Maria Elisabete; SOUZA, Terezinha Batista de. A representação descritiva no contexto da web semântica. Transinformação, Campinas, v. 24, n. 2, p. 77-90, ago. 2012. Disponível em: https://www.scielo.br/scielo.php?script=sci_abstract&pid=S0103- 37862012000200001&lng=pt&nrm=iso&tlng=pt. Acesso em: 08 set. 2020. 149 CLARKE, Rachel Ivy. Breaking records: the history of bibliographic records and their influence in conceptualizing bibliographic data. Cataloging & Classification Quarterly, [S.l.], v. 53, n. 3-4, p. 286-302, 22 dez. 2014. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/01639374.2014.960988. Acesso em: 08 set. 2020. COLE, Timothy et al. Using linked open data to enhance the discoverability, functionality and impact of emblematica online. Library Hi Tech, [S.l.], v. 35, n. 1, p. 159-178, 20 mar. 2017. Disponível em: https://www.emeraDAC.com/insight/content/doi/10.1108/LHT-11-2016- 0126/full/html. Acesso em: 10 set. 2020. COLE, Timothy; HAN, Myung-Ja; WEATHERS, William Fletcher; JOYNER, Eric. Library marc records into linked open data: challenges and opportunities. Journal Of Library Metadata, [S.l.], v. 13, n. 2-3, p. 163-196, jul. 2013. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/19386389.2013.826074. Acesso em: 10 set. 2020. CONEGLIAN, Caio Saraiva et al. Recursos audiovisuais na web de dados: a construção do portal semântico audiovisual. Transinformação, Campinas, v. 31, p. 1-13, 2019. Disponível em: https://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103- 37862019000100510. Acesso em: 10 set. 2020. COOPERATIVE CATALOGING TASK GROUP ON URIS IN MARC. Formulating and obtaining uris: a guide to commonly used vocabularies and reference sources. 2020. Disponível em: https://www.loc.gov/aba/pcc/bibframe/TaskGroups/formulate_obtain_URI_guide .pdf. Acesso em: 26 jan. 2021. CORNELL UNIVERSITY LIBRARY. Library’s linked-data projet gets new grantct gets. 2020. Disponível em: https://news.cornell.edu/stories/2020/07/librarys-linked-data-project-gets- new-grant. Acesso em: 29 dez. 2020. CORRÊA, Rosa Maria Rodrigues. Catalogação descritiva no século XXI: um estudo sobre o RDA. 2008. 63 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2008. Disponível em: https://repositorio.unesp.br/handle/11449/93699. Acesso em: 10 set. 2020. CREATIVE COMMONS. CC0. [2020a]. Disponível em: https://creativecommons.org/share-your-work/public-domain/cc0/. Acesso em: 11 jan. 2021. CREATIVE COMMONS. CC0 1.0 Universal (CC0 1.0) dedicação ao domínio público. [2020b]. Disponível em: 150 https://creativecommons.org/publicdomain/zero/1.0/deed.pt_BR. Acesso em: 11 jan. 2021. COMMONS, Creative. Atribuição 2.0 Brasil (CC BY 2.0). [2021c]. Disponível em: https://creativecommons.org/licenses/by/2.0/br/. Acesso em: 12 jan. 2021. DAVISON, Stephen et al. Enhancing an OAI-PMH service using linked data: a report from the sheet music consortium. Journalof Library Metadata, [S.l.], v. 13, n. 2-3, p. 141-162, 1 jul. 2013. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/19386389.2013.826067. Acesso em: 10 set. 2020. DECLARAÇÃO dos princípios Internacionais de catalogação. 2016. 21 p. Tradução: Marcelo Votto Texeira. Disponível em: https://www.ifla.org/files/assets/cataloguing/icp/icp_2016-pt.pdf. Acesso em: 08 set. 2020. DELIOT, Corine. Publishing the british national bibliography as linked open data. Catalogue & Index, [S.l.], v. 174, n. 1, p.13-18, mar. 2014. Disponível em: bl.uk/bibliographic/pdfs/publishing_bnb_as_lod.pdf. Acesso em: 23 mar. 2014. DIAS, Cláudia Augusto. Hipertexto: resumo histórico e efeitos sociais. Ci. Inf. Brasília, v. 28, n. 3, p. 269-277, dez 1999. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100- 19651999000300004&lng=en&nrm=iso. Acesso em: 15 jul. 2020 DINIZ, Umberto Lima; LIMA, Gercina Ângela de; MACULAN, Benildes Coura Moreira dos Santos. Conversão de dados de bibliotecas digitais de teses e dissertações em Linked Data. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 18., 2017, Marilia. Anais [...]. Marilia: Ancib, 2017. p. 1-21. Disponível em: http://enancib.marilia.unesp.br/index.php/XVIII_ENANCIB/ENANCIB/paper/ viewFile/246/1129. Acesso em: 20 dez. 2020. DNB. Linked data service. 2019. Disponível em: https://www.dnb.de/EN/Professionell/Metadatendienste/Datenbezug/DACS/DA Cs_node.html;jsessionid=4CBFC61D5BF1585372A502C2361485FD.internet55 2#doc328464bodyText1. Acesso em: 28 nov. 2020. DODDS, Leigh; DAVIS, Ian. Linked data patterns. 2012. Disponível em: https://patterns.dataincubator.org/book/. Acesso em: 19 jan. 2021. DUMER, Luciana. Representação descritiva da informação em bibliotecas: um estudo dos formatos de intercâmbio. 2019. 144 f. Dissertação (Mestrado) - Curso de Pós-Graduação em Ciência da Informação, Universidade Federal da Paraíba, João Pessoa, 2019. Disponível em: https://repositorio.ufpb.br/jspui/bitstream/123456789/16737/1/Arquivototal.pdf. Acesso em: 08 set. 2020. 151 ESLAMI, Saeedeh; VAGHEFZADEH, Mohammad Hossein. Publishing persian linked data of national library and archive of Iran. In: IFLA WLIC 2013 - SINGAPORE - FUTURE LIBRARIES: INFINITE POSSIBILITIES, 1., 2013, Singapura: Ifla, 2013. p. 1-10. Disponível em: http://library.ifla.org/193/. Acesso em: 30 dez. 2020. EUROPEANA. Linked heritage. 2014. Disponível em: https://pro.europeana.eu/project/linked-heritage. Acesso em: 29 dez. 2020. EUROPEANA. Linked open data FAQ. 2017. Disponível em: https://pro.europeana.eu/page/linked-open-data-faq. Acesso em: 29 dez. 2020. FARIA, Cleide Vieira de. Premissas normativas para construção da política de catalogação em rda: estudo de caso no sistema de bibliotecas da UFMG. 2018. 190 f. Dissertação (Doutorado) - Curso de Pós-Graduação em Gestão e Organização do Conhecimento, Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2018. Disponível em: https://repositorio.ufmg.br/handle/1843/31521. Acesso em: 08 set. 2020. FIUZA, Marysia Malheiros. A catalogação bibliográfica até o advento das novas tecnologias. Revista da Escola de Biblioteconomia da UFMG, v. 16, n. 1, p. 43-53, 1987. Disponível em: https://brapci.inf.br/index.php/res/v/71360. Acesso em: 14 out. 2020. FIUZA, Marysia Malheiros. Funções e desenvolvimento do catálogo: uma visão retrospectiva. Revista da Escola de Biblioteconomia da UFMG, v. 9, n. 2, p.139-158, 1980. Disponível em: https://brapci.inf.br/index.php/res/v/75957. Acesso em: 14 out. 2020. FONS, Ted; PENKA, Jeff; WALLIS, Richard. OCLC's linked data Initiative: using schema.org to make library data relevant on the web. Information Standards Quarterly, [S.l.], v. 24, n. 2-3, p. 29-35, 2012. Disponível em: https://www.niso.org/niso-io/2012/06/oclcs-linked-data-initiative. Acesso em: 10 set. 2020. FUSCO, Elvis. Modelos conceituais de dados como parte do processo da catalogação: perspectiva de uso dos FRBR no desenvolvimento de catálogos bibliográficos digitais. 2010. 249 f. Tese (Doutorado em Ciência da Informação) - Universidade Estadual Paulista, Marília, 2010. Disponível em: https://www.marilia.unesp.br/Home/Pos- Graduacao/CienciadaInformacao/Dissertacoes/fusco_e_do_mar.pdf. Acesso em: 10 set. 2020. GARRIDO ARILLA, María Rosa. Teoría e historia de la catalogación de documentos. Madrid: Editorial Síntesis, 1999. 192 p. GODINHO, Flavia Martins Alves; FARIA, Francileide Miguelina dos Santos Faria Miguelina dos Santos. Catalogação cooperativa: história, vantagens e desvantagens. Múltiplos Olhares em Ciência da Informação, v. 4 n. 2, p. 1-9, 152 2014. Disponível em: https://brapci.inf.br/index.php/res/v/136857. Acesso em: 14-out.-2020. GOLDBERGA, Anita et al. Identification of entities in the linked data collection Rainis and Aspazija (RunA). Jlis: Italian Journal of Library, Archives and Information Science, [S.l.], v. 1, n. 9, p. 84-106, jan. 2018. Disponível em: https://www.jlis.it/article/view/83-106/11304. Acesso em: 10 set. 2020. GONZÁLEZ, Pedro Urra. A strategy for integrating printed catalog cards from three cuban libraries into the open linked data space. Library Trends, [S.l.], v. 67, n. 4, p. 713-728, 2019. Disponível em: https://muse.jhu.edu/article/731565. Acesso em: 10 set. 2020. GRANT, Rebecca et al. Using the linked logainm dataset. [S.l.]: Linked Logainm, 2013. 14 slides, color. Disponível em: http://apps.dri.ie/locationLODer/docs/using_linked_logainm_en.pdf. Acesso em: 30 dez. 2020. GRANT, Rebecca; LOPES, Nuno; RYAN, Catherine. Report on the linked logainm project. 2013. Disponível em: http://apps.dri.ie/locationLODer/docs/linked_logainm_narrative_report_en.pdf. Acesso em: 29 dez. 2020. GRINGS, Luciana. Controle de autoridades na biblioteca nacional do Brasil: breve histórico e práticas atuais. Revista Brasileira de Biblioteconomia e Documentação, v. 11, n. 2, p. 139-154, 2015. Disponível em: https://brapci.inf.br/index.php/res/v/3289. Acesso em: 14 out. 2020. HALLA, Michelle. Linke data in libraries: library of congress bibliographic framework initiative. Library Philosophy And Practice, [S.l.], v. 15, n. 10, p. 1- 23, jan. 2013. Disponível em: https://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=2454&context=libphil prac. Acesso em: 09 jan. 2021. HASLHOFER, Bernhard; ISAAC, Antoine. Data.europeana.eu: the europeana linked open data pilot. In: DUBLIN CORE AND METADATA APPLICATIONS, 1., 2011, Netherlands. Proceedings [...]. Netherlands: Dublin Core, 2011. p. 1- 10. HEATH, Tom Talis; BIZER, Christian Freie. Linked data: evolving the web into a global data space. Berlim: Morgan & Claypool, 2011. 136 p. Disponível em: http://linkeddatabook.com/editions/1.0/#htoc8. Acesso em: 10 de set. 2020. HICKEY, Thom. Cool URIS in VIAF. 2011. Disponível em: https://outgoing.typepad.com/outgoing/2011/06/cool-uris-in-viaf.html. Acesso em: 12 jan. 2021 HO, Jeannette. Name disambiguation for digital collections: planning a dados abertos conectados app for authority control at Texas a&m university libraries. 2019. Disponível em: 153 https://oaktrust.library.tamu.edu/bitstream/handle/1969.1/187051/DAC4%20Na me%20App%20slidesJH.pdf?sequence=1&isAllowed=y. Acesso em: 29 dez. 2020. HOLANDA, Paulo Marcelo Carvalho; LOURENÇO, Cíntia Azevedo. Percepção da RDA para implementação nas bibliotecas da universidade federal de minas gerais. Múltiplos Olhares em Ciência da Informação, v. 9, n. 2, p. 1-16, 2019. Disponível em: https://brapci.inf.br/index.php/res/v/137089. Acesso em: 14 out. 2020. HOLGERSEN, Ragnhild. PREMINGER, Michael; MASSEY, David. Using semantic web technologies to collaboratively collect and share user: generated content in order to enrich the presentation of bibliographic records: development of a prototype based on rdf, d2rq, jena, sparql and worldcat’s frbrization web service. The Code4lib, [S.l.], v. 47, n. 1, [n.p.], jun. 2012. Disponível em: https://journal.code4lib.org/articles/6695. Acesso em: 23 mar. 2020. HUSSEIN, Hanna. Linked data @nlb. Singapure Journal Of Library And Information Magnament, Singapura, v. 44, n. 1, p.20-34, jan. 2015. Disponível em: https://www.las.org.sg/wp/sjlim/files/SJLIM2015-Hussein-2.pdf. Acesso em: 10 set. 2020. IFLA. Archival resource key (ark). 2017. Disponível em: https://www.ifla.org/best-practice-for-national-bibliographic-agencies-in-a-digital- age/node/8793. Acesso em: 05 nov. 2021. IFLA. IFLA's bibliographic conceptual models. 2018a. Disponível em: https://www.ifla.org/node/2016. Acesso em: 11 fev. 2021. IFLA. IFLA library reference model (lrm). 2018b. Disponível em: https://www.ifla.org/node/2016. Acesso em: 11 fev. 2021. ILIK, Violeta. Notes on operations: visual representation of academic communities through viewshare. Alcts, [S.l.], v. 59, n. 1, [n.p.], jan. 2015. Disponível em: https://journals.ala.org/index.php/lrts/article/view/2756/2735. Acesso em: 23 mar. 2020. INSIGHT CENTRE FOR DATA ANALYTICS. The linked open data cloud. 2020. Disponível em: https://lod-cloud.net. Acesso em: 30 dez. 2020. ISOTANI, Seiji; BITTENCOURT, Ig Ibert. Dados abertos conectados. São Paulo: Novatec, 2015. 175 p. Disponível em: http://www.icmc.usp.br/e/b0477. Acesso em: 19 nov. 2020. JIN, Qiang; HAHN, Jim; CROLL, Gretchen. BIBFRAME transformation for enhanced discovery. Library Resources & Technical Services, [S.l.], v. 60, n. 4, p. 223-235, out. 2016. Disponível em: http://dx.doi.org/10.5860/lrts.60n4.223. Acesso em: 23 mar. 2020. 154 JESUS, Ananda Fernanda de; CASTRO, Fabiano Ferreira de. Dados bibliográficos para o linked data. Brazilian Journal Of Information Science, [S.l.], v. 13, n. 1, p. 45-55, 29 mar. 2019. Disponivel em: http://dx.doi.org/10.36311/1981-1640.2019.v13n1.08.p45. Acesso em: 25 jan. 2021. JESUS, Ananda Fernanda de; CASTRO, Fabiano Ferreira de; RAMALHO, Rogério Aparecido Sá. O papel das bibliotecas no linked data. Encontros Bibli, [S.l.], p. 1-21, jan. 2121. Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/75909/45206. Acesso em: 25 jan. 2021. KB. Linked data van de KB. 2021. Disponível em: https://www.kb.nl/bronnen- zoekwijzers/dataservices-en-apis/linked-data-van-de-kb. Acesso em: 26 jan. 2021. LAPÔTRE, Raphaëlle. Library metadata on the web: the example of data.bnf.fr. Jlis, [S.l.], v.1, n. 8, p. 58-70, jan. 2017. Disponível em: http://dx.doi.org/10.4403/jlis.it-12402. Acesso em: 10 set. 2020. LÉVY, Pierre. As tecnologias da inteligência: o futuro do pensamento na era da informática. 2. ed. São Paulo: 34, 2010. 208 p. LÉVY, Pierre. Cibercultura. São Paulo: 34, 1999. 272 p. LIBRARY LINKED DATA INCUBATOR GROUP. Library standards. 2005. Disponível em: https://www.w3.org/2005/Incubator/lDAC/wiki/images/1/12/LayeredModelV3.pdf Acesso em: 21 jan. 2021. LIMA, Gercina Ângela Borém. A transmissão do conhecimento através do tempo: da tradição oral ao hipertexto. Rev. Interam. Bibliot, Medellín, v. 30, n. 2, p. 275-285, dez. 2007. Disponível em: http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120- 09762007000200013&lng=en&nrm=iso. Acesso em: 15 jul. 2020. LOURENÇO, Cíntia Azevedo. Novas tendências em catalogação: o novo paradigma da catalogação a partir da modelagem conceitual. Perspectivas em Ciência da Informação, n. 1, v. 25, p. 150-167, 2020. Disponível em: https://brapci.inf.br/index.php/res/v/135741. Acesso em: 14 out. 2020. MACHADO, Raildo de Sousa; STORTI, Vivian Rosa; ZAFALON, Zaira Regina. Inovação na ciência da informação: análise da produção científica. In: SEMINÁRIO DE INOVAÇÃO, INFORMAÇÃO E SOCIEDADE, 1., 2018, São Carlos. Anais [...]. São Carlos: UFSCar, 2017. v. 1, p. 1-11. Disponível em: http://www.telescopium.ufscar.br/index.php/siis/siis/paper/viewFile/215/163. Acesso em: 08 set. 2020. MACHADO, Raildo de Sousa; ZAFALON, Zaira Regina. Panizzi, Cutter, Lubetzky, Jewett e Ranganathan e as relações com o RDA: princípios teóricos 155 da catalogação descritiva. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 20., 2019, Florianópolis. Anais [...]. Florianópolis: Ancib, 2019. p. 1-23. Disponível em: https://conferencias.ufsc.br/index.php/enancib/2019/paper/view/1278/974. Acesso em: 08 set. 2020. MALMSTEN, Martin. Cataloguing in the open: the disintegration and distribution of the record. Jlis, [S.l.: s.v.], n. 4, p. 418-423, 2013. http://dx.doi.org/10.4403/jlis.it-5512. Disponível em: https://www.jlis.it/article/view/5512. Acesso em: 10 set. 2020. MARTÍNEZ SERRANO, Lucía; PEDRAZUELA, María José Vázquez. La automatización de los servicios bibliotecarios de la biblioteca nacional de España: antecedentes, situación actual y perspectivas de futuro. Revista Española de Documentación Científica, [S.l.], v. 38, n. 4, p. 106-116, 20 nov. 2015. Disponível em: http://redc.revistas.csic.es/index.php/redc/article/view/909/1295. Acesso em: 10 set. 2020. MATHEWS, Emilee; SMART, Laura. Piloting linked open data on artists’ books: a case study interoperability and sustainability. Vra Bulletin, [S.l.], v. 2, n. 43, p.1-13, jan. 2016. Disponível em: https://online.vraweb.org/index.php/vrab/article/view/57/52. Acesso em: 08 set. 2020. MCKENNA, Gordon. Linked heritage experience in linking heritage information. Jlis, [S.l.: s.v.], n. 4, p. 323-363, 2013. Disponível em: https://www.jlis.it/article/view/6304#:~:text=The%20Linked%20Heritage%20Proj ect%20started,sectors%20(c3%20million%20items). Acesso em: 10 set. 2020. Cole. MCGARRY, Kevin. O contexto dinâmico da Informação. Brasília: Briquet de Lemos, 1999. 206 p. MEBMER, Gabriele. linking library metadata to the web: the german experiences. Jlis, [S.l.], n. 4, p. 392-401, 2013. Http://dx.doi.org/10.4403/jlis.it- 5507. Disponível em: https://www.jlis.it/article/view/5507. Acesso em: 10 set. 2020. MITCHELL, Erik. Three case studies in linked open data. Library Technology Reports, [S.l.], v. 1, n. 1, p.26-43, jun. 2013. Disponível em: https://www.journals.ala.org/index.php/ltr/article/viewFile/4693/5586. Acesso em: 23 mar. 2020. MORANDO, Federico; SECINARO, Emanuela. Coordination of special and specialized libraries of Turin: (Cobis): linked open data Project. Ib Studi, [S.l.], v. 57, n. 1, p. 123-127, abr. 2017. MORENO, Fernanda Passini. Requisitos funcionais para registros bibliográficos FRBR: um estudo no catálogo na rede bibliodata. 2006. 199 f. 156 Dissertação (Mestrado em Ciência da Informação) - Departamento de Ciência da Informação e Documentação, Universidade de Brasília, Brasília, 2006. Disponível em: http://bdtd.ibict.br/vufind/Record/UNB_33bc0c5f3e1c4bd2aaceba3ec52aad24. Acesso em: 10 set. 2020. MORENO, Fernanda Passini; ARELLANO, Miguel Ángel Márdero. Requisitos funcionais para registros bibliográficos - FRBR: uma apresentação. RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 3, n. 1, p. 20-38, 30 set. 2005. Disponível em: https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/2052. Acesso em: 10 set. 2020. NATIONAL LIBRARY OF FINLAND. Open data service. Disponível em: https://data.nationallibrary.fi/. Acesso em: 30 dez. 2020. NATIONAL LIBRARY OF THE NETHERLANDS. Tips gebruik linked data- omgeving data.bibliotheken.nl. 2020. Disponível em: https://data.bibliotheken.nl/files/hulptekst_data.bibliotheken.nl.pdf. Acesso em: 05 jan. 2020. NAUN, Chew Chiat; KOVAR, Jason; FOLSOM, Steven. LTS and linked data: a position paper. 2015. Disponível em: https://ecommons.cornell.edu/bitstream/handle/1813/41481/LTS_linked_data_p osition_paper.pdf?sequence=3&isAllowed=y. Acesso em: 29 dez. 2020. NLM. Nlm bibframe update. 2015. Disponível em: https://www.nlm.nih.gov/pubs/techbull/mj15/mj15_bibframe.html. Acesso em: 29 dez. 2015. NSZL. About. 2019. Disponível em: http://hnlp.oszk.hu/about/. Acesso em: 28 dez. 2020. OCLC. Connect authority data across cultures and languages to facilitate research. Disponível em: https://www.oclc.org/en/viaf.html. Acesso em: 10 jan. 2021. OPEN DATA COMMONS. Open data commons attribution license (odc-by) v1.0. Disponível em: https://opendatacommons.org/licenses/by/1-0/. Acesso em: 11 jan. [2021]. OPEN KNOWLEDGE FOUNDATION. Open data commons open database license (odbl). [2021a]. Disponível em: https://opendatacommons.org/licenses/odbl/. Acesso em: 12 jan. 2021. OPEN KNOWLEDGE FOUNDATION. Free art license. [2021b]. Disponível em: https://opendatacommons.org/licenses/odbl/. Acesso em: 12 jan. 2021. OPEN KNOWLEDGE INTERNATIONAL. Welcome to the datahub. 2013. Disponível em: https://oDAC.datahub.io/about. Acesso em: 19 jan. 2021. 157 ORTEGA, Cristina Dotta. Os registros de informação dos sistemas documentários: uma discussão no âmbito da representação descritiva. 2009. 250 f. Tese (Doutorado em Ciência da Informação) - Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2009. Disponível em: https://www.teses.usp.br/teses/disponiveis/27/27151/tde- 21092009-211824/pt-br.php. Acesso em: 10 set. 2020. ORTEGA, Cristina Dotta. Do princípio monográfico à unidade documentária: exploração dos fundamentos da catalogação. Liinc em Revista, Rio de Janeiro, v. 7, n. 1, p. 43-60, mar. 2011. Disponível em: https://brapci.inf.br/_repositorio/2011/04/pdf_473df66734_0015646.pdf. Acesso em: 25 nov. 2021. PINTO, Maria Cristina Mello Ferreira. Catálogos e bibliografias: evolução histórica do trabalho de controle bibliográfico. Revista da Escola de Biblioteconomia da UFMG, v. 16, n. 2, p. 43-53, mar. 1987. Disponível em: https://brapci.inf.br/index.php/res/v/71450. Acesso em: 14-out.-2020. PRIBERAM. Dicionário Priberam da Língua Portuguesa. 2020. Disponível em: https://dicionario.priberam.org/serendipidade. Acesso em: 10 set. 2020. PRODANOV, Cleber Cristiano; FREITAS, Ernani Cesar de. Metodologia do trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmico. 2. ed. Novo Hamburgo: Feevale, 2013. 276 p. Disponível em: http://www.feevale.br/Comum/midias/8807f05a-14d0-4d5b-b1ad- 1538f3aef538/E-book%20Metodologia%20do%20Trabalho%20Cientifico.pdf. Acesso em: 10 set. 2020. RAMALHO, Rogério Aparecido Sá. Web Semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da Ciência da Informação. 2006. 120 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista “Júlio de Mesquita Filho”, Marília, 2006. Disponível em: https://www.marilia.unesp.br/Home/Pos- Graduacao/CienciadaInformacao/Dissertacoes/ramalho_ras_me_mar.pdf. Acesso em: 10 set. 2020. RAMALHO, Rogério Aparecido Sá; MARTINS, Paulo George Miranda; SOUSA, Janailton Lopes. Evolução das linguagens de marcação: um breve histórico à luz da área de ciência da informação. Informação@profissões, Londrina, v. 6, n. 2, p. 20-34, maio 2018. Disponível em: http://www.uel.br/revistas/uel/index.php/infoprof/article/view/33267/0. Acesso em: 10 set. 2020. RAMALHO, Rogério Aparecido Sá; SOUSA, Janailton Lopes. Diretrizes para avaliação de sistemas de organização do conhecimento representados em SKOS. Informação & Informação, Londrina, v. 24, n. 2, p. 126-138, nov. 2019. Disponível em: 158 http://www.uel.br/revistas/uel/index.php/informacao/article/view/37986/pdf. Acesso em: 10 set. 2020. RAUTENBERG, Sandro et al. Guia prático para a publicação de dados abertos conectados na web. Curitiba: Appris, 2018. 280 p. RDA. About. 2017. Disponível em: https://www.rdatoolkit.org/about. Acesso em: 11 jan. 2021. ROMANETTO, Luiza de Menezes; SANTOS, Plácida Leopoldina Ventura Amorim da Costa; ALVES, Rachel Cristina Vesú. O virtual international authority file – VIAF e a agregação de valores por metadados de autoridade. RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 15, n. 3, p. 571-590, jun. 2017. Disponível em: https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8647488. Acesso em: 10 set. 2020. RUDDOCK, Bethan. Linked data and the locah project. Business Information Review, [S.l.], v. 28, n. 2, p. 105-111, jun. 2011. Disponível em: http://dx.doi.org/10.1177/0266382111404013. Acesso em: 10 set. 2020. SALGADO, Denise Mancera. O controle de autoridade sob a norma RDA: análise da aplicação e implicações na construção de registros de autoridade. 2015. 172 f. Dissertação (Mestrado) - Curso de Pós-Graduação em Ciência da Informação, Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2015. Disponível em: https://www.teses.usp.br/teses/disponiveis/27/27151/tde-19012016-105319/pt- br.php. Acesso em: 09 set. 2020. SANTOS, Marcelo Nair dos. Contribuições de Andrew Maunsell à catalogação: uma breve narrativa do cabeçalho bíblia. Informação & Informação, v. 23, n. 2, p. 152-180, 2018. Disponível em: https://brapci.inf.br/index.php/res/v/33225. Acesso em: 14-out.-2020. SANTOS, Marcelo Nair dos. Fundamentos estruturais do registro bibliográfico: revisitando a compreensão de Seymour Lubetzky sobre a entrada principal representativa da obra e sua manifestação. 2019. 263 f. Tese (Doutorado em Ciência da Informação) - Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2019. Disponível em: https://repositorio.ufmg.br/handle/1843/33494. Acesso em: 08 set. 2020. SANTOS, Plácida Leopoldina Ventura Amorim da Costa; VIDOTTI, Silvana Aparecida Borsetti Gregorio. Perspectivismo e tecnologias de informação e comunicação: acréscimos à ciência da informação?. Datagramazero, [S.l.], v. 10, n. 3, p. 1-9, jun. 2009. Disponível em: https://periodicos.ufpb.br/ojs/index.php/pbcib/article/view/10396. Acesso em: 08 fev. 2021. SANTOS, Plácida Leopoldina Ventura Amorim da Costa; SANT’ANA, Ricardo César Gonçalves. Dado e granularidade na perspectiva da informação e 159 tecnologia: uma interpretação pela ciência da informação. Ci. Inf., Brasília, v. 42, n. 2, p. 199-209, maio-ago. 2013. Disponível em: http://revista.ibict.br/ciinf/article/view/1382. Acesso em: 23 jul. 2018. SARACEVIC, Tefko. Information science. Encyclopedia of Library and Information Sciences, [S.l.: s.n.], p. 2570-2585, 17 dez. 2009. http://dx.doi.org/10.1081/e-elis3-120043704. Disponível em: https://tefkos.comminfo.rutgers.edu/SaracevicInformationScienceELIS2009.pdf. Acesso em: 08 set. 2020. SAVIÉ, Ana. Authority control in Serbia. Infotheca, [S.l.], v. 17, n. 1, p. 92-103, ago. 2016. Disponível em: http://doi.fil.bg.ac.rs/volume.php?lang=en&pt=journals&issue=infotheca-2017- 17-1&i=5. Acesso em: 24 mar. 2020. SERRA, Liliana Giusti et al. Os princípios da descrição e os formatos MARC 21 e ONIX. Ciência da Informação, [S.l.], v. 2, n. 46, p. 51-66, jun. 2018. Disponível em: http://revista.ibict.br/ciinf/article/view/2327. Acesso em: 08 set. 2020. SENSO, Jose A.; MACHADO, Wenceslao Arroyo. La publicación en linked data de registros bibliográficos: modelo e implementación. Revista Española de Documentación Científica, [S.l.], v. 41, n. 4, p. 1-20, 21 nov. 2018. Disponível em: http://redc.revistas.csic.es/index.php/redc/article/view/1023. Acesso em: 02 jan. 2020. SERRA, Liliana Giusti; SANTARÉM SEGUNDO, José Eduardo. O catálogo da biblioteca e o linke data. Em Questão, Porto Alegre, v. 23, n. 2, p. 167-185, abr. 2017.167-185. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/67162. Acesso em: 09 set. 2020. SHARE-VDE. An effective environment for the use of liked data by libraries. 2019. Disponível em: https://www.share- vde.org/sharevde/files/Share-VDE_Short_overview_EN.pdf. Acesso em: 29 dez. 2020. SHEET MUSIC CONSORTIUM. Exposing publishers linked data: a pilot project. a pilot project. [2020]. Disponível em: https://digital2.library.ucla.edu/sheetmusic/lod.html. Acesso em: 20 dez. 2020. SILVA, Leonardo Gonçalves; SILVA, José Fernando Modesto da. Análise da descrição bibliográfica do inventário da primeira biblioteca pública de São Paulo. Múltiplos Olhares em Ciência da Informação, v. 5, n. 1, mar. 2015. Disponível em: https://brapci.inf.br/index.php/res/v/63420. Acesso em: 14 out. 2020. SILVA et al. O código RDA e a iniciativa BIBFRAME: tendências da representação da informação no domínio bibliográfico. Em Questão, v. 23, n. 3 160 p. 130-156, set. 2017. Disponível em: https://brapci.inf.br/index.php/res/v/11927. Acesso em: 14 out. 2020. SILVA, Luciana Candida da; SERRA, Liliana Giusti; SANTARÉM SEGUNDO, José Eduardo. O ORCID como aplicação de linked data no catálogo de bibliotecas. Informação & Tecnologia, [S.l.], v. 4, n. 2, p. 185-205, out. 2018. Disponível em: https://periodicos.ufpb.br/index.php/itec/article/view/40186. Acesso em: 09 set. 2020. SILVEIRA, Naira Christofoletti. A trajetória da autoria na representação documental. 2013. 191 f. Tese (Doutorado em Ciência da Informação) - Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2013. Disponível em: https://www.teses.usp.br/teses/disponiveis/27/27151/tde- 06052014-114125/pt- br.php#:~:text=Trata%2Dse%20de%20uma%20investiga%C3%A7%C3%A3o,n o%20Brasil%2C%20a%20saber%3A%20as. Acesso em: 10 set. 2020. SMIT, Johanna Wilhelmina. A informação na ciência da informação. Incid: Revista de Ciência da Informação e Documentação, [S.l.], v. 3, n. 2, p. 84-101, 20 dez. 2012. Disponível em: http://www.revistas.usp.br/incid/article/view/48655. Acesso em: 08 set. 2020. SMITH-YOSHIMURA, Karen. Transitioning to the next generation of metadata. 2020. Disponível em: https://www.oclc.org/en/worDACcat/inside- worDACcat.html. Acesso em: 29 dez. 2020. SOUSA, Brisa Pozzi de; FUJITA, Mariângela Spotti Lopes. Do catálogo impresso ao on-line: alguns desafios para os profissionais bibliotecários Revista ACB: Biblioteconomia em Santa Catarina, v. 17, n.1, p. 59-75, 2012. Disponível em: https://brapci.inf.br/index.php/res/v/72296. Acesso em: 14 out 2020. SOUTHWICK, Silvia; LAMPERT, Cory K.; SOUTHWICK, Richard. Preparing controlled vocabularies for linked data: benefits and challenges. Journal Of Library Metadata, [S.l.], v. 15, n. 3-4, p. 177-190, out. 2015. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/19386389.2015.1099983?tab=per missions&scroll=top. Acesso em: 30 dez. 2020. SOUZA, Elisabete Gonçalves de; BEZERRA, Darlene Alves. Os functional requirements for bibliographic records no contexto da web semântica: as contribuições de paul otlet. Transinformação, [S.l.], v. 28, n. 2, p. 143-157, ago. 2016. Disponível em: https://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103- 37862016000200143. Acesso em: 09 set. 2020. SOUZA, Fernanda Possenti de; HILLESHEIM, Araci Isaltina de Andrade. Tratamento da informação e o uso das tecnologias da informação e comunicação. Biblionline, v. 10, n. 2, 2014. Disponível em: https://brapci.inf.br/index.php/res/v/16519. Acesso em: 20 jan. 2021. 161 STEVENSON, Adrian. Explaining linked data to your pro vice chancellor. 2011. Disponível em: http://locah.archiveshub.ac.uk/2011/07/12/explaining- linked-data-to-your-pro-vice-chancellor/. Acesso em: 29 dez. 2020. STEVENSON, Adrian. Locah continues as the linking lives project. 2012. Disponível em: http://locah.archiveshub.ac.uk/. Acesso em: 30 dez. 2020. SULÉ, Andreu et al. Aplicación del modelo de datos rdf en las colecciones digitales de bibliotecas, archivos y museos de España. Revista Española de Documentación Científica, [S.l.], v. 39, n. 1, p. 1-18, fev. 2016. Disponível em: http://redc.revistas.csic.es/index.php/redc/article/view/924/1340. Acesso em: 10 set. 2020. SUOMINEN, Osma. Finnish national bibliography fennica as linked data. Hamburg, 2017. Color. Disponível em: https://swib.org/swib17/slides/suominen_fennica.pdf. Acesso em: 26 jan. 2021. SWISSBIB. Linked swissbib. 2018. Disponível em: https://www.swissbib.org/wiki/index.php?title=Linked_swissbib. Acesso em: 09 fev. 2020. TABOSA, Hamilton Rodrigues; PAES, Denyse Maria Borges. Ferramentas tecnológicas na representação descritiva de documentos: abordagem como conteúdo e como instrumentos. Biblionline, [S.l.], v. 8, n. 1, p. 78-85, jun. 2012. Disponível em: https://periodicos.ufpb.br/ojs2/index.php/biblio/article/view/9925. Acesso em: 10 set. 2020. THOMPSON, Timothy et al. From notes to annotations: dedications as data in the library of jacques derrida at princeton university. Journal of Library Metadata, [S.l.], v. 16, n. 3-4, p. 146-165, out. 2016. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/19386389.2016.1258908. Acesso em: 10 out. 2020. THOMPSON, Keri et al. Moving our data to the semantic web: leveraging a content management system to create the linked open library. Journal of Library Metadata, [S.l.], v. 13, n. 2-3, p. 290-309, jul. 2013. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/19386389.2013.828551. Acesso em: 10 set. 2020. TOLENTINO, Vinicius de Souza. A técnica da descrição em catálogos e bibliografias: contribuição aos fundamentos da catalogação. 2015. 98 f. Dissertação (Mestrado em Ciência da Informação) - Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2015. Disponível em: https://repositorio.ufmg.br/handle/1843/BUBD-AANEZL. Acesso em: 09 set. 2020. TOLENTINO, Vinicius de Souza; ORTEGA, Cristina Dotta. A descrição sob o ponto de vista da catalogação, da bibliografia e da catalografia. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, v. 162 21, n. 46, p. 2-18, 2016. Disponível em: https://brapci.inf.br/index.php/res/v/34391. Acesso em: 14 out. 2020 UNIVERSITY OF WASHINGTON LIBRARIES. Uw libraries open metadata guidelines. 2020. Disponível em: https://www.lib.washington.edu/cams/open- metadata. Acesso em: 05 jan. 2021. VAN BALLEGOOIE, Marlene. Linke ata and libraries libraries. [S.l.], 2015. Color. Disponível em: https://connect.library.utoronto.ca/display/U5DAC/Linked+Data+Presentations+- +given+by+members?preview=/21659763/21659912/Linked%20Data%20and% 20Libraries%20Final.pptx. Acesso em: 29 dez. 2020. VILA-SUERO, Daniel; GÓMEZ-PÉREZ, Asunción. Datos.bne.es and marimba: an insight into library linked data. Library Hi Tech, [S.l.], v. 31, n. 4, p. 575-601, 18 nov. 2013. Http://dx.doi.org/10.1108/lht-03-2013-0031. Disponível em: http://dx.doi.org/10.1108/lht-03-2013-0031. Acesso em: 30 dez. 2020. VILAN-FILHO, Jayme Leiro. Sistemas hipertexto para microcomputadores: uma aplicação em informação científica e tecnológica. 1992. 141 f. Dissertação (Doutorado em Biblioteconomia e Documentação) - Faculdade de Estudos Sociais Aplicados, Universidade de Brasília, Brasília, 1992. Disponível em: http://bdtd.ibict.br/vufind/Record/UNB_2f0c9ef79b91b4e0ed1055a5fe3b4ff2. Acesso em: 10 set. 2020. WELSH, Anne et al. Work in progress: the linked open bibliographic data project. Catalogue And Index, [S.l.], v. 178, n. 1, p.15-19, 2015. Disponível em: https://discovery.ucl.ac.uk/id/eprint/1466469/1/LOBD.RPS.pdf. Acesso em: 10 set. 2020. WENZ, Romain. Linked open data for new library services: the example of data.bnf.fr. Jlis, [S.l.: s.v.], n. 4, p. 402-415, jan. 2013. Disponível em: https://www.jlis.it/article/view/5509. Acesso em: 10 set. 2020. WERSIG, Gernot. Information science: the study of postmodern knowledge usage. Information Processing & Management, [S.l.], v. 29, n. 2, p. 229-239, mar. 1993. Disponível em: https://www.sciencedirect.com/science/article/abs/pii/030645739390006Y. Acesso em: 08 set. 2020. WESTRUM, Anne-Lena.; REKKAVIK, Asgeir.; TALLERÅS, Kim. Improving the presentation of library data using frbr and linked data. Code4lib Journal, [S.l.], v. 16, n.1, p.1-11, jan. 2012. Disponível em: https://oda.hioa.no/nb/improving- the-presentation-of-library-data-using-frbr-and-linked-data. Acesso em: 23 mar. 2020. WOODS, Andrew. Linked data for libraries labs. 2019. Disponível em: https://wiki.lyrasis.org/pages/viewpage.action?pageId=77447730. Acesso em: 29 dez. 2020. 163 W3C. Primer RDF. 2004. Disponível em: https://www.w3.org/TR/rdf- primer/#intro. Acesso em: 08 set. 2020. W3C. CURIE Syntax 1.0. 2010. Disponível em: https://www.w3.org/TR/curie/#s_intro. Acesso em: 12 fev. 2021. W3C. URIs, URLs e URNs: Clarifications and Recommendations 1.0. 2011. Disponível em: https://www.w3.org/TR/uri-clarification/. Acesso em: 08 set. 2020. W3C. Best practices for publishing linked data. 2014. Disponível em: https://www.w3.org/TR/ld-bp/. Acesso em: 26 jan. 2021. W3C. Linked data. 2016. Disponível em: https://www.w3.org/wiki/LinkedData. Acesso em: 08 set. 2020. W3C. Data on the web best practices. 2017. Disponível em: https://www.w3.org/TR/dwbp/. Acesso em: 08 set. 2020. W3C. Links in html documents. 2018. Disponível em: https://www.w3.org/TR/html401/cover.html#minitoc. Acesso em: 08 set. 2020. W3C. Help and faq. 2019. Disponível em: https://www.w3.org/Help/#webinternet. Acesso em: 08 set. 2020. W3C INCUBATOR GROUP. Library linked data group: final report. 2011b. [S.l.]. 19 p. Disponível em: https://www.w3.org/2005/Incubator/lDAC/. Acesso em: 08 set. 2020. XU, Amanda et al. Initial bibframe 2.0 modeling for the library information spotlight “opera planet”. Journal Of Library Metadata, [S.l.], v. 16, n. 3-4, p. 202-227, out. 2016. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/19386389.2016.1258910?journal Code=wjlm20. Acesso em: 10 set. 2020.