Archivaria #64 Article, Résumé & Abstract
This was a whopper of a peer reviewed paper (57 pages!). It was the result of detailed research into the archival and preservations practices of about 25 different fields of science. It also marks the end of very exciting transdisciplinary, international and collaborative research work with InterPARES 2. Archivaria makes its latest 8 journals available on-line to its members only and as this one #64 goes to print, issue #56 will become available on-line to the public at no cost. I have however made the abstract available here.
Today’s Data are Part of Tomorrow’s Research: Archival Issues in the Sciences
Tracey P. Lauriault, Barbara L. Craig, D.R. Fraser Taylor, Peter L. Pulsifer
Archivaria #64, (Fall 2007), pp. 123-179.
ABSTRACT: Scientific data are essential for training in science and informed decision-making regarding health, the environment, and the economy. Cumulative data sets assist with understanding trends, frequencies and patterns, and can form a baseline upon which we can develop predictions. This paper discusses the preservation of scientific data, providing an overview of the characteristics of scientific data and scientific-data portals from a variety of fields, with a focus on data quality, particularly accuracy, reliability and authenticity, and how these are captured in metadata. These concepts are broadly defined from both scientific and archival perspectives. Based on an extensive literature review of publications from national and international scientific organizations, government and research funding bodies, and empirical evidence from a selection of InterPARES 2 Case Studies and General Study 10, which investigated thirty-two scientific-data portals, the paper includes a brief examination of machinebase “knowledge representation” (KR) and the potential implications for the preservation of scientific data, with a particular focus on formal ontologies. The paper also discusses the concept of record in the context of Web 2.0 environments, the paucity of scientific data archives, and the lack of funding priorities in this area. It is argued that archivists will have to work closely with scientific-data creators to understand their practices, that data portals are mechanisms that archivists can use to extend their preservation practices, and that it is not technology that is impeding progress regarding the preservation of scientific data; it is a lack of funding, policy, prioritizing, and vision allowing our scientific national resources to be lost.
RÉSUMÉ Les données scientifiques sont essentielles à la formation en sciences et à la prise de décision éclairée dans les domaines de la santé, de l’environnement et de l’économie. Les bases de données cumulatives aident à comprendre les tendances, les fréquences et les courants, et peuvent permettre de développer des prévisions. Cet article se penche sur la préservation des données scientifiques et des portails de données scientifiques d’un ensemble de domaines, en ciblant la qualité des données – surtout l’exactitude, la fiabilité et l’authenticité – et en examinant comment ces caractéristiques sont synthétisées par les métadonnées. Les auteurs donnent des définitions générales de ces concepts, dans des perspectives à la fois scientifiques et archivistiques. À partir d’une recension approfondie de la littérature sur le sujet (publications provenant d’organisations scientifiques nationales et internationales, d’organismes gouvernementaux et d’organismes de financement, ainsi que des observations empiriques d’un échantillon d’études de cas d’InterPARES 2 et de « General Study 10 » qui étudiaient 32 portails de données scientifiques), cet article examine sommairement la « représentation électronique des connaissances » (« machine-base "knowledge representation" [KR] ») et les répercussions possibles sur la préservation des données scientifiques, avec un accent particulier sur les ontologies formelles. Il présente aussi le concept de document dans le contexte d’un environnement Web 2.0, la rareté des archives sur les données scientifiques, et le fait que ce domaine ne figure pas souvent dans les priorités de financement. Les auteurs avancent que les archivistes devront travailler de près avec les scientifiques créateurs de données afin de comprendre leurs pratiques; que les portails de données sont des mécanismes dont les archivistes peuvent se servir pour parfaire leurs pratiques de préservation; et que ce n’est pas la technologie qui empêche le progrès en ce qui concerne les données scientifiques. C’est plutôt le manque de ressources, de politiques, de classement par ordre de priorités, et de vision qui occasionne la perte de nos ressources scientifiques nationales.
