Skip to main content
QUICK REVIEW

[論文レビュー] A Checklist to Publish Collections as Data in GLAM Institutions

Gustavo Candela, Nele Gabriëls|arXiv (Cornell University)|Apr 5, 2023
Advanced Data Storage Technologies被引用数 8
ひとこと要約

要約: 本論文は、GLAM機関がデジタルコレクションをデータとして公開するための実用的なチェックリストを作成・適用する方法論を提示し、中小規模の機関が計算的再利用を行えるよう支援します。

ABSTRACT

Large-scale digitization in Galleries, Libraries, Archives and Museums (GLAM) created the conditions for providing access to collections as data. It opened new opportunities to explore, use and reuse digital collections. Strong proponents of collections as data are the Innovation Labs which provided numerous examples of publishing datasets under open licenses in order to reuse digital content in novel and creative ways. Within the current transition to the emerging data spaces, clouds for cultural heritage and open science, the need to identify practices which support more GLAM institutions to offer datasets becomes a priority, especially within the smaller and medium-sized institutions. This paper answers the need to support GLAM institutions in facilitating the transition into publishing their digital content and to introduce collections as data services; this will also help their future efficient contribution to data spaces and cultural heritage clouds. It offers a checklist that can be used for both creating and evaluating digital collections suitable for computational use. The main contributions of this paper are i) a methodology for devising a checklist to create and assess digital collections for computational use; ii) a checklist to create and assess digital collections suitable for use with computational methods; iii) the assessment of the checklist against the practice of institutions innovating in the Collections as data field; and iv) the results obtained after the application and recommendations for the use of the checklist in GLAM institutions.

研究の動機と目的

  • GLAM機関における“コレクションをデータとして”の必要性を喚起し、公開実践の多様性を特定する。
  • 計算的利用に適したデータセットを作成・評価するための、シンプルで使いやすいチェックリストを開発する。
  • GLAMの実務家からの情報ニーズと課題を特定し、チェックリストとその活用を促す。
  • チェックリストを構築・検証・適用する方法論を、GLAMのデータセットと実務に跨って説明する。

提案手法

  • コンサルティング対象となる公開実践、データ品質の考慮事項、既存のチェックリストに関する最善慣行を特定するための文献調査を実施した。
  • GLAM機関および研究機関を対象に、経験と情報ニーズを把握するための観察的調査(2022年10月)を実施した。
  • 文献結果を実務家の洞察と統合することで、チェックリストを四段階プロセスで構築した。
  • 各項目について、構造化された表にチェックリストを提示し、詳細な説明を提供した。
  • 現行のGLAMデータセットを評価し、機関の文脈での活用例を示すためにチェックリストを適用した。
Figure 1. Survey results ”What is the level of your experience with preparing Collections as data?”
Figure 1. Survey results ”What is the level of your experience with preparing Collections as data?”

実験結果

リサーチクエスチョン

  • RQ1計算利用のためにGLAMコレクションをデータとして公開する際の要点となる実践と考慮事項は何か。
  • RQ2小規模・中規模のGLAM機関を支援する、シンプルで実践的なチェックリストはどのように設計できるか。
  • RQ3Collections as Dataを実装する際、実務者が抱える情報ニーズと一般的な課題は何か。
  • RQ4機械可読なコレクションを作成・評価するために、チェックリストをどのように適用できるか。
  • RQ5データ空間や文化遺産クラウドへの参加に対するチェックリスト適用の影響は何か。

主な発見

  • ライセンス、引用、ドキュメンテーション、アクセス、構造、機械可読メタデータ、協力プラットフォーム、API、ポータルページ、および利用条件を含む11項目の、明確で実行可能なチェックリストを開発した。
  • 調査結果では、多くのGLAM回答者がCollections as dataの経験が浅く、初期段階で情報不足を感じていることが示され、体系化されたガイダンスの必要性が浮き彫りになった。
  • 実務家の意見は、データ準備、データセット構造、標準化、ドキュメンテーションといった、Collections as dataの uptakeを容易にするための主要ニーズを特定した。
  • チェックリストはデータセットの作成と評価の双方を支援し、成熟度の異なる機関に対して優先的な経路を提供する。
  • 再利用と研究者間の協力を促す動機付けとして、ユースケースとラボ環境を含む例と文書化が中心となる。
Figure 2. Survey results ”How well-informed do you feel/did you feel when starting to move towards Collections as data?”
Figure 2. Survey results ”How well-informed do you feel/did you feel when starting to move towards Collections as data?”

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。