Skip to main content
QUICK REVIEW

[論文レビュー] Understanding Data Retrieval Practices: A Social Informatics Perspective

Kathleen Gregory, Helena Cousijn|arXiv (Cornell University)|Jan 15, 2018
Data Quality and Management被引用数 9
ひとこと要約

本論文は、学術分野における現実のデータ検索実態を理解するために社会的インフォーマティクスの視点を適用し、文献計測分析とデータ探索者へのインタビューを組み合わせた。データ発見は深く社会的で文脈依存的であることが明らかになった。これは、技術的解決策に偏ったアプローチを挑戦し、データ検索システムにおけるユーザ中心設計の必要性を主張する。

ABSTRACT

Open research data are heralded as having the potential to increase effectiveness, productivity, and reproducibility in science, but little is known about the actual practices involved in data search and retrieval. The socio-technical problem of locating data for (re)use is often reduced to the technological dimension of designing data search systems. In this article, we explore how a social informatics perspective can help to better analyze the current academic discourse about data retrieval as well as to study user practices and behaviors. We employ two methods in our analysis - bibliometrics and interviews with data seekers - and conclude with a discussion of the implications of our findings for designing data discovery systems.

研究の動機と目的

  • 技術的システム設計を超えた学術的研究におけるデータ検索の社会的・技術的側面を調査すること。
  • 研究者が実際にはどのようにデータを検索し、再利用しているかを理解すること。
  • 学術文献におけるユーザ行動と議論を分析することで、現在のデータ発見システムにおけるギャップを同定すること。
  • 観察されたユーザ行動とシステム的ギャップに基づき、より効果的でユーザ中心のデータ発見プラットフォームの設計を支援すること。

提案手法

  • データ検索に関する学術文献の文献計測分析を実施し、主要なテーマと議論のトレンドをマッピングすること。
  • データ探索者に対する半構造化インタビューを実施し、実際の実践、課題、動機を調査すること。
  • 定性的コード化を用いてインタビューデータを分析し、データ検索行動における繰り返しパターンを同定すること。
  • 文献計測とインタビューの結果を統合し、学術的議論と現実のユーザ実践の対比を図ること。
  • 社会的インフォーマティクス理論を用いて結果を解釈し、データ利用における社会的・文化的・文脈的要因の重要性を強調すること。
  • 観察されたユーザ行動とシステム的ギャップに基づき、データ発見システムの設計インプリケーションを提示すること。

実験結果

リサーチクエスチョン

  • RQ1学術的議論では現在、データ検索はどのようにフレームワークされ、実際のユーザ実践をどれほど反映しているか?
  • RQ2研究者がデータを検索・取得する際に影響を与える主な社会的および文脈的要因は何か?
  • RQ3データ探索者は、実際のデータ発見と再利用の課題をどのように乗り越えているか?
  • RQ4データ発見システムの技術的焦点と研究者の現実の情報探索行動との間に、どのような乖離が存在するか?

主な発見

  • 学術的議論においては、主に技術的解決策が強調されており、データ利用の社会的・文脈的側面がしばしば無視されている。
  • 研究者たちは、公式な検索システムよりも、非公式なネットワーク、個人的な関係、分野固有の知識に大きく依存している。
  • データ発見は文脈依存的であり、ユーザーは分野、データタイプ、研究目的に応じて戦略を適応させている。
  • 現在のデータ発見システムの設計と、研究者の実際の情報探索行動との間に顕著なギャップが存在する。
  • データリポジトリにおける検索とインデクシングへの現在の焦点は、データ再利用の協働的かつ反復的な性質を十分に支援していない。
  • 不十分なメタデータ、一貫性の欠如する命名、およびプロバンセンス情報の欠如により、研究者たちは関連データを特定するのに困難を抱えている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。