Skip to main content
QUICK REVIEW

[論文レビュー] Open Research Knowledge Graph: Next Generation Infrastructure for Semantic Scholarly Knowledge

Mohamad Yaser Jaradeh, Allard Oelen|arXiv (Cornell University)|Jan 1, 2019
Semantic Web and Ontologies参考文献 48被引用数 35
ひとこと要約

本稿では、クラウドソーシングと自動自然言語処理を組み合わせたハイブリッドアプローチにより、機械処理可能な構造的形で学術的知識を捉える次世代インフラストラクチャ「オープン・リサーチ・ノリッジ・グラフ(ORKG)」を紹介する。ユーザー評価では、構造的学術的寄与への貢献意欲が強く、高いユーザー受容が確認され、知識グラフ環境下でのスケーラブルで細粒度な学術的知識のキュレートの実現可能性が裏付けられた。

ABSTRACT

Despite improved digital access to scholarly knowledge in recent decades, scholarly communication remains exclusively document-based. In this form, scholarly knowledge is hard to process automatically. We present the first steps towards a knowledge graph based infrastructure that acquires scholarly knowledge in machine actionable form thus enabling new possibilities for scholarly knowledge curation, publication and processing. The primary contribution is to present, evaluate and discuss multi-modal scholarly knowledge acquisition, combining crowdsourced and automated techniques. We present the results of the first user evaluation of the infrastructure with the participants of a recent international conference. Results suggest that users were intrigued by the novelty of the proposed infrastructure and by the possibilities for innovative scholarly knowledge processing it could enable.

研究の動機と目的

  • 文書ベースの学術的コミュニケーションの限界を克服し、機械処理可能で意味論的に豊かな学術的知識表現を可能にすること。
  • 特に研究ライフサイクルの過程で、知識の創出段階に即して学術的知識を捉えるインフラストラクチャの開発。
  • クラウドソーシングによる知識キュレートプラットフォームを通じて、構造的学術的寄与を貢献する意思とシステムの使いやすさを評価すること。
  • 自動NLP技術と人間の入力を統合し、マルチモーダルな学術的知識収集を可能にすること。

提案手法

  • ORKGインフラストラクチャは、問題、手法、結果などの主要要素を有する構造的「研究寄与(ResearchContributions)」として学術的知識をモデル化する。
  • ガイド付きフォームを用いてユーザーが手動で研究寄与をキュレート・アノテートできるフロントエンドインターフェースを採用する。
  • Textrazor や MeaningCloud といったツールを用いた名前付きエンティティ認識および関係抽出などの自動NLPパイプラインを統合し、事前に抽出・提案を行う。
  • テキスト、表、図のマルチモーダル入力をサポートし、知識グラフのノードを豊かにする。
  • モックアップインターフェース(図5)は、自動テキスト抽出をリアルタイムで統合し、ユーザー入力を支援する様子を示している。
  • バージョニング、ユーザー認証をサポートし、将来のナノパブリケーションおよび学術的ビジュアライゼーションツールとの統合も想定している。

実験結果

リサーチクエスチョン

  • RQ1本稿の目的に合ったインフラストラクチャを用いて、著者たちは自身の論文に掲載された主要な研究寄与について構造的な記述を貢献する意欲を示すか。また、そのインフラストラクチャのユーザー受容度はいかほどか。
  • RQ2インフラストラクチャは、クラウドソーシングと自動技術を統合し、マルチモーダルな学術的知識収集を効果的に行えるか。
  • RQ3自動情報抽出をユーザーの作業ワークフローにどのように統合することで、手動キュレートの支援と負担軽減が可能になるか。

主な発見

  • 国際会議のワークショップでのユーザー評価において、ORKGのフロントエンドは強い肯定的フィードバックを得た。使いやすさの各側面が平均以上に評価されたが、「支援が必要」という項目を除き、高いシステム使いやすさが示された。
  • 参加者たちはORKGに関心を示し、デジタル図書館や学術機関との統合を提案しており、機関レベルでの採用可能性を示唆している。
  • エンティティリンクのカバレッジ指標において、Falconが最も有望なNLPツールであった。ゴールドスタンダードデータセット上でのζ(カバレッジ)値は0.78であった。
  • プロトタイプは、自動NLP機能をユーザーのワークフローに統合する成功事例を示した。たとえば、入力を支援するための関連テキスト領域の強調表示が可能であった。
  • 結果として、著者たちは構造的知識の貢献を実施する意思があることが確認され、大規模でクラウドソーシングによる学術的知識キュレートの実現可能性が裏付けられた。
  • システムは拡張可能であり、今後の改善としてディスカッション機能、バージョニング、ナノパブリケーションとの相互運用性のサポートが可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。