Skip to main content
QUICK REVIEW

[論文レビュー] A Semantic Model for Historical Manuscripts

Sahar Aljalbout, Gilles Falquet|arXiv (Cornell University)|Jan 31, 2018
Natural Language Processing Techniques参考文献 6被引用数 1
ひとこと要約

本稿では、RDF、SPARQL構文、SWRLルールを用いて、時間的推論と進化する用語の動的表現を可能にする歴史的科学文書の意味的モデルを提示する。このモデルは、文書の引用や文脈的情報から作成されたタイムラインを推論し、著者的概念や関係性といった時間変動知識の半自動インデックス化を可能にする。

ABSTRACT

Representing and reasoning on contexts is an open problem in the semantic web. Despite the fact that context representation has for a long time been treated locally by semantic web practitioners, a recognized and widely accepted consensus regarding the way of encoding and particularly reasoning on contextual knowledge has not yet been reached by far. In this paper, we present OWL^C : a contextual two-dimensional web ontology language. Using the first dimension, we can reason on contexts-dependent classes, properties, and axioms and using the second dimension, we can reason on knowledge about contexts which we consider formal objects, as proposed by McCarthy [McCarthy, 1987]. We demonstrate the modeling strength and reasoning capabilities of OWL^C with a practical scenario from the digital humanity domain. We chose the Ferdinand de Saussure [Joseph, 2012] use case in virtue of its inherent contextual nature, as well as its notable complexity which allows us to highlight many issues connected with contextual knowledge representation and reasoning.

研究の動機と目的

  • 歴史的科学文書における時間的変化する用語や知識の解釈という課題に対処すること。
  • 学術者が文書の日付を特定し、アイデアの歴史的発展を再構築することを支援すること。
  • 時間的意味論を統合した、トランスクリプション、オントロジー、用語集を統合するマルチ知識リソースモデルの開発。
  • テキスト的参照から時間的束縛関係(例:『〜の間に知っている』)の意味的インデックス化と推論を可能にすること。
  • 進化する学術的コーパスに関するデジタル・ヒューマニティーズ研究のための再利用可能なフレームワークの構築。

提案手法

  • 本モデルは、RDFベースのオントロジー、用語集、トランスクリプション、時間区間を統合したマルチ知識リソースアーキテクチャを採用する。
  • 時間的変化する性質(例:『〜の間に知っている』)のための空白ノード FluentRelation インスタンスを生成するために、SPARQL CONSTRUCT クエリを用いる。
  • 再帰的実行によるSPARQLクエリと「filter not exists」を用いて、重複するフレント関係の生成を防ぐことで、時間的推論を実装する。
  • SWRLルールは標準論理的推論に用いられ、カスタムSPARQL構文は非単調的でフレントベースの関係に用いられる。
  • 分布的類似度を用いて、時間的期間にわたる用語の進化を評価する。
  • 有限な時間区間のため、再実行を繰り返すフィードバックループにより完全性が保証され、終了が保証される。

実験結果

リサーチクエスチョン

  • RQ1歴史的文書における進化する用語を、時間的に形式的に表現する方法は何か?
  • RQ2学術文書における時間的変化するドメイン知識の半自動的意味的インデックス化を可能にする技術は何か?
  • RQ3時間的推論は、間接的参照(例:名前、出来事、機関)から文書の作成日付や順序をどのように特定できるか?
  • RQ4SPARQLおよびSWRLは、『〜の間に知っている』のような動的で時間的束縛関係をモデル化するために果たす役割は何か?
  • RQ5SPARQLと推論ツールを組み合わせたハイブリッド推論パイプラインは、時間的知識抽出における完全性と正しさをどのように保証できるか?

主な発見

  • 本システムは、数百万のトランスクリプションと15の用語リソースをRDF知識ベースに統合し、時間的付与を施した。
  • SPARQL CONSTRUCT クエリにより、時間的変化する関係に対して妥当で重複のない FluentRelation インスタンスが生成され、有限な時間区間のおかげで終了が保証された。
  • 再帰的推論パイプラインにより、新しいトリプルが生成されなくなるまでクエリを繰り返し実行することで完全性が達成された。
  • 本モデルは、文献的引用や固有表現といった間接的参照を通じて、作成順序と概念的進化の推論を可能にする。
  • 本フレームワークは、用語の変化を特定の時間期間と結びつけることで、ソシュールの知的発展の再構築を支援する。
  • 本アプローチは、軽量で拡張可能な意味的技術を用いた、歴史的文書のスケールアップされた意味的拡張の実現可能性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。