Skip to main content
QUICK REVIEW

[論文レビュー] Using Information Content to Evaluate Semantic Similarity in a Taxonomy

Philip Resnik|ArXiv.org|Nov 29, 1995
Topic Modeling参考文献 18被引用数 2,149
ひとこと要約

この論文は、ある種同型(is-a)タキソノミーにおける意味情報量に基づく語義的類似度の測度を提案し、人間の判断と比較評価し、エッジカウントや他のベースラインと比較する。エッジカウントに比べ著しく改善する一方で、制限と拡張について議論する。

ABSTRACT

This paper presents a new measure of semantic similarity in an IS-A taxonomy, based on the notion of information content. Experimental evaluation suggests that the measure performs encouragingly well (a correlation of r = 0.79 with a benchmark set of human similarity judgments, with an upper bound of r = 0.90 for human subjects performing the same task), and significantly better than the traditional edge counting approach (r = 0.66).

研究の動機と目的

  • 階層タキソノミーにおける単純なエッジカウントを超えた、文脈に敏感な意味的類似性測度を動機づける。
  • タキソノミー内の概念確率を用いた情報理論に基づく類似性指標を定義する。
  • 人間の類似性 judgments に対して指標を評価し、ベースライン法と比較する。

提案手法

  • コーパス頻度に基づく各概念 c に対する確率関数 p(c) を用いてタキソノミーを拡張する。
  • 情報量を -log p(c) とし、2つの概念の共通上位概念の最大情報量を類似度とする(語も同様に適用)。
  • 語については、s(w1) の全ての意味対 w1, w2 in s(w2) の組み合わせを最大化して類似度を計算する。
  • 人間の判断との相関を評価指標として、エッジベースの類似度および p(c) ベースの類似度と比較する。

実験結果

リサーチクエスチョン

  • RQ1is-a タキソノミーにおける情報量ベースの意味的類似度測度は、語の類似性に関する人間の判断と相関するか?
  • RQ2情報量法はエッジ数カウントや他のベースラインと比較して性能はどうか?
  • RQ3単一意味の最大情報要約の限界は何であり、多意味加重アプローチはそれを緩和できるか?

主な発見

類似度手法相関
Human judgments (replication)r=0.9015
Information contentr=0.7911
Probabilityr=0.6671
Edge countingr=0.6645
  • 情報量ベースの類似度は人間の判断と0.7911の相関を達成し、エッジカウントの0.6645および p(c) ベースの類似度の0.6671より上回る。
  • エッジカウントは情報量アプローチと比較して人間の判断と大幅に整合性が低い。
  • 人間を用いた再現実験では、同じ課題を実施した人間での上限相関は約0.90を示した。
  • 指摘された限界は不適切な意味での高い類似度(spuriously high similarity)であり、複数意味重み付け拡張(式8)を動機づける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。