QUICK REVIEW

[論文レビュー] Using Information Content to Evaluate Semantic Similarity in a Taxonomy

Philip Resnik|ArXiv.org|Nov 29, 1995

Topic Modeling参考文献 18被引用数 2,149

ひとこと要約

この論文は、ある種同型（is-a）タキソノミーにおける意味情報量に基づく語義的類似度の測度を提案し、人間の判断と比較評価し、エッジカウントや他のベースラインと比較する。エッジカウントに比べ著しく改善する一方で、制限と拡張について議論する。

ABSTRACT

This paper presents a new measure of semantic similarity in an IS-A taxonomy, based on the notion of information content. Experimental evaluation suggests that the measure performs encouragingly well (a correlation of r = 0.79 with a benchmark set of human similarity judgments, with an upper bound of r = 0.90 for human subjects performing the same task), and significantly better than the traditional edge counting approach (r = 0.66).

研究の動機と目的

階層タキソノミーにおける単純なエッジカウントを超えた、文脈に敏感な意味的類似性測度を動機づける。
タキソノミー内の概念確率を用いた情報理論に基づく類似性指標を定義する。
人間の類似性 judgments に対して指標を評価し、ベースライン法と比較する。

提案手法

コーパス頻度に基づく各概念 c に対する確率関数 p(c) を用いてタキソノミーを拡張する。
情報量を -log p(c) とし、2つの概念の共通上位概念の最大情報量を類似度とする（語も同様に適用）。
語については、s(w1) の全ての意味対 w1, w2 in s(w2) の組み合わせを最大化して類似度を計算する。
人間の判断との相関を評価指標として、エッジベースの類似度および p(c) ベースの類似度と比較する。

実験結果

リサーチクエスチョン

RQ1is-a タキソノミーにおける情報量ベースの意味的類似度測度は、語の類似性に関する人間の判断と相関するか？
RQ2情報量法はエッジ数カウントや他のベースラインと比較して性能はどうか？
RQ3単一意味の最大情報要約の限界は何であり、多意味加重アプローチはそれを緩和できるか？

主な発見

類似度手法	相関
Human judgments (replication)	r=0.9015
Information content	r=0.7911
Probability	r=0.6671
Edge counting	r=0.6645

情報量ベースの類似度は人間の判断と0.7911の相関を達成し、エッジカウントの0.6645および p(c) ベースの類似度の0.6671より上回る。
エッジカウントは情報量アプローチと比較して人間の判断と大幅に整合性が低い。
人間を用いた再現実験では、同じ課題を実施した人間での上限相関は約0.90を示した。
指摘された限界は不適切な意味での高い類似度（spuriously high similarity）であり、複数意味重み付け拡張（式8）を動機づける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。