[論文レビュー] Cultural Shift or Linguistic Drift? Comparing Two Computational Measures of Semantic Change
本稿では、意味変化の2つの計算的測定法を導入し、比較している:単語ベクトル間の距離に基づくグローバル測定法と、語の最近接意味的近傍の変化に注目する新規のローカル近傍測定法。ローカル測定法は文化的なシフト(例:'cell' が '監房' から '携帯電話' に変化する)に対してより感受性が高く、グローバル測定法は規則的な言語的漂流(例:'promise' が『儀礼的行動』から一般用語に移行する)を検出可能であり、研究者が文化的要因と言語的要因の意味変化の駆動要因を区別できるようにする。
Words shift in meaning for many reasons, including cultural factors like new technologies and regular linguistic processes like subjectification. Understanding the evolution of language and culture requires disentangling these underlying causes. Here we show how two different distributional measures can be used to detect two different types of semantic change. The first measure, which has been used in many previous works, analyzes global shifts in a word's distributional semantics, it is sensitive to changes due to regular processes of linguistic drift, such as the semantic generalization of promise ("I promise." -> "It promised to be exciting."). The second measure, which we develop here, focuses on local changes to a word's nearest semantic neighbors; it is more sensitive to cultural shifts, such as the change in the meaning of cell ("prison cell" -> "cell phone"). Comparing measurements made by these two methods allows researchers to determine whether changes are more cultural or linguistic in nature, a distinction that is essential for work in the digital humanities and historical linguistics.
研究の動機と目的
- 計算的手法を用いて、意味変化における文化的シフトと言語的漂流を区別すること。
- 急激で文化的に駆動される意味変化に感受性を持つ、新規のローカル近傍測定法を開発すること。
- 語の品詞ごとに、グローバルベクトル距離とローカル近傍変化の2つの測定法の感受性を評価・比較すること。
- 大規模な歴史的コーパスと標的ケーススタディを用いて、測定法の妥当性を検証すること。
- 研究者の関心が文化的進化か言語的進化かによって、適切な意味変化測定法を選択できるようにすること。
提案手法
- Google N-grams や COHA などの歴史的コーパスを用いて訓練された時系列的 word2vec 埋め込みを用い、skip-gram with negative sampling (SGNS) と意味空間のアライメントを適用する。
- 連続する10年ごとの語のベクトル間のユークリッド距離としてグローバル意味変化を計算する。
- ローカル意味変化を、隣接する時間帯における語の最近接近傍(上位10個)のジャカード類似度として定義する。
- 複数の言語とデータセットを用いて、品詞(名詞、動詞、形容詞、副詞)ごとの変化率を比較するための混合効果回帰モデルを適用する。
- 6つの語についてケーススタディを実施:言語的漂流が明らかな語(例:'actually', 'must', 'promise')3つと、文化的シフトが顕著な語(例:'gay', 'virus', 'cell')3つ。
- 2つの測定法の変化率を統計的に比較することで、文化的変化と言語的変化の感受性を評価する。
実験結果
リサーチクエスチョン
- RQ1ローカル近傍測定法は、グローバルベクトル距離測定法よりも文化的シフトをより効果的に検出できるか?
- RQ2ローカル近傍測定法は、文化的に駆動される意味変化にかかりやすい名詞の変化に対して、より感受性が高いか?
- RQ3グローバル距離測定法は、動詞や他の述語において、規則的な言語的漂流(特に主語化や文法化)をよりよく捉えられるか?
- RQ42つの測定法は、文化的要因と言語的プロセスの両方が関与する意味変化を、どの程度区別できるか?
- RQ52つの測定法を比較することで、意味変化の原因が主に文化的要因か言語的要因かを特定するのを研究者が支援できるか?
主な発見
- ローカル近傍測定法は、すべての言語とデータセットにおいて、名詞の変化率を顕著に高く評価しており、文化的シフトへの感受性を示している。
- グローバル距離測定法は、動詞、形容詞、副詞の変化率を高く評価しており、主語化や文法化といった既知の言語的漂流のパターンと整合している。
- ケーススタディでは、文化的シフトを経験した語(例:'cell', 'gay', 'virus')が、ローカル近傍測定法でより高い変化度を示した。
- 規則的な言語的シフトを経験した語(例:'actually', 'must', 'promise')は、グローバル距離測定法でより高い変化度を示した。
- 2つの測定法は異なる種類の意味変化に感受性を示す:ローカル測定法は急激で文化的に駆動されるシフトを検出可能、グローバル測定法は微細で体系的な漂流を捉える。
- 結果は、ローカル近傍測定法を文化的変化の検出に、グローバル測定法を文法化や言語的進化の研究に活用することが有効であることを支持する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。