QUICK REVIEW

[論文レビュー] From Noisy News Sentiment Scores to Interpretable Temporal Dynamics: A Bayesian State-Space Model

Ian Carbó Casals|arXiv (Cornell University)|Jan 23, 2026

Opinion Dynamics and Social Influence被引用数 0

ひとこと要約

ベイズ状態空間フレームワークが騒がしい週次ニュース感情を滑らかな潜在的感情軌跡に変換し、観測不確実性を情報密度でスケーリングしてデータ利用可能性を反映する。モデルはカテゴリをまたいで階層化され、記述的モニタリングの不確実性定量化を提供する。

ABSTRACT

Text-based sentiment indicators are widely used to monitor public and market mood, but weekly sentiment series are noisy by construction. A main reason is that the amount of relevant news changes over time and across categories. As a result, some weekly averages are based on many articles, while others rely on only a few. Existing approaches do not explicitly account for changes in data availability when measuring uncertainty. We present a Bayesian state-space framework that turns aggregated news sentiment into a smoothed time series with uncertainty. The model treats each weekly sentiment value as a noisy measurement of an underlying sentiment process, with observation uncertainty scaled by the effective information weight $n_{tj}$: when coverage is high, latent sentiment is anchored more strongly to the observed aggregate; when coverage is low, inference relies more on the latent dynamics and uncertainty increases. Using news data grouped into multiple categories, we find broadly similar latent dynamics across categories, while larger differences appear in observation noise. The framework is designed for descriptive monitoring and can be extended to other text sources where information availability varies over time.

研究の動機と目的

週次ニュース感情におけるデータ利用可能性の変化と真の感情変化を分離する必要性を動機付ける。
ノイズのある観測値で更新される複数カテゴリの潜在的自己回帰感情過程を開発する。
データ利用可能性の変化を反映する情報密度に基づく観測ノイズのスケーリングを導入する。
カテゴリ間の情報共有を可能にする階層事前分布を用いて堅牢性を向上させる。
記述的モニタリングと意思決定のための不確実性対応の感情軌道を提供する。

提案手法

latent category sentiment x_tj を長期平均 mu_j を中心とした AR(1) 過程として、持続性 theta_j と革新過程の標準偏差 sigma_eta_j を持つ。
y_tj を x_tj のノイズ付き測定として観測し、観測分散を sigma_j^2 / n_tj とする。ここで n_tj は週 t の記事全体におけるカテゴリ関連の関連性の総和である。
情報密度 n_tj を週 t およびカテゴリ j の総カテゴリ関連マスとして定義する。
mu_j、theta_j、sigma_j、sigma_eta_j に対して階層的事前分布を適用し、カテゴリ間での部分プーリングを可能にする。
mu_j を Beta 派生の補助変数を用いて有界範囲 [-1,1] に抑える。
MCMC（JAGS）でモデルを適合させ、収束を R-hat とトレースプロットで評価し、後方予測検証を実施する。

Figure 1: Aggregated sentiment $y_{tj}$ (line) and effective weight $n_{tj}$ (bars, globally rescaled) for each category.

実験結果

リサーチクエスチョン

RQ1 Aggregated 感情の観測ノイズを時間とカテゴリでデータ利用可能性により正確にスケーリングできるか。
RQ2 潜在的感情ダイナミクスはカテゴリ横断で持続性とボラティリティに類似性を示すか、それとも顕著なカテゴリ固有差があるか。
RQ3 階層的ベイズ状態空間モデルは、観測カバレッジがまばらなカテゴリがある場合に堅牢性を向上させるか。
RQ4 情報密度に基づく不確実性を組み込むことで感情ダイナミクスの解釈性とモニタリングが向上するか。

主な発見

潜在的感情ダイナミクスはカテゴリ横断で持続性が概して類似しており、カテゴリ固有の小さな差異がある。
観測ノイズ（sigma_j）はカテゴリによって異なり、カテゴリ間で測定信頼性が異なることを示す。
情報密度でスケーリングされたヘテロスケダスティックな観測モデルは、後部の不確実性をデータ利用可能性により敏感に反応させ、同等分散のモデルより適応的である。
階層モデルは大筋としてカテゴリレベルのパラメータを共通の時間成分へと整合させ、ばらつきは観測ノイズに mainly 現れる。
観測感情 y_tj はカバレッジが低い期間にノイズが大きく不安定だが、潜在 x_tj はより滑らかで安定している。
後方予測検証は、モデルがカテゴリ間の感情範囲とカバレッジを適切に捉えていることを示す。

Figure 2: Posterior densities of the persistence parameter, pooled (black) vs category-specific (colors).

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。