[論文レビュー] Demystifying the trend of the healthcare index: Is historical price a key driver?
この論文は、OHLCデータ、ボラティリティ指標、そして新規の今 casting 特徴量を用いた機能豊富な ML モデルが、米国およびインド市場で次の日のヘルスケア指数の始値を0.8超の正確度と0.6超の MCC で予測できることを示しており、今casting 特徴量が Shapley 値によるモデル解釈の支配的な要因となっている。
Healthcare sector indices consolidate the economic health of pharmaceutical, biotechnology, and healthcare service firms. The short-term movements in these indices are closely intertwined with capital allocation decisions affecting research and development investment, drug availability, and long-term health outcomes. This research investigates whether historical open-high-low-close (OHLC) index data contain sufficient information for predicting the directional movement of the opening index on the subsequent trading day. The problem is formulated as a supervised classification task involving a one-step-ahead rolling window. A diverse feature set is constructed, comprising original prices, volatility-based technical indicators, and a novel class of nowcasting features derived from mutual OHLC ratios. The framework is evaluated on data from healthcare indices in the U.S. and Indian markets over a five-year period spanning multiple economic phases, including the COVID-19 pandemic. The results demonstrate robust predictive performance, with accuracy exceeding 0.8 and Matthews correlation coefficients above 0.6. Notably, the proposed nowcasting features have emerged as a key determinant of the market movement. We have employed the Shapley-based explainability paradigm to further elucidate the contribution of the features: outcomes reveal the dominant role of the nowcasting features, followed by a more moderate contribution of original prices. This research offers a societal utility: the proposed features and model for short-term forecasting of healthcare indices can reduce information asymmetry and support a more stable and equitable health economy.
研究の動機と目的
- 短期的なヘルスケア指数の動きが歴史的なOHLCデータから予測可能かを理解する。
- どの特徴タイプ(内在的、ボラティリティベース、今casting)が翌日の始値の動きと最も強く関連するかを特定する。
- 予測に対する特徴寄与の透明性を備えた解釈可能なMLフレームワークを開発する。
- 多様な経済局面での米国およびインドのヘルスケア指数を用いた市場間の一般化可能性を評価する。
提案手法
- 次日開場の上昇/下落のワンステップ先ローリング分類タスクを framing したラベル付きデータセットを構築する。
- 内在的OHLC特徴、ボラティリティ指標(Donchian Channel、Bollinger Bands、Keltner Channel)、および相互OHLC比率に基づく今casting特徴を含む多様な特徴セットを設計する。
- 内在的、ボラティリティ、および今casting特徴を連結して最終特徴ベクターを作成し、モデル入力とする。
- 2019–2024年の米国およびインドのヘルスケア指数データを80/20の訓練/テスト分割で複数の分類器を訓練する。
- 精度とマットhews相関係数(MCC)を用いて性能を評価する。
- Shapley値を適用して特徴寄与を定量化し、モデル決定を解釈する。

実験結果
リサーチクエスチョン
- RQ1歴史的なOHLCデータを用いて次の日のヘルスケア指数の上昇または下降を予測できるか。
- RQ2予測性能を最も強く推進する特徴ファミリー(内在的価格、ボラティリティ指標、今casting比率)はどれか。
- RQ3USとIndiaの2つの異なる市場間で、同様の予測精度と説明パターンを一般化できるか。
- RQ4Shapleyベースの説明可能性は、今casting特徴の相対的重要性を元の価格特徴と比較してどのように特徴づけるか。
主な発見
- 検証データで予測精度が0.8を超える。
- 検証データでマットhews相関係数(MCC)が0.6を超える。
- 今casting特徴は相互OHLC比率から派生した特徴として市場の動向の鍵となる決定要因として浮上する。
- Shapleyベースの説明は、今casting特徴の支配的な役割を示し、元の価格の貢献はより穏やかな寄与である。
- このフレームワークは公的に利用可能なOHLCデータを用い、ヘルスケア指数の動向を導く要因について解釈可能な洞察を提供する。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。