Skip to main content
QUICK REVIEW

[논문 리뷰] Demystifying the trend of the healthcare index: Is historical price a key driver?

Payel Sadhukhan, Samrat Gupta|arXiv (Cornell University)|2026. 01. 20.
Global Health Care Issues인용 수 0
한 줄 요약

이 논문은 OHLC 데이터, 변동성 지표, 그리고 새로운 nowcasting 특징을 사용하는 특징-rich ML 모델이 미국 및 인도 시장에서 다음 날의 헬스케어 지수 시가를 0.8 이상의 정확도와 MCC 0.6 이상의 성능으로 예측할 수 있으며, nowcasting 특징이 Shapley 값으로 모델 설명의 지배적 역할을 차지한다는 것을 보여줍니다.

ABSTRACT

Healthcare sector indices consolidate the economic health of pharmaceutical, biotechnology, and healthcare service firms. The short-term movements in these indices are closely intertwined with capital allocation decisions affecting research and development investment, drug availability, and long-term health outcomes. This research investigates whether historical open-high-low-close (OHLC) index data contain sufficient information for predicting the directional movement of the opening index on the subsequent trading day. The problem is formulated as a supervised classification task involving a one-step-ahead rolling window. A diverse feature set is constructed, comprising original prices, volatility-based technical indicators, and a novel class of nowcasting features derived from mutual OHLC ratios. The framework is evaluated on data from healthcare indices in the U.S. and Indian markets over a five-year period spanning multiple economic phases, including the COVID-19 pandemic. The results demonstrate robust predictive performance, with accuracy exceeding 0.8 and Matthews correlation coefficients above 0.6. Notably, the proposed nowcasting features have emerged as a key determinant of the market movement. We have employed the Shapley-based explainability paradigm to further elucidate the contribution of the features: outcomes reveal the dominant role of the nowcasting features, followed by a more moderate contribution of original prices. This research offers a societal utility: the proposed features and model for short-term forecasting of healthcare indices can reduce information asymmetry and support a more stable and equitable health economy.

연구 동기 및 목표

  • 역사적 OHLC 데이터를 통해 단기 헬스케어 지수 움직임을 예측할 수 있는지 이해한다.
  • 다음 날 시가 움직임과 가장 강하게 관련된 특징 유형(내재적, 변동성 기반, nowcasting)을 식별한다.
  • 예측에 대한 특징 기여를 투명하게 보여주는 해석 가능한 ML 프레임워크를 개발한다.
  • 다양한 경제 국면에서의 미국 및 인도 헬스케어 지수를 사용해 교차 시장 일반화 가능성을 평가한다.

제안 방법

  • 다음 날 시가의 상승/하락에 대한 1단계 앞당김 롤링 분류 작업을 프레이밍한 라벨링 데이터셋을 구성한다.
  • 다양한 특징 세트를 엔지니어링한다: 내재적 OHLC 특징, 변동성 기반 지표(Donchian Channel, Bollinger Bands, Keltner Channel), 그리고 상호 OHLC 비율에 기반한 nowcasting 특징.
  • 모델 입력으로 내재적, 변동성, nowcasting 특징을 연결(concatenate)하여 최종 특징 벡터를 형성한다.
  • 2019–2024년 미국 및 인도 헬스케어 지수 데이터를 80/20 학습/테스트 분할로 여러 분류기에 대해 학습시킨다.
  • 정확도와 매튜스 상관계수(MCC)로 성능을 평가한다.
  • Shapley 값을 적용해 특징 기여도를 정량화하고 모델 결정을 해석한다.
(a) S $\&$ P 500
(a) S $\&$ P 500

실험 결과

연구 질문

  • RQ1역사적 OHLC 데이터를 사용하여 다음 날의 헬스케어 지수 시가의 상승 여부를 예측할 수 있는가?
  • RQ2어떤 특징 패밀리(내재적 가격, 변동성 지표, nowcasting 비율)가 예측 성능을 가장 강하게 이끄는가?
  • RQ3미국과 인도라는 두 가지 다른 시장에서 유사한 예측 정확도와 설명 패턴으로 모델이 일반화되는가?
  • RQ4Shapley 기반의 설명 가능성이 nowcasting 특징의 상대적 중요성과 원래 가격 특징의 기여를 어떻게 특징지하는가?

주요 결과

  • 보류된 테스트 데이터에서 예측 정확도가 0.8을 넘는다.
  • 보류된 테스트 데이터에서 매튜스 상관계수(MCC)가 0.6을 넘는다.
  • 상호 OHLC 비율에서 파생된 nowcasting 특징이 시장 움직임의 주요 결정 요인으로 부상한다.
  • Shapley 기반 설명은 nowcasting 특징의 지배적 역할을 드러내고, 원래 가격으로부터의 기여는 더 중간 정도임을 보여준다.
  • 이 프레임워크는 공개적으로 이용 가능한 OHLC 데이터를 사용하며 헬스케어 지수 움직임의 동인에 대한 해석 가능한 통찰을 제공한다.
(b) BSE
(b) BSE

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.