[논문 리뷰] FinLlama: Financial Sentiment Classification for Algorithmic Trading Applications
FinLlama는 LoRA를 사용해 Llama 2 7B를 금융 데이터에 미세조정하여 거래용 감정 강도를 분류하고, 제한된 자원으로도 금융 특화 포트폴리오 개선을 가능하게 한다.
There are multiple sources of financial news online which influence market movements and trader's decisions. This highlights the need for accurate sentiment analysis, in addition to having appropriate algorithmic trading techniques, to arrive at better informed trading decisions. Standard lexicon based sentiment approaches have demonstrated their power in aiding financial decisions. However, they are known to suffer from issues related to context sensitivity and word ordering. Large Language Models (LLMs) can also be used in this context, but they are not finance-specific and tend to require significant computational resources. To facilitate a finance specific LLM framework, we introduce a novel approach based on the Llama 2 7B foundational model, in order to benefit from its generative nature and comprehensive language manipulation. This is achieved by fine-tuning the Llama2 7B model on a small portion of supervised financial sentiment analysis data, so as to jointly handle the complexities of financial lexicon and context, and further equipping it with a neural network based decision mechanism. Such a generator-classifier scheme, referred to as FinLlama, is trained not only to classify the sentiment valence but also quantify its strength, thus offering traders a nuanced insight into financial news articles. Complementing this, the implementation of parameter-efficient fine-tuning through LoRA optimises trainable parameters, thus minimising computational and memory requirements, without sacrificing accuracy. Simulation results demonstrate the ability of the proposed FinLlama to provide a framework for enhanced portfolio management decisions and increased market returns. These results underpin the ability of FinLlama to construct high-return portfolios which exhibit enhanced resilience, even during volatile periods and unpredictable market events.
연구 동기 및 목표
- 금융 텍스트의 감정 신호를 실행 가능한 거래 의사결정으로 연결한다.
- 최소 리소스로 일반 목적 LLM을 활용한 금융 특화 감정 분석기를 개발한다.
- 장-단기 포트폴리오에 감정 출력을 통합해 실세계 지표를 평가한다.
- 제목한 미세조정이 제한된 계산 자원 하에서도 금융 전문 베이스라인보다 성능이 우수함을 보여준다.
제안 방법
- Llama 2 7B 모델을 총 34,180개의 샘플로 구성된 네 가지 레이블된 금융 텍스트 데이터셋에 대해 SoftMax 분류기(양성, 음성, 중립)로 미세조정한다.
- 매개변수 효율적인 미세조정(LoRA)을 적용해 학습 가능한 매개변수를 약 4.2M(모델의 0.0638%) 수준으로 유지한다.
- 작은 학습률과 정규화(warm-up, weight decay)를 사용해 5 에포크 동안 AdamW를 적용한다.
- 단일 A100 GPU에서 실행되도록 훈련을 양자화/간소화한다.
- 실세계 지표를 사용해 FinBERT 및 어휘 기반 방법과 비교하기 위해 35% 롱쇼트 포트폴리오에 감정 신호를 통합해 평가한다.
- 417개 기업 우주와 1,672거래일에서 다섯 개의 감정 방법과 벤치마크를 수행한다.
실험 결과
연구 질문
- RQ1금융 특화 감정 분석을 LLM으로 알고리즘 트레이딩에 효과적으로 맞춤화할 수 있는가?
- RQ2제한된 하드웨어에서 매개변수 효율적 미세조정이 금융 맞춤 LLM의 성능을 포기하지 않고 가능하게 할까?
- RQ3FinLlama에서 도출된 감정 신호가 기존 방법에 비해 실세계 포트폴리오 지표를 향상시키는가?
주요 결과
| 누적 수익률 (%) | 연간 수익률 (%) | 샤프 비율 | 연간 변동성 (%) |
|---|---|---|---|
| 204.6 | 29.1 | 1.5 | 19.5 |
| 100.4 | 13.5 | 0.7 | 18.9 |
| 130.6 | 17.9 | 0.9 | 19.6 |
| 213.0 | 30.3 | 1.5 | 20.3 |
| 308.2 | 45.0 | 2.4 | 18.6 |
| 83.1 | 11.3 | 0.62 | 18.5 |
- FinLlama는 FinBERT를 포함한 모든 기준선보다 누적 수익률과 샤프 비율이 높게 나타난다.
- FinLlama는 FinBERT 및 어휘 기반 방법에 비해 연간 수익률이 높고 연간 변동성은 낮다.
- 심층 학습 접근법이 누적 수익률에서 어휘 기반 접근법을 능가하며 변동성이 큰 구간에서 가장 강한 성능을 보인다(예: 2020년 초).
- FinLlama를 사용한 35% 롱쇼트 포트폴리오는 누적 수익률 308.2%를 내고, 213.0%(FinBERT) 및 83.1%(S&P 500) 대비 우수하다.
- FinLlama는 샤프 비율 2.4와 연간 변동성 18.6%를 달성해 FinBERT(샤프 1.5; 변동성 20.3%)를 능가한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.