[논문 리뷰] A Multimodal Foundation Agent for Financial Trading: Tool-Augmented, Diversified, and Generalist
FinAgent는 금융 거래를 위한 도구 보강을 갖춘 다중 모달 기초 에이전트로, 6개 데이터세트에서 9개의 베이스라인을 상회하며 평균 이익이 36% 이상 증가하고 한 데이터셋에서 92.27%의 수익률을 달성합니다.
Financial trading is a crucial component of the markets, informed by a multimodal information landscape encompassing news, prices, and Kline charts, and encompasses diverse tasks such as quantitative trading and high-frequency trading with various assets. While advanced AI techniques like deep learning and reinforcement learning are extensively utilized in finance, their application in financial trading tasks often faces challenges due to inadequate handling of multimodal data and limited generalizability across various tasks. To address these challenges, we present FinAgent, a multimodal foundational agent with tool augmentation for financial trading. FinAgent's market intelligence module processes a diverse range of data-numerical, textual, and visual-to accurately analyze the financial market. Its unique dual-level reflection module not only enables rapid adaptation to market dynamics but also incorporates a diversified memory retrieval system, enhancing the agent's ability to learn from historical data and improve decision-making processes. The agent's emphasis on reasoning for actions fosters trust in its financial decisions. Moreover, FinAgent integrates established trading strategies and expert insights, ensuring that its trading approaches are both data-driven and rooted in sound financial principles. With comprehensive experiments on 6 financial datasets, including stocks and Crypto, FinAgent significantly outperforms 9 state-of-the-art baselines in terms of 6 financial metrics with over 36% average improvement on profit. Specifically, a 92.27% return (a 84.39% relative improvement) is achieved on one dataset. Notably, FinAgent is the first advanced multimodal foundation agent designed for financial trading tasks.
연구 동기 및 목표
- 금융 거래 인공지능에서 다중 모달 데이터 처리 및 일반화 격차를 해결합니다.
- 메모리, 반성, 도구 보강을 갖춘 다중 모달 기초 에이전트를 개발합니다.
- 도메인 지식과 설명 가능성을 통합하여 의사결정에 대한 신뢰를 향상시킵니다.
- 다양한 데이터셋(주식 및 암호화폐)에서 일반화를 입증하기 위해 평가합니다.
제안 방법
- 수치, 텍스트, 시각 데이터를 처리하는 시장 정보 모듈을 도입합니다.
- 신속한 적응 및 과거로부터의 학습을 위한 이중 수준 반영 모듈(저수준 및 고수준)을 도입합니다.
- 시장 정보, 저수준 및 고수준 반영용 별도의 메모리를 갖춘 다양화된 메모리 검색 시스템을 활용합니다.
- 전문가 가이드와 전통적 거래 전략을 통합하는 도구 보강 의사결정 모듈을 사용합니다.
- FinAgent를 MDP 프레임워크 내에서 형식화하고 특수 프롬프트(phi, mem, tool)를 사용하여 RL 파이프라인에 대형 언어 모델(LLMs)을 통합합니다.
- 사고의 흐름(Chain-of-Thought) 추론을 적용하고 거래 의사결정에 대한 정당성을 제시합니다.]

실험 결과
연구 질문
- RQ1RQ1: FinAgent가 다양한 과제에서 현재 최첨단 거래 에이전트를 능가합니까?
- RQ2RQ2: 각 FinAgent 구성 요소가 전체 성능에 어떻게 기여합니까?
- RQ3RQ3: 보강된 도구의 통합이 거래 성능을 향상합니까?
- RQ4RQ4: FinAgent의 다각적 검색 메커니즘은 얼마나 효과적입니까?
주요 결과
| 모델 | AAPL ARR% | AAPL SR | AAPL MDD% | AMZN ARR% | AMZN SR | AMZN MDD% | GOOGL ARR% | GOOGL SR | GOOGL MDD% | MSFT ARR% | MSFT SR | MSFT MDD% | TSLA ARR% | TSLA SR | TSLA MDD% | ETHUSD ARR% | ETHUSD SR | ETHUSD MDD% |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| B&H | 13.00 | 0.60 | 14.78 | 42.33 | 1.08 | 17.38 | 22.47 | 0.71 | 12.97 | 22.49 | 0.84 | 12.92 | 37.40 | 0.72 | 32.65 | 29.26 | 0.87 | 23.21 |
| MACD | 11.86 | 0.72 | 10.38 | 14.27 | 0.71 | 7.84 | -18.00 | -0.89 | 20.07 | 15.23 | 0.77 | 8.34 | -4.90 | -0.02 | 14.15 | 10.24 | 0.47 | 24.32 |
| KDJ&RSI | 2.17 | 0.17 | 11.88 | 19.38 | 0.65 | 17.27 | 24.39 | 2.13 | 2.03 | 18.84 | 1.06 | 7.78 | 2.14 | 0.17 | 24.73 | 8.87 | 0.51 | 16.95 |
| ZMR | -3.91 | -0.22 | 8.88 | 18.73 | 0.84 | 7.89 | 32.51 | 1.45 | 5.38 | 9.86 | 0.71 | 6.22 | -7.28 | -0.09 | 19.90 | 29.35 | 1.23 | 13.11 |
| RL-based | 7.92 | 0.40 | 14.88 | 27.43 | 1.17 | 5.27 | 34.40 | 1.39 | 7.15 | 30.44 | 1.18 | 10.56 | 15.07 | 0.44 | 28.12 | 29.81 | 1.18 | 9.53 |
| SAC | 24.84 | 1.12 | 11.98 | 38.33 | 1.07 | 13.84 | 23.80 | 0.75 | 13.07 | 22.02 | 0.82 | 12.92 | 42.22 | 0.87 | 26.19 | 17.84 | 0.76 | 10.06 |
| PPO | 13.26 | 0.61 | 14.78 | 21.17 | 0.70 | 13.84 | 38.29 | 1.30 | 8.45 | 11.32 | 0.48 | 17.51 | 33.64 | 0.78 | 28.35 | 34.75 | 1.31 | 11.12 |
| FinGPT | -5.46 | -0.17 | 16.23 | 42.93 | 1.10 | 18.94 | 12.28 | 0.44 | 13.00 | 25.10 | 0.97 | 9.84 | 38.43 | 0.75 | 31.47 | 21.57 | 0.68 | 25.56 |
| FinMem | 23.78 | 1.11 | 10.39 | 40.07 | 1.03 | 18.53 | 31.27 | 1.11 | 8.97 | 40.58 | 1.50 | 7.48 | 50.04 | 0.92 | 25.77 | 44.71 | 1.27 | 13.59 |
| FinAgent | 31.89 | 1.43 | 10.40 | 65.10 | 1.61 | 13.20 | 56.15 | 1.78 | 8.45 | 44.74 | 1.79 | 5.57 | 92.27 | 2.01 | 12.14 | 43.08 | 1.18 | 12.71 |
| Improve | 28.38 | 27.68 | - | 51.64 | 37.61 | - | 46.64 | - | - | 10.25 | 19.33 | - | 84.39 | 118.48 | - | 14.20 | - | - |
- FinAgent는 6개 재무 데이터셋에서 6개 지표에 대해 9개의 최첨단 베이스라인을 크게 능가하며 평균 이익이 36% 이상 증가합니다.
- 한 데이터셋에서 FinAgent는 92.27%의 수익률(상대 향상 84.39%)을 달성합니다.
- FinAgent는 주식과 암호화폐 전반에서 강한 일반화를 보여줍니다(AAPL, AMZN, GOOGL, MSFT, TSLA, ETHUSD).
- 이 프레임워크는 금융 거래 작업을 위해 설계된 최초의 고급 다중 모달 기초 에이전트입니다.
- 평가는 의사결정 품질과 설명 가능성을 향상시키기 위해 다각적 검색과 도구 보강을 사용합니다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.