[論文レビュー] DMind-3: A Sovereign Edge--Local--Cloud AI System with Controlled Deliberation and Correction-Based Tuning for Safe, Low-Latency Transaction Execution
DMind-3はWeb3の不可逆な取引中に低遅延、主権的な検証を可能にする、エッジ–ローカル–クラウドの三層スタックを導入します。エッジ側署名時ポリシー、 private local reasoning、クラウド合成マクロ文脈を組み合わせ、修正ベースの検証を実現します。
This paper introduces DMind-3, a sovereign Edge-Local-Cloud intelligence stack designed to secure irreversible financial execution in Web3 environments against adversarial risks and strict latency constraints. While existing cloud-centric assistants compromise privacy and fail under network congestion, and purely local solutions lack global ecosystem context, DMind-3 resolves these tensions by decomposing capability into three cooperating layers: a deterministic signing-time intent firewall at the edge, a private high-fidelity reasoning engine on user hardware, and a policy-governed global context synthesizer in the cloud. We propose policy-driven selective offloading to route computation based on privacy sensitivity and uncertainty, supported by two novel training objectives: Hierarchical Predictive Synthesis (HPS) for fusing time-varying macro signals, and Contrastive Chain-of-Correction Supervised Fine-Tuning (C$^3$-SFT) to enhance local verification reliability. Extensive evaluations demonstrate that DMind-3 achieves a 93.7% multi-turn success rate in protocol-constrained tasks and superior domain reasoning compared to general-purpose baselines, providing a scalable framework where safety is bound to the edge execution primitive while maintaining sovereignty over sensitive user intent.
研究の動機と目的
- Web3における不可逆で対抗的な圧力が存在する状況で、安全かつ低遅延な意思決定が必要であることを動機づける。
- 署名時実行を保護する明示的な信頼境界を備えた3層アーキテクチャ(エッジ、ローカル、クラウド)を提案する。
- プライバシー、遅延、不確実性のバランスを取るポリシー主導の選択的オフロードを導入する。
- 合成と修正の挙動を向上させる訓練目的(Hierarchical Predictive SynthesisおよびC3-SFT)を設計・評価する。
- Web3における主権AIスタックのエンドツーエンド評価方法を提供し、遅延、プライバシー、堅牢性に焦点を当てる。
提案手法
- エッジ署名時インテントファイアウォール、プライベート高忠実度ローカル検証機、クラウドマクロ文脈合成機を備えたEdge–Local–Cloud(ELC)トポロジーを提案する。
- プライバシー感度、遅延重要性、不確実性に基づいてサブ問題をルーティングするポリシー主導の選択的オフロードを定義する。
- クロスト Tierの出典情報、一貫性チェック、不確実性トリガーによるエスカレーションを含むリスク認識型オーケストレーションを実装する。
- クラウドおよびローカル層で StandardとFORESIGHT/REFLECTモードのデュアル状態推論を導入する。
- 時間変化信号を融合する階層的予測合成(HPS)と、監査に適した修正軌道を改善するContrastive Chain-of-Correction Supervised Fine-Tuning(C3-SFT)という二つの訓練目的を開発する。
実験結果
リサーチクエスチョン
- RQ1エッジ–ローカル–クラウドスタックは、私的意図に対する主権を維持しつつ、署名境界で安全性をどのように確保できるか?
- RQ2プライバシー、遅延、不確実性のバランスを取るルーティングとエスカレーション方針は、時間が重要なWeb3取引でどのように機能するか?
- RQ3デュアル状態推論と修正指向訓練は、敵対的入力やネットワーク劣化下で信頼性をどう改善するか?
- RQ4提案されたアーキテクチャと訓練目的から、遅延、プライバシー、正確さにおいてどのような測定可能な向上が得られるか?
主な発見
- エッジ層の署名境界は、プロトコル忠実な低遅延の意思決定を保証し、p50署名経路遅延は28 ms、尾部挙動は強力で(p95 61 ms、p99 92 ms)。
- DMind-3-nano(エッジ層)は、プロトコル制約の下で93.7%のマルチターン成功を達成し、署名時の相互作用に対して高い信頼性を示す。
- クラウド+ローカル層は競争力のあるドメインと推論能力を提供し、DMind-3(21B)はDMind Benchmarkで80.3、FinanceQAで70.3、AIME 2025で93.3を達成し、複数のベースラインをドメイン文脈で上回る。
- DMind-3-mini(4B)はローカル検証能力を大きく保持し、DMind Benchmarkで76.2、FinanceQAで65.2を達成。
- プライバシー境界は検証済み:サニタイズ済ペイロードは違反率を低く維持(デフォルトポリシー0.08%、厳格ポリシー0.00%)。
- アブレーション研究では、エスカレーションまたは検証経路を無効化するとマルチターン成功が低下する一方、C3-SFTを組み込んだREFLECTを有効化すると信頼性が回復する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。