[論文レビュー] Fusian: Multi-LoRA Fusion for Fine-Grained Continuous MBTI Personality Control in Large Language Models
Fusian は SFT 中に LoRA アダプタの軌跡を収集して連続的な人格多様体を形成し、RL ポリシーを用いてこれらのアダプタを動的に統合することで、LLM における MBTI 特性の強度を正確かつ連続的に制御する二段階フレームワークを提案します。
Large Language Models (LLMs) have demonstrated impressive capabilities in simulating diverse human behaviors and personalities. However, existing methods for personality control, which include prompt engineering and standard Supervised Fine-Tuning (SFT), typically treat personality traits as discrete categories (e.g., "Extroverted" vs. "Introverted"), lacking the ability to precisely control the intensity of a trait on a continuous spectrum. In this paper, we introduce Fusian, a novel framework for fine-grained, continuous personality control in LLMs. Fusian operates in two stages: (1) Trajectory Collection, where we capture the dynamic evolution of personality adoption during SFT by saving a sequence of LoRA adapters, effectively mapping the continuous manifold of a trait; and (2) RL-based Dynamic Fusion, where we train a policy network using Reinforcement Learning to dynamically compute mixing weights for these frozen adapters. By sampling from a Dirichlet distribution parameterized by the policy network, Fusian fuses multiple adapters to align the model's output with a specific numerical target intensity. Experiments on the Qwen3-14B model demonstrate that Fusian achieves high precision in personality control, significantly outperforming baseline methods in aligning with user-specified trait intensities.
研究の動機と目的
- 連続的で細粒度な人格制御が離散的な MBTI 分類を超えて必要であることを動機づける。
- 人格強度を連続スペクトルに沿ってモデル化・制御する二段階フレームワーク(軌跡収集と RL ベースの動的融合)を提案する。
- LoRA ベースのパラメータ効率的微調整を活用して人格特性の軌跡多様体を構築する。
- ディリクレ分布に基づく基底アダプタの重みをサンプルし、ターゲット特性強度に一致させるポリシー駆動の融合機構を開発する。
- 基準法と比較して Qwen3-14B における MBTI 次元の精度と単調性の優れた制御を示す。
提案手法
- Stage 1 では SFT 中の高頻度 LoRA アダプタを収集し、MBTI テストで評価して連続的人格多様体(軌跡ライブラリ)を構築する。
- Stage 2 ではターゲット強度を基底アダプタの Dirichlet 分布混合重みに写す RL ポリシーを訓練し、アダプタの動的融合を可能にする。
- 融合されたアダプタは基底アダプタの加重和として算出され、推論時に使用されて所望の強度を達成する。
- ターゲット強度からの偏差を最小化するような積極的な報酬設計関数が RL 最適化を推進する。
- アダプタ基底の安定性と被覆性を、安定な基底選択プロセスと特徴スペクトル全体への一様サンプリングで保証する。
実験結果
リサーチクエスチョン
- RQ1連続的な MBTI 特性強度を、離散的タイプ割り当てを超えて LLM で正確に制御できるか。
- RQ2PEFT を用いて SFT 軌跡から頑健な連続人格多様体をどのように抽出するか。
- RQ3RL 主導の複数 LoRA アダプタの融合は数値ターゲット強度と正確に一致する制御を実現できるか。
- RQ4 Fusian は促進法や他のパラメータ空間手法と比較して MAE と MBTI 次元の単調性でどう差があるか。
- RQ5安定な基底選択と報酬設計の ablation が、正確な制御にどの程度重要か。
主な発見
| Model | E | I | N | S | F | T | P | J | Overall_MAE |
|---|---|---|---|---|---|---|---|---|---|
| gpt-5-mini Prompt | 10.98 | 17.49 | 15.38 | 11.95 | 13.18 | 18.89 | 17.29 | 14.58 | 14.97 |
| Qwen3-14B Prompt | 35.45 | 23.35 | 20.97 | 21.24 | 24.88 | 22.71 | 23.64 | 23.43 | 24.46 |
| Qwen3-14B LoRA | 9.58 | 8.60 | 13.81 | 5.00 | 12.87 | 12.80 | 8.54 | 10.26 | 10.18 |
| Qwen3-14B PISF | 16.54 | 19.32 | 16.25 | 17.62 | 20.68 | 20.63 | 19.37 | 22.25 | 19.08 |
| Qwen3-14B P-Vector | 13.50 | 11.80 | 16.93 | 10.53 | 11.21 | 7.51 | 8.16 | 11.27 | 11.36 |
| Qwen3-14B Fusian | 8.26 | 6.75 | 11.88 | 4.49 | 4.95 | 5.44 | 6.35 | 6.21 | 6.79 |
- Fusian は MBTI 制御において比較対象手法の中で全体 MAE が最も低い(6.79)。
- Fusian は全体のピアソン相関が最も高く(0.88)、次元間の単調制御が強いことを示す。
- 標準 LoRA と比較して Fusian は MAE を大幅に削減し、相関を改善(例: Thinking 次元 MAE 5.44 対 12.80、r は最大で 0.97)。
- 促進ベースの手法は精度が限定的(例: gpt-5-mini Prompt MAE 14.97、全体 r 0.35)。
- ablation は、動的融合、安定な基底、積極的報酬が性能にとって重要であることを示す(例: Dynamic Fusion なし MAE 10.02、r 0.53)。
- 事例研究は、分析的な応答から共感的な応答への Feeling 強度の滑らかな意味的変化を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。