[論文レビュー] APEX-SQL: Talking to the data via Agentic Exploration for Text-to-SQL
APEX-SQL は Text-to-SQL のエージェント型探索を導入し、実データに基づく推論を地に足つけすることでスキーマ連携と SQL 生成を改善し、大規模企業データベースでの性能を向上させます。
Text-to-SQL systems powered by Large Language Models have excelled on academic benchmarks but struggle in complex enterprise environments. The primary limitation lies in their reliance on static schema representations, which fails to resolve semantic ambiguity and scale effectively to large, complex databases. To address this, we propose APEX-SQL, an Agentic Text-to-SQL Framework that shifts the paradigm from passive translation to agentic exploration. Our framework employs a hypothesis-verification loop to ground model reasoning in real data. In the schema linking phase, we use logical planning to verbalize hypotheses, dual-pathway pruning to reduce the search space, and parallel data profiling to validate column roles against real data, followed by global synthesis to ensure topological connectivity. For SQL generation, we introduce a deterministic mechanism to retrieve exploration directives, allowing the agent to effectively explore data distributions, refine hypotheses, and generate semantically accurate SQLs. Experiments on BIRD (70.65% execution accuracy) and Spider 2.0-Snow (51.01% execution accuracy) demonstrate that APEX-SQL outperforms competitive baselines with reduced token consumption. Further analysis reveals that agentic exploration acts as a performance multiplier, unlocking the latent reasoning potential of foundation models in enterprise settings. Ablation studies confirm the critical contributions of each component in ensuring robust and accurate data analysis.
研究の動機と目的
- 大規模で複雑なデータベースにおける Text-to-SQL の受動的なスキーマベース prompting から積極的でデータに grounded な推論 への転換を促す。
提案手法
- 仮説検証ループを両方のスキーマ連携と SQL 生成のために用いる統一的なエージェント型 Text-to-SQL フレームワークを提案する。
実験結果
リサーチクエスチョン
- RQ1エージェント型探索を実データに基づいて行うことで大規模企業データベースにおけるスキーマ連携の recall と precision を改善できるか。
- RQ2エージェント型アプローチはエンタープライズ規模のベンチマークで、ベースラインと比べて SQL 生成の正確さと効率を向上させるか。
主な発見
- APEX-SQL は BIRD および Spider ベンチマークで最先端のスキーマ連携性能を達成(例:サブセット全体で高い strict recall)。
- SQL 生成において、APEX-SQL は BIRD-Dev および Spider 2.0-Snow の実行精度で競合ベースラインを上回り、トークン消費の著しい削減を示す。
- エージェント型探索はパフォーマンス倍率として機能し、企業環境における基盤モデルの潜在的推論能力を引き出す。
- アブレーション研究は、堅牢なデータ分析とクエリ合成のための論理的計画、剪定、決定論的ガイダンスの重要性を確認する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。