Skip to main content
QUICK REVIEW

[論文レビュー] Divide and Prompt: Chain of Thought Prompting for Text-to-SQL

Xiping Liu, Zhao Tan|arXiv (Cornell University)|Apr 23, 2023
Topic Modeling被引用数 7
ひとこと要約

本論文は Divide-and-Prompt (DnP) プロンプトを提案し、Text-to-SQLタスクをサブタスクに分解し、それぞれにチェーン・オブ・ソート(CoT)推論を適用することで、特に Spider の難易度が高いタスクにおいて GPT-3.5-Turbo の実行精度を大幅に向上させる。

ABSTRACT

Chain-of-thought (CoT) prompting combined with large language models (LLMs) have achieved encouraging results on complex reasoning tasks. Text-to-SQL is a critical semantic parsing task that converts natural language questions into SQL statements, involving a complex reasoning process. However, there is little work about using CoT prompting to activate LLM's reasoning capabilities on Text-to-SQL tasks. In this work, we propose a new paradigm for prompting Text-to-SQL tasks, called Divide-and-Prompt, which first divides the task into subtasks, and then approach each subtask through CoT. We present 3 prompting-based methods to enhance the Text-to-SQL ability of LLMs. Experiments show that these prompts guide LLMs to generate Text-to-SQL with higher execution accuracy.

研究の動機と目的

  • LLMの推論タスクとしてText-to-SQLを動機づけ、SQL生成におけるCoT promptingを探索する。
  • LLMを自然言語クエリから正しいSQLを生成するよう導く3つのDnP prompting戦略を提案・評価する。
  • SpiderデータセットにおけるDnPプロンプトの有効性を評価し、既存のベースラインおよびプロンプトと比較する。

提案手法

  • タスクをサブタスクに分解し、それぞれのサブタスクにチェーン・オブ・ソート推論を適用する。
  • 3つのDnP手法:Clause-by-Clause DnP(CC-DnP)、Schema Linking DnP(SL-DnP)、Generate and Refine DnP(GR-DnP)。
  • 専門知識のないユーザーにも適した自然言語のみを用いたプロンプトを示す。

実験結果

リサーチクエスチョン

  • RQ1Divide-and-Prompt promptingは標準プロンプトに対してText-to-SQLの精度を改善できるか。
  • RQ2最適なDnPの実装はCC-DnP、SL-DnP、GR-DnPのどれで、どんな条件下で最も良い性能を示すか。
  • RQ3Spiderの易・難・超難のText-to-SQLタスクに対してDnPプロンプトはどう機能するか。
  • RQ4DnPの有効性には少数ショットが必須か、ゼロショットはどうか。

主な発見

MethodVA (Valid SQL %)EX (Execution Accuracy %)TS (Test-Suite Accuracy %)
Finetuned T5-3B + PICARD98.479.369.4
GRAPHIX + PICARD98.880.570.3
RESDSQL + NatSQL99.184.173.5
Rajkumar et al. (2022)91.667.055.1
Liu et al. (2023)97.770.160.1
GPT-3.5 (zero-shot)97.970.862.3
GPT-3.5 (few-shot)98.272.962.6
GPT-3.5 + normal CoT92.660.349.5
GPT-3.5 + CC-DnP97.874.363.0
GPT-3.5 + RL-DnP99.174.765.1
GPT-3.5 + GR-DnP98.675.165.4
  • DnPプロンプトは標準のゼロショット promptingより実行精度を4.3%向上させる。
  • 難易度の高いText-to-SQLタスクではGR-DnPが標準 promptingと比較してEXを最大で10.8%改善;超難タスクでは約3%の改善。
  • 通常のCoT promptingだけではSQLの厳密な構文・構造のためSQL生成で性能が低下する。
  • GR-DnPをStage-1でSL-DnP、Stage-2でリファインメントとして採用すると、少数-shot設定でGPT-3.5と強力な結果を示す。
  • ゼロショット promptingは推論ステップの実行性が限定的で、CoTベースのプロンプトの有効性を低下させる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。