Skip to main content
QUICK REVIEW

[논문 리뷰] Track-SQL: Enhancing Generative Language Models with Dual-Extractive Modules for Schema and Context Tracking in Multi-turn Text-to-SQL

Bingfeng Chen, Shaobin Shi|arXiv (Cornell University)|2026. 03. 06.
Topic Modeling인용 수 0
한 줄 요약

Track-SQL은 다중턴 Text-to-SQL에서 스키마를 동적으로 연결하고 맥락을 추출하기 위한 이중 추출 모듈을 도입하여 SparC와 CoSQL 데이터셋에서 최첨단 성능을 달성한다. 다중턴 실행 정확도에서 눈에 띄는 향상을 보이며, 각 구성 요소의 기여를 확인하는 제거 실험(ablation)을 제시한다.

ABSTRACT

Generative language models have shown significant potential in single-turn Text-to-SQL. However, their performance does not extend equivalently to multi-turn Text-to-SQL. This is primarily due to generative language models' inadequacy in handling the complexities of context information and dynamic schema linking in multi-turn interactions. In this paper, we propose a framework named Track-SQL, which enhances generative language models with dual-extractive modules designed to track schema and contextual changes in multi-turn Text-to-SQL. Specifically, Track-SQL incorporates a \emph{Semantic-enhanced Schema Extractor} and a \emph{Schema-aware Context Extractor}. Experimental results demonstrate that Track-SQL achieves state-of-the-art performance on the SparC and CoSQL datasets. Furthermore, detailed ablation studies reveal that Track-SQL significantly improves execution accuracy in multi-turn interactions by 7.1\% and 9.55\% on these datasets, respectively. Our implementation will be open-sourced at https://github.com/DMIRLAB-Group/Track-SQL.

연구 동기 및 목표

  • 단일 회전(Text-to-SQL) 성능이 다중 턴 대화로 확장될 때 감소하는 문제를 해결한다.
  • 진화하는 대화 맥락을 처리하기 위한 동적 스키마 연결 메커니즘을 개발한다.
  • 현재 SQL 생성을 위한 관련 이력 질의 선택을 위한 맥락 추출 모듈을 설계한다.
  • 추출기의 출력물을 SQL 생성기에 투명하게 만들어 설명 가능성을 향상시킨다.
  • ablation 연구를 통해 SparC와 CoSQL에서 최첨단 성능을 입증한다.

제안 방법

  • Track-SQL 프레임워크가 두 추출기: Semantic-enhanced Schema Extractor (SESE)와 Schema-aware Context Extractor (SACE)이라는 구성으로 제안된다.
  • SESE는 오픈 도메인 지식과 게이팅 메커니즘으로 스키마 의미를 강화하고 향상된 테이블 및 컬럼 임베딩을 생성한다.
  • SACE는 의미적 유사도(SentenceBERT) 및 스키마 사용에 대한 Jensen-Shannon 발산을 이용하여 관련 과거 SQL 질의를 검색하고 점수를 매겨 생성의 기초 프롬프트를 선택한다.
  • 추출된 스키마와 기본 SQL을 과거 질문과 결합하여 SQL 생성기 감독 학습 미세 조정을 위한 프롬프트 정보를 형성한다.
  • 질문을 연결하고 E(S)와 SQL_base를 프롬프트 맥락으로 제공하여 다turn 데이터를 단일 턴과 유사한 학습 인스턴스로 변환한다.
  • LoRA를 이용해 7B-scale 모델(CodeLlama, DeepSeek, Mistral)을 미세 조정하고 SparC 및 CoSQL 데이터셋에서 평가한다.
Figure 1: The overall framework of Dual-Extractive Modules for Schema and Context Tracking. The framework trains a schema item classification model and an SQL generator. Based on the former, we construct a Semantic-enhanced Schema Extractor and a Schema-aware Context Extractor . The extraction resul
Figure 1: The overall framework of Dual-Extractive Modules for Schema and Context Tracking. The framework trains a schema item classification model and an SQL generator. Based on the former, we construct a Semantic-enhanced Schema Extractor and a Schema-aware Context Extractor . The extraction resul

실험 결과

연구 질문

  • RQ1다이나믹 스키마 링킹을 턴 간에 어떻게 효과적으로 업데이트하여 중복 및 잘못 연결을 줄일 수 있을까?
  • RQ2맥락 인식 검색 메커니즘이 관련 과거 질의를 활용하여 다중 턴 SQL 생성을 개선할 수 있을까?
  • RQ3스키마 항목의 의미적 향상이 스키마 항목 추출 및 다운스트림 SQL 정확도에 미치는 영향은 무엇인가?
  • RQ4Track-SQL 접근법이 단일 턴과 다중 턴 설정 모두에서 SparC 및 CoSQL 벤치마크에서 최첨단 성능을 달성하는가?

주요 결과

  • Track-SQL은 이전의 컨텍스트 내 학습 및 미세 조정 방법과 비교하여 SparC 및 CoSQL 검증 세트에서 선도적 결과를 달성한다.
  • 아블레이션 연구는 SESE 또는 SACE를 제거하면 QM/IM 및 EX/TS 지표가 저하됨을 보여주며, 각 구성 요소의 기여를 확인한다.
  • SESE는 특히 CoSQL에서 스키마 추출의 중복을 크게 줄이고 위치 식별 정확도를 향상시킨다.
  • SACE는 구문 오류 점검으로 전파를 방지하는 강건한 과거 맥락 활용을 제공하여 다중 턴 SQL 생성의 안정성을 향상시킨다.
  • 전반적으로 Track-SQL은 ablation에서 SparC에서 약 7%, CoSQL에서 9.6%의 다중 턴 실행 정확도 향상을 보이고, 실시간 시스템에 적합한 엔드-투-엔드 지연 시간을 제공한다.
Figure 2: The results of the ablation study on the Codellama 7B+Track-SQL model on the SparC and CoSQL dev sets (calculated using the multi-turn TS metrics).
Figure 2: The results of the ablation study on the Codellama 7B+Track-SQL model on the SparC and CoSQL dev sets (calculated using the multi-turn TS metrics).

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.