QUICK REVIEW

[論文レビュー] ReFuGe: Feature Generation for Prediction Tasks on Relational Databases with LLM Agents

Kyungho Kim, Do Geon Lee|arXiv (Cornell University)|Jan 25, 2026

Data Quality and Management被引用数 0

ひとこと要約

エージェント主導のフレームワーク（ReFuGe）は、関連スキーマを特定し、多様な関係特徴を生成し、推論と検証を通じてそれらをフィルタリングし、予測性能が収束するまで反復することで、複数のRDB予測タスクでベースラインを上回る。

ABSTRACT

Relational databases (RDBs) play a crucial role in many real-world web applications, supporting data management across multiple interconnected tables. Beyond typical retrieval-oriented tasks, prediction tasks on RDBs have recently gained attention. In this work, we address this problem by generating informative relational features that enhance predictive performance. However, generating such features is challenging: it requires reasoning over complex schemas and exploring a combinatorially large feature space, all without explicit supervision. To address these challenges, we propose ReFuGe, an agentic framework that leverages specialized large language model agents: (1) a schema selection agent identifies the tables and columns relevant to the task, (2) a feature generation agent produces diverse candidate features from the selected schema, and (3) a feature filtering agent evaluates and retains promising features through reasoning-based and validation-based filtering. It operates within an iterative feedback loop until performance converges. Experiments on RDB benchmarks demonstrate that ReFuGe substantially improves performance on various RDB prediction tasks. Our code and datasets are available at https://github.com/K-Kyungho/REFUGE.

研究の動機と目的

RDBの予測タスクにおけるリレーショナルスキーマから自動的かつ情報に基づく特徴生成の必要性を動機づける。
スキーマ選択、特徴生成、特徴フィルタリングのエージェントを備えたエージェント主導フレームワーク（ReFuGe）を提案する。
グラウンドトゥルースの監督なしでの反復的なフィードバック駆動の改善と自己学習を実証する。
実世界の複数のRDBベンチマークでReFuGeを評価し有効性を確立する。
関係特徴が予測性能を向上させる時期と方法に関するガイドラインと洞察を提供する。

提案手法

スキーマ選択エージェントはRDBスキーマとタスク説明から関連するテーブルと列を特定する。
特徴生成エージェントは複数のLLMインスタンスを活用して多様な候補関係特徴を作成し、バリエーションを促進する。
推論ベースの特徴フィルタリングは意味的推論と前回の反復を補強して有望な特徴を選択する。
検証ベースの特徴フィルタリングは対象テーブルに特徴を一時的に追加し、実際の有用性をAUROCなどで経験的に評価する。
前の反復から自然言語によるフィードバックを受け取る反復的なフィードバックループを通じて、将来の特徴生成と選択を導き、新しい特徴が選択されなくなるまで停止する。

実験結果

リサーチクエスチョン

RQ1ReFuGeは多様なデータセットに対するRDB予測タスクで最先端のベースラインと比較してどうか。
RQ2各主要コンポーネント（スキーマ選択、特徴フィルタリング、反復的フィードバック）が全体性能にどの程度寄与しているか。
RQ3反復的なフィードバック駆動ループは一貫して予測性能を向上させるか。
RQ4実務的な代表的な特徴は実践的には何か（ケーススタディ）？

主な発見

ReFuGeはほとんどのタスクで全ベースラインを上回り、7データセットで平均性能と平均順位の最良を達成。
アブレーション研究では各コンポーネントが性能に寄与することが示され、スキーマ選択、フィルタリング、またはフィードバックを削除すると結果が劣化し、特に特徴フィルタリングの影響が大きい。
反復ごとに性能が一般的に向上し、収束前のタスクあたり平均2.4回の反復を達成。
関連テーブルから派生した特徴（例：クリックされた広告の別個性、地理的階層レベルなど）が大幅な改善をもたらすケーススタディを示す。
特徴生成エージェントにおけるLLMインスタンス数を増やすと、タスク全体での性能向上傾向が見られる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。