Skip to main content
QUICK REVIEW

[论文解读] Finding Support Examples for In-Context Learning

Xiaonan Li, Xipeng Qiu|arXiv (Cornell University)|Feb 27, 2023
Topic Modeling被引用 7
一句话总结

该论文引入 LENS,一种两阶段的先筛选再搜索方法,用于在上下文学习(ICL)中选择任务代表性的支持示例,从而提高相对于基线和先前的核心集方法的性能。它首先使用 InfoScore 筛选出单独信息量大的样本,然后进行以多样性为导向的搜索,以找到样本的高效排列。

ABSTRACT

Additionally, the strong dependency among in-context examples makes it an NP-hard combinatorial optimization problem and enumerating all permutations is infeasible. Hence we propose LENS, a fiLter-thEN-Search method to tackle this challenge in two stages: First we filter the dataset to obtain informative in-context examples individually. Specifically, we propose a novel metric, InfoScore, to evaluate the example's in-context informativeness based on the language model's feedback, and further propose a progressive filtering process to filter out uninformative examples. Then we propose diversity-guided example search which iteratively refines and evaluates the selected example permutations, to find examples that fully depict the task. The experimental results show that LENS significantly outperforms a wide range of baselines.

研究动机与目标

  • 定义在上下文学习(ICL)中选择任务代表性支持示例的问题。
  • 提出一个两阶段方法,从带注释的数据中识别信息丰富且具有多样性的上下文示例。
  • 证明该方法在多个文本分类任务上优于基线和先前的核心集方法。
  • 分析支持示例的属性,如顺序敏感性和跨模型的可迁移性。
  • 为未来的 ICL 专门的示例选择研究提供洞见和潜在方向。

提出的方法

  • 阶段1:使用 InfoScore 筛选信息性示例,以基于语言模型反馈衡量上下文信息量。
  • 在逐步增大的数据子集上进行渐进式筛选,以高效计算 InfoScore。
  • 阶段2:以多样性为导向的示例搜索,通过带束搜索风格的过程对过滤后样本的排列进行细化和评估,并考虑多样性(s(e,E') 和 f(e))。
  • 在 GPT2-L 上评估,并对 GPT2-M、GPT2-XL、GPT-Neo-2.7B 进行迁移测试。
  • 使用一个小型验证集来引导排列选择,并通过随机打乱来缓解顺序效应。
  • 基于两阶段设计来应对 ICL 示例选择的 NP-hard 组合性质。
  • 对支持样本与真实标签的重要性进行分析。

实验结果

研究问题

  • RQ1两阶段的筛选-再搜索方法是否能够可靠地识别 ICL 的任务代表性支持示例?
  • RQ2与随机样本相比,支持示例是否降低了对上下文顺序的敏感性?
  • RQ3支持示例的真实标签与输入结构对 ICL 性能是否至关重要?
  • RQ4支持示例是否能在不同大小和预训练语料的模型之间有效迁移?
  • RQ5超参数如何影响方法的性能与鲁棒性?

主要发现

  • 在 GPT2-L 上,LENS 在多种文本分类数据集上显著优于大量基线。
  • 与随机样本相比,支持示例在不同顺序下表现更稳定。
  • 真实标签对支持示例很重要,而随机示例对标签的敏感性较低。
  • 支持示例在不同语言模型(GPT2-M、GPT2-XL、GPT-Neo-2.7B)之间具有良好的跨模型迁移性。
  • 核心集风格的梯度法在 ICL 中对随机基线的提升有限,凸显了 ICL 专门策略的必要性。
  • 两阶段方法(InfoScore 筛选 + 多样性导向的搜索)至关重要;若去掉第二阶段,性能下降,验证了在排列选择中多样性的价值。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。