Skip to main content
QUICK REVIEW

[论文解读] A Survey on Prompting Techniques in LLMs

Prabin Bhandari|arXiv (Cornell University)|Nov 28, 2023
Topic Modeling被引用 2
一句话总结

本文对自回归大语言模型(LLMs)的提示工程技术进行了全面综述,将现有方法分类为结构化分类法,并识别出关键挑战,如结构化数据处理、答案工程和提示注入攻击。研究表明,提示工程可在无需微调的情况下实现有效的零样本或少样本推理,但在鲁棒性、泛化能力和安全性方面仍存在重大开放问题。

ABSTRACT

Autoregressive Large Language Models have transformed the landscape of Natural Language Processing. Pre-train and prompt paradigm has replaced the conventional approach of pre-training and fine-tuning for many downstream NLP tasks. This shift has been possible largely due to LLMs and innovative prompting techniques. LLMs have shown great promise for a variety of downstream tasks owing to their vast parameters and huge datasets that they are pre-trained on. However, in order to fully realize their potential, their outputs must be guided towards the desired outcomes. Prompting, in which a specific input or instruction is provided to guide the LLMs toward the intended output, has become a tool for achieving this goal. In this paper, we discuss the various prompting techniques that have been applied to fully harness the power of LLMs. We present a taxonomy of existing literature on prompting techniques and provide a concise survey based on this taxonomy. Further, we identify some open problems in the realm of prompting in autoregressive LLMs which could serve as a direction for future research.

研究动机与目标

  • 为自回归大语言模型的提示工程技术提供系统化的分类法。
  • 以结构化、有序的方式综述现有提示方法的文献。
  • 识别提示技术中的开放问题,包括处理结构化输入、改进答案提取以及缓解提示注入攻击。
  • 通过阐明关键挑战和提示技术在大语言模型中的潜在研究方向,为未来研究提供指导。

提出的方法

  • 本文基于输入格式、指令风格和任务类型,构建了提示工程技术的分类法。
  • 对各类提示方法进行了综述,包括零样本、少样本、思维链(chain-of-thought)和前缀调优(prefix-tuning)方法。
  • 分析聚焦于提示如何在不进行微调的情况下引导自回归大语言模型生成期望输出。
  • 通过其在下游自然语言处理任务(如分类、生成和推理)中的有效性,评估提示技术。
  • 探讨了通过提示技术处理结构化数据(如表格、图)的最新进展,包括GraphPrompt和表格到文本的提示方法。
  • 讨论了使用辅助模型检测提示注入攻击的方法,并提出了基于大语言模型的检测器作为防御策略。

实验结果

研究问题

  • RQ1如何系统性地对提示工程技术进行分类,以反映其在自回归大语言模型中的功能与结构差异?
  • RQ2当前提示方法在处理表格、图或树等结构化输入时存在哪些主要局限性?
  • RQ3当大语言模型生成冗长或模糊输出时,如何提升生成答案的可靠性和准确性?
  • RQ4提示注入攻击在多大程度上可以绕过已部署的大语言模型中的安全机制?
  • RQ5在提升鲁棒性、泛化能力和安全性方面,未来提示技术研究最具前景的方向是什么?

主要发现

  • 提示工程已取代微调,成为在下游任务中部署大语言模型的主导范式,可在几乎无需或完全无需微调的情况下实现零样本或少样本推理。
  • 大语言模型中出现的新兴能力(如上下文学习)源于模型规模,且可通过结构化提示有效激发,即使不更新模型参数。
  • 当前提示方法在处理结构化数据方面仍存在困难:尽管存在如GraphPrompt等方法,但通常需要预训练,限制了实际应用。
  • 答案工程仍是主要挑战,因为大语言模型常生成非精确或模糊的输出,需依赖任务特定的后处理技术(如正则表达式或同义词匹配)。
  • 提示注入攻击可通过微妙的提示工程绕过安全机制,表明当前防御措施脆弱,亟需更强健、自适应的解决方案。
  • 本文识别出对可泛化、鲁棒的提示框架的迫切需求,以应对多样化输入格式,提升答案可靠性,并抵御对抗性操纵。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。