[论文解读] Talking About Large Language Models
本论文主张在讨论大语言模型时使用精确的语言,明确它们是嵌入在更大系统中的强大统计序列预测器,并警惕拟人化以及对信念、知识或意识的错误归因。
Thanks to rapid progress in artificial intelligence, we have entered an era when technology and philosophy intersect in interesting ways. Sitting squarely at the centre of this intersection are large language models (LLMs). The more adept LLMs become at mimicking human language, the more vulnerable we become to anthropomorphism, to seeing the systems in which they are embedded as more human-like than they really are. This trend is amplified by the natural tendency to use philosophically loaded terms, such as "knows", "believes", and "thinks", when describing these systems. To mitigate this trend, this paper advocates the practice of repeatedly stepping back to remind ourselves of how LLMs, and the systems of which they form a part, actually work. The hope is that increased scientific precision will encourage more philosophical nuance in the discourse around artificial intelligence, both within the field and in the public sphere.
研究动机与目标
- 澄清大型语言模型在标记预测与统计分布方面真正在做什么。
- 将基础的LLM能力与它们所处的更大系统区分开来。
- 警惕将信念、知识或意识错误地归因于LLMs及相关系统。
提出的方法
- 将LLMs描述为从大规模文本语料库中学习的标记分布生成模型。
- 使用思维实验和示例来说明人类语言使用与LLM行为之间的差异。
- 讨论提示工程和系统嵌入在使基于LLM的应用成为可能中的作用。
- 分析仅LLM与具身/系统情境中的信念、知识与推理概念。
- 考察具身化与外部信息来源对给LLMs赋予心智能态的影响。
实验结果
研究问题
- RQ1基于LLM的系统真的具备信念或知识吗?
- RQ2LLMs真的会推理吗,还是只是通过提示和模式完成来模仿推理?
- RQ3将LLMs嵌入到更大系统或具身情境中如何影响对意图、信念或理解的归因?
- RQ4外部信息源与具身在将LLMs输出落地方面的局限性是什么?
- RQ5在描述LLMs及其能力时使用拟人化语言需要哪些谨慎?
主要发现
- LLMs生成词序列的统计上最可能的延续,这是它们的核心功能。
- 将LLMs嵌入到更大系统中并使用提示工程能够实现多样化的应用,而不改变底层的序列预测机制。
- 对纯粹的LLMs进行严格的拟人化(信念、知识、意识)是不恰当的,尽管整个系统可能需要不同的解释。
- 外部锚定(例如维基百科、工具)将类似信念的属性转移到更广义的系统,而非单独的模型。
- 具身化可以使系统更像人,但语言使用的依据与人类基于世界的理解不同。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。