QUICK REVIEW

[论文解读] Human few-shot learning of compositional instructions

Brenden M. Lake, Tal Linzen|arXiv (Cornell University)|Jan 14, 2019

Speech and dialogue systems参考文献 28被引用 27

一句话总结

本文研究了人类在序列到序列（seq2seq）框架下，通过伪词和彩色圆圈输出，对组合性指令进行少样本学习的过程。参与者仅通过两个示例便学会了新的功能概念，能系统性地推广到新输入，并表现出三种关键归纳偏置——互斥性、一一对应映射和形象串联——从而实现鲁棒的组合性，而当前最先进循环神经网络无法复现此能力。

ABSTRACT

People learn in fast and flexible ways that have not been emulated by machines. Once a person learns a new verb "dax," he or she can effortlessly understand how to "dax twice," "walk and dax," or "dax vigorously." There have been striking recent improvements in machine learning for natural language processing, yet the best algorithms require vast amounts of experience and struggle to generalize new concepts in compositional ways. To better understand these distinctively human abilities, we study the compositional skills of people through language-like instruction learning tasks. Our results show that people can learn and use novel functional concepts from very few examples (few-shot learning), successfully applying familiar functions to novel inputs. People can also compose concepts in complex ways that go beyond the provided demonstrations. Two additional experiments examined the assumptions and inductive biases that people make when solving these tasks, revealing three biases: mutual exclusivity, one-to-one mappings, and iconic concatenation. We discuss the implications for cognitive modeling and the potential for building machines with more human-like language learning capabilities.

研究动机与目标

研究人类如何从极少示例中学习并泛化新型组合性语言类指令。
识别支持人类语言学习中类人系统性组合性的认知归纳偏置。
将人类在少样本 seq2seq 指令学习任务中的表现与现代循环神经网络进行比较。
考察人类学习者在从极少量数据泛化时，是否应用一致且结构化的假设（例如互斥性、形象串联）。
探讨这些人类偏置对构建更具人类特征、可泛化机器学习模型的启示。

提出的方法

参与者在少样本 seq2seq 任务中接受训练，其中输入序列由伪词构成，输出序列由彩色圆圈组成。
任务设计旨在最小化对自然语言知识的依赖，使用新符号和抽象输出以隔离组合性学习。
实验采用受控的伪词分配和跨参与者的随机映射，以确保结果的普遍性。
参与者在训练中未见过的新组合上接受测试，包括更长的序列和已知组件的新组合。
通过分析错误和响应模式，推断潜在的归纳偏置，如互斥性、一一对应映射和形象串联。
最后一项实验检验了这些偏置是否在数据暴露前即已存在，从而确认其作为学习中先验假设的作用。

实验结果

研究问题

RQ1人类能否仅通过两个训练示例学习并泛化新型组合性指令？
RQ2支撑人类在少样本 seq2seq 指令学习任务中泛化的认知归纳偏置是什么？
RQ3人类表现及归纳偏置与当前最先进循环神经网络在相同任务上的表现相比如何？
RQ4互斥性、一一对应映射和形象串联在多大程度上塑造了人类对新型语言类指令的解释？
RQ5能否将这些人类习得的偏置用于提升 seq2seq 任务中机器学习模型的泛化能力？

主要发现

参与者成功将新型指令泛化到未见过的组合上，例如将已学习的功能应用于新输入（如将'dax'解释为'dax twice'），表现出系统性组合性。
79.3% 的参与者遵循形象串联偏置，为每个输入词分配一致的输出序列并保持输入顺序。
在遵循形象串联偏置的参与者中，95.7% 同时遵守互斥性，为每个输入词分配唯一的输出序列。
尽管任务高度不确定，仍有 58.6% 的参与者表现出全部三种归纳偏置的一致性：互斥性、一一对应映射和形象串联。
相比之下，标准循环神经网络无法泛化到新组合（例如在仅见过'jump'的情况下无法处理'jump twice'），凸显了当前深度学习模型的关键局限。
这些归纳偏置并非从数据中学到，而是在暴露前即已存在，表明其在人类语言学习中作为强有力的先验约束。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。