[论文解读] On the Existence of Tacit Assumptions in Contextualized Language Models
本文研究上下文语言模型是否通过心理学期刊研究中提取的概念关联,捕捉到刻板印象隐性假设(STAs)——即关于概念的隐性、通用信念。实验结果表明,模型能有效检索相关概念,为STAs通过大规模语料的弱监督暴露被编码提供了实证证据。
Humans carry stereotypic tacit assumptions (STAs) (Prince, 1978), or propositional beliefs about generic concepts. Such associations are crucial for understanding natural language. We construct a diagnostic set of word prediction prompts to evaluate whether recent neural contextualized language models trained on large text corpora capture STAs. Our prompts are based on human responses in a psychological study of conceptual associations. We find models to be profoundly effective at retrieving concepts given associated properties. Our results demonstrate empirical evidence that stereotypic conceptual representations are captured in neural models derived from semi-supervised linguistic exposure.
研究动机与目标
- 调查神经语言模型是否从大规模语料中隐式学习刻板印象隐性假设(STAs)
- 评估STAs——关于概念的无意识、通用信念——是否被编码进上下文语言模型
- 基于人类提供的概念关联,开发一种诊断框架以探测模型表征
- 提供实证证据,证明通过弱监督语言暴露,神经模型可获得刻板印象概念知识
提出的方法
- 基于心理学研究中人类回答的概念关联,设计一组用于单词预测的诊断提示
- 利用这些提示测试语言模型是否能预测语义相关概念,从而反映STAs
- 在诊断提示上训练并评估上下文语言模型,以评估其检索概念相关词汇的能力
- 将模型预测结果与人类提供的关联进行对比,以衡量其与刻板印象概念表征的一致性
- 采用标准化评估协议,量化不同模型架构中STA捕捉的程度
实验结果
研究问题
- RQ1上下文语言模型是否捕捉到源自人类概念关联的刻板印象隐性假设(STAs)?
- RQ2模型在单词预测任务中在多大程度上复现了人类的概念关联?
- RQ3模型中STAs的获取是否可归因于对大规模语料的弱监督暴露?
- RQ4模型在不同概念领域中对STAs的泛化能力如何?
主要发现
- 模型在诊断提示中检索概念相关词汇方面表现出高度有效性,表明其与人类提供的关联高度一致
- 结果为通过大规模语料暴露,神经模型中捕捉到刻板印象概念表征提供了实证证据
- 模型表现表明,STAs并非仅仅是统计共现,而是反映了更深层次的概念编码
- 诊断框架成功识别并度量了语言模型中STAs的存在,提供了一种可靠的评估方法
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。