Skip to main content
QUICK REVIEW

[论文解读] Using R formulae to test for main effects in the presence of higher-order interactions

Roger Lévy|arXiv (Cornell University)|May 8, 2014
Data Analysis with R被引用 48
一句话总结

本文提出了一种在存在高阶交互作用的情况下,使用 R 公式对因子主效应进行检验的方法,特别适用于混合效应模型。通过将因子转换为求和编码的数值对比,并比较包含与不包含主效应的嵌套模型,研究人员即使在存在交互作用的情况下也能检验主效应的显著性,从而在现代回归框架中确保正确的统计推断。

ABSTRACT

Traditional analysis of variance (ANOVA) software allows researchers to test for the significance of main effects in the presence of interactions without exposure to the details of how the software encodes main effects and interactions to make these tests possible. Now that increasing numbers of researchers are using more general regression software, including mixed-effects models, to supplant the traditional uses of ANOVA software, conducting such tests generally requires greater knowledge of how to parameterize one's statistical models appropriately. Here I present information on how to conduct such tests using R, including relevant background information and worked examples.

研究动机与目标

  • 解决在回归模型中存在高阶交互作用时检验主效应的挑战。
  • 为使用 R 的研究人员提供一种在传统 ANOVA 工具不足时,检验混合效应模型中主效应的实用方法。
  • 澄清在存在交互作用时(特别是当预测变量使用和为零对比编码时)主效应的解释。
  • 提供一种可推广、可复现的方法,通过 lme4 和 lm 中的似然比检验进行模型比较。
  • 弥合传统 ANOVA 与实验设计中现代基于回归的推断之间的差距。

提出的方法

  • 使用求和编码(contr.sum)将 K 个水平的因子 Y 转换为 K-1 个数值对比变量,以在模型中表示其主效应。
  • 构建一个简化模型,包含 Y 的对比变量及其与 X 的交互作用,但不包含 X 的主效应。
  • 构建一个完整模型,包含 X 的主效应、Y 的对比变量以及所有 X:Y 交互作用。
  • 使用似然比检验(LRT)比较简化模型与完整模型,检验统计量用于评估 X 主效应的显著性。
  • 在具有被试和项目之间交叉随机效应的线性模型(lm)和混合效应模型(lmer)中应用该方法。
  • 在混合模型中确保最大化的随机效应结构,以避免第一类错误的膨胀,包括所有固定效应的随机斜率。

实验结果

研究问题

  • RQ1当因子 X 与另一因子 Y 在回归模型中存在交互作用时,如何检验 X 的主效应?
  • RQ2在存在交互作用时,R 中正确参数化模型以检验 X 主效应的正确方法是什么?
  • RQ3为什么 X 主效应的解释依赖于 Y 的编码方式,特别是当 Y 为因子时?
  • RQ4似然比检验如何用于评估具有交叉随机效应的混合效应模型中主效应的显著性?
  • RQ5像求和编码这样的对比编码方案在存在交互作用时,如何确保主效应解释的有效性?

主要发现

  • 在混合效应模型中,比较不含 X 主效应的模型与含 X 主效应的模型的似然比检验显示,主效应不显著(p = 0.752),表明没有证据支持 X 的主效应存在。
  • 在线性模型示例中,X 主效应的 F 检验结果不显著(F = 0.845,p = 0.367),与 LRT 结果一致。
  • 当使用 aov() 时,该方法成功复现了传统的 ANOVA 结果,证实了其在标准设计中的有效性。
  • 使用求和编码(contr.sum)可确保 X 的主效应表示 Y 所有水平上的平均效应,这正是预期的解释。
  • 该方法在模型类型上具有鲁棒性,包括具有被试和项目之间交叉随机效应的固定效应和混合效应模型。
  • 本文表明,当 Y 未被中心化或未使用求和对比编码时,X 的主效应并不等同于其边际效应,凸显了正确对比编码的重要性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。