[论文解读] On Disentangled Representations Learned From Correlated Data
这篇论文研究了最先进的无监督解缠方法在解缠相关真实因素方面的失败,并分析如何通过弱监督或事后纠正来解决潜在纠缠。
The focus of disentanglement approaches has been on identifying independent factors of variation in data. However, the causal variables underlying real-world observations are often not statistically independent. In this work, we bridge the gap to real-world scenarios by analyzing the behavior of the most prominent disentanglement approaches on correlated data in a large-scale empirical study (including 4260 models). We show and quantify that systematically induced correlations in the dataset are being learned and reflected in the latent representations, which has implications for downstream applications of disentanglement such as fairness. We also demonstrate how to resolve these latent correlations, either using weak supervision during training or by post-hoc correcting a pre-trained model with a small number of labels.
研究动机与目标
- 评估当训练数据中的真实因素相关时,现代解缠学习者的表现。
- 量化诱导的相关性如何在潜在表征中体现并影响下游任务(如公平性)。
- 研究通过弱监督或少量标签实现潜在相关性的解决方法(或后验对齐)。
- 在相关性改变下,评估解缠表示的泛化和OOD行为。
提出的方法
- 在受控相关数据集(Shapes3D、dSprite、MPI3D)上训练4260个基于VAE的模型(β-VAE、FactorVAE、AnnealedVAE、DIP-VAE、β-TCVAE)。
- 在因子之间引入带高斯噪声的成对相关性,并使用可变强度σ来研究对解缠的影响。
- 使用潜在空间分析(DCI、梯度提升树的特征重要性)来量化相关因子之间的纠缠程度。
- 通过基于成对互信息的公平性度量评估下游的不公平性。
- 在少量标签下进行事后快速适应,以使解缠潜在编码与真实因子对齐。
- 评估弱监督的Ada-GVAE风格方法及在相关性下对解缠的影响。
实验结果
研究问题
- RQ1在训练数据存在真实因素相关时,基于因子化的归纳偏差在无监督解缠中是否足够?
- RQ2训练数据中的相关性如何影响潜在纠缠和与公平相关的测量?
- RQ3是否可以通过最小化监督或事后纠正来解决纠缠的潜在空间?
- RQ4在相关数据上学习的模型是否对分布外的因子组合具有泛化能力?
- RQ5在相关性条件下,哪些实用策略(弱监督、事后对齐)能改善解缠?
主要发现
- 解缠方法无法将相关因子解缠开;潜在维度沿主要相关线纠缠,同时也沿正交的次要轴产生纠缠。
- 较强的相关性(较低的σ)在潜在空间中导致相关视野(FoV)的成对纠缠度提高。
- 当受保护属性与其他FoV相关时,无监督解缠表现出更高的不公平性,且相关性越强不公平性越明显。
- 尽管存在纠缠,模型仍能通过外推潜在结构对OOD组合进行泛化;解码器对未见因子对能产生有意义的重建。
- 弱监督或少量标签的后验对齐可以恢复因子化的潜在编码,通常实现几乎完美的解缠并降低不公平性。
- 在Shapes3D中,使用仅100个标签的快速适应即可显著降低相关条件下的成对纠缠。
- 在所测试的数据集中,弱监督在解缠和公平性方面优于无监督基线。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。