QUICK REVIEW

[论文解读] Context-free Self-Conditioned GAN for Trajectory Forecasting

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro|arXiv (Cornell University)|Mar 9, 2026

Autonomous Vehicle Technology and Safety被引用 0

一句话总结

论文提出一种无上下文的自监督条件GAN，从2D轨迹中学习多种运动模式，并在 THÖR 和 Argoverse 数据集上提升预测，特别是对样本最少的标签效果明显。

ABSTRACT

In this paper, we present a context-free unsupervised approach based on a self-conditioned GAN to learn different modes from 2D trajectories. Our intuition is that each mode indicates a different behavioral moving pattern in the discriminator's feature space. We apply this approach to the problem of trajectory forecasting. We present three different training settings based on self-conditioned GAN, which produce better forecasters. We test our method in two data sets: human motion and road agents. Experimental results show that our approach outperforms previous context-free methods in the least representative supervised labels while performing well in the remaining labels. In addition, our approach outperforms globally in human motion, while performing well in road agents.

研究动机与目标

在无上下文轨迹预测中激发学习多样化运动模式的动机。
利用自条件GAN揭示判别器特征中的簇化模态。
开发训练设置，利用所学模态来降低主导性偏差并提升对代表性不足行为的预测。
在人体运动（THÖR）和道路参与者（Argoverse）数据集上展示预测改进。
提供对簇的洞察以及用于 THÖR 的预处理工具。

提出的方法

训练一个GAN，其中G以观测轨迹X为条件并对z采样以预测Ŷ；D区分真实的(X⊕Y)与伪造的(X⊕Ŷ)。
提取判别器特征，对它们进行聚类以得到表示数据子空间的模态m。
使用自条件GAN获得模态信息化的训练信号；以X和m为条件生成Ŷ。
引入三种训练设置，根据簇化难度对生成器损失和批量采样进行加权（wL2、wB，以及wL2+wB）。
形成双重目标：建模多样化运动模态并通过利用簇信息条件来提升预测。
通过网格搜索确定最佳簇数（k-Means）：THÖR取13，Argoverse取19。

实验结果

研究问题

RQ1无上下文方法是否能从轨迹中学习到不同的运动模态而无需上下文特征？
RQ2以模态感知的自条件GAN训练设置是否能改善对较少代表性行为的预测？
RQ3所学习的簇与人体与道路参与者数据中的真实运动模式有何关系？
RQ4加权和采样策略对模态覆盖和预测准确性有何影响？
RQ5自条件GAN方法是否能与使用真实模态标签的理想条件设定相比？

主要发现

数据集	标签（样本数）	LSTM	CF VAN GAN	CF VAN GAN + wL2	CF VAN GAN + wB	CF VAN GAN + wL2 + wB
THÖR workers	(413)	0.695	1.064	0.642±0.006	1.033±0.005	0.644±0.012	1.044±0.028	0.625±0.009 1.006±0.019
THÖR visitors	(1379)	0.664	1.139	0.660±0.001	1.105±0.090	0.657±0.003	1.107±0.007	0.668±0.005 1.124±0.018
THÖR inspector	(260)	0.796	1.582	0.735±0.007	1.474±0.019	0.736±0.008	1.473±0.013	0.729±0.013 1.476±0.049
Argoverse others	(526)	1.864	3.029	1.815±0.031	2.969±0.034	1.799±0.007	2.944±0.022	1.801±0.027 2.919±0.032
Argoverse av	(2600)	1.512	2.278	1.467±0.007	2.269±0.023	1.482±0.009	2.292±0.010	1.480±0.003 2.282±0.006
Argoverse agent	(2600)	2.371	4.690	2.349±0.012	4.654±0.016	2.362±0.013	4.700±0.029	2.368±0.020 4.721±0.044

提出的自条件GAN及wL2、wB或两者结合在ADE/FDE上优于基线的无上下文方法，尤其在代表性最少的标签上表现突出。
在THÖR中，该方法在工人和检查员类别上的ADE/FDE优于基线；在Argoverse中，对较少代表的类别有改进。
表I显示，在THÖR和Argoverse的若干带标签组上， Vanilla GAN 搭配 wB 或 wL2+wB 的表现优于基线。
表II显示更困难（簇更小）的聚类产生更差的ADE/FDE，但所提出的训练设置在这些挑战性簇中仍优于基线。
表III报道总体上，该方法提升了THÖR的指标，在Argoverse上也取得具竞争力的结果，尤其是对较少代表的轮廓。
自条件GAN的聚类提供了有意义的无监督标签，当用作条件时，虽然使条件GAN的性能下限低于理想条件，但仍能提升结果。
定性分析表明，非支配簇捕捉了更复杂的轨迹，模型对真实轨迹的吻合度更高。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。