Skip to main content
QUICK REVIEW

[论文解读] Training-Free Generative Modeling via Kernelized Stochastic Interpolants

Florentin Coeurdoux, Etienne Lempereur|arXiv (Cornell University)|Feb 23, 2026
Generative Adversarial Networks and Image Synthesis被引用 0
一句话总结

该论文提出一种训练无关的生成建模框架,使用核化随机插值器。它用有限维特征映射解决数据相关的漂移线性系统,替代神经网络训练,并采用最优扩散时间表以提高样本质量。

ABSTRACT

We develop a kernel method for generative modeling within the stochastic interpolant framework, replacing neural network training with linear systems. The drift of the generative SDE is $\hat b_t(x) = ablaϕ(x)^ opη_t$, where $η_t\in\R^P$ solves a $P imes P$ system computable from data, with $P$ independent of the data dimension $d$. Since estimates are inexact, the diffusion coefficient $D_t$ affects sample quality; the optimal $D_t^*$ from Girsanov diverges at $t=0$, but this poses no difficulty and we develop an integrator that handles it seamlessly. The framework accommodates diverse feature maps -- scattering transforms, pretrained generative models etc. -- enabling training-free generation and model combination. We demonstrate the approach on financial time series, turbulence, and image generation.

研究动机与目标

  • 用基于核的方法替代神经网络漂移学习的目标。
  • 通过预先从数据中计算漂移系数来实现训练无关的生成。
  • 引入多样的特征映射(散射变换、预训练模型)以实现灵活的生成建模。
  • 利用最优扩散时间表来界定生成误差并无缝处理端点行为。
  • 展示在时间序列、物理场和图像生成中的应用性。

提出的方法

  • 定义一个特征映射 phi: R^d -> R^P,用以近似漂移为 b_hat_t(x) = grad(phi)(x)^T eta_t。
  • 形成一个 P×P 的 Gram 矩阵系统 K_t eta_t = E[grad(phi(I_t)) · dot{I_t}] 以估计 eta_t(命题 2.1)。
  • 在生成前在时间网格上预计算 eta_t,并可用于多样本复用(算法 1)。
  • 采用最优扩散系数 D_t^* = alpha_t gamma_t / beta_t 以最小化路径 KL 发散(命题 2.2)。
  • 推导一个能够处理 D_0^*=∞ 和 D_1^*=0 的积分器,从而实现稳定生成(第 2.4 节)。
  • 允许灵活的特征映射,包括散射变换和预训练速度场,以实现训练无关的模型组合(第 2.5 节)。
Figure 1: Generation from a single S&P 500 daily log-returns realization ( $d=6{,}064$ ) using scattering features ( $P=217$ ). Top : Original (blue) and generated sample (orange), both showing volatility clustering. Bottom left : Log-return densities, with near-perfect agreement including heavy tai
Figure 1: Generation from a single S&P 500 daily log-returns realization ( $d=6{,}064$ ) using scattering features ( $P=217$ ). Top : Original (blue) and generated sample (orange), both showing volatility clustering. Bottom left : Log-return densities, with near-perfect agreement including heavy tai

实验结果

研究问题

  • RQ1在没有神经网络训练的情况下,使用有限维核表示能否准确近似随机插值中的漂移?
  • RQ2最优扩散时间表 D_t^* 在漂移估计误差下如何影响生成质量?
  • RQ3多样化的特征映射(如散射变换、预训练模型)是否能够实现训练无关的生成和模型组合?
  • RQ4核化随机插值器在真实数据模态(时间序列、湍流、图像)上的实际能力如何?

主要发现

  • 漂移估计简化为求解 P×P 线性系统,P 与数据维度无关(命题 2.1)。
  • 采用最优扩散 D_t^* 时,通过路径 KL 发散可以对生成误差进行界定,且 D_t^* 在 t=0 时趋向无穷大,在 t=1 时趋于零(命题 2.2)。
  • 一个积分器在端点奇点处不需要裁剪即可实现稳定的生成方案(第 2.4 节)。
  • 特征映射的灵活性支持训练无关的生成与跨模型组合,展示了散射变换和预训练速度场的应用(第 2.5 节)。
  • 该方法在金融时间序列、类似湍流的物理场和使用弱预训练模型集合的图像生成上得到演示(第 3.1–3.3 节)。
  • 对 MNIST 的弱模型进行集成可以在不再训练的情况下提升样本质量,理想对数似然在 P ~ 15 时达到饱和(图 3)。
  • 核化集成在从部分训练不足的组件生成的 CelebA 面孔上表现出连贯性(图 4)。
Figure 2: Generation of two-dimensional physical fields using scattering-transform features. Top row : ground-truth samples from each dataset. Bottom row : samples generated by Algorithm 1 with $K=5{,}000$ integration steps. From left to right: 3d turbulence (pressure), dark matter (log-density), 3D
Figure 2: Generation of two-dimensional physical fields using scattering-transform features. Top row : ground-truth samples from each dataset. Bottom row : samples generated by Algorithm 1 with $K=5{,}000$ integration steps. From left to right: 3d turbulence (pressure), dark matter (log-density), 3D

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。