Skip to main content
QUICK REVIEW

[论文解读] Towards Anytime-Valid Statistical Watermarking

Baihe Huang, Zhongcong Xu|arXiv (Cornell University)|Feb 19, 2026
Advanced Steganography and Watermarking Techniques被引用 0
一句话总结

本论文提出了 Anchored E-Watermarking,证明基于 e 值的水印检测比基线在检测效率方面更优,同时维持文本质量并实现更快检测的随时有效推断。

ABSTRACT

The proliferation of Large Language Models (LLMs) necessitates efficient mechanisms to distinguish machine-generated content from human text. While statistical watermarking has emerged as a promising solution, existing methods suffer from two critical limitations: the lack of a principled approach for selecting sampling distributions and the reliance on fixed-horizon hypothesis testing, which precludes valid early stopping. In this paper, we bridge this gap by developing the first e-value-based watermarking framework, Anchored E-Watermarking, that unifies optimal sampling with anytime-valid inference. Unlike traditional approaches where optional stopping invalidates Type-I error guarantees, our framework enables valid, anytime-inference by constructing a test supermartingale for the detection process. By leveraging an anchor distribution to approximate the target model, we characterize the optimal e-value with respect to the worst-case log-growth rate and derive the optimal expected stopping time. Our theoretical claims are substantiated by simulations and evaluations on established benchmarks, showing that our framework can significantly enhance sample efficiency, reducing the average token budget required for detection by 13-15% relative to state-of-the-art baselines.

研究动机与目标

  • 说明需要能够进行随时有效推断和灵活停止的水印方法的动机。
  • 提出 Anchored E-Watermarking,以在保持生成质量的同时提高检测效率。
  • 从理论上证明最优 e 值框架及其对停止时间的影响。
  • 在真实世界语言模型上与基线进行经验比较并报告效率提升。

提出的方法

  • 提出 Anchored E-Watermarking,这是一个使用 e 值而非 p 值进行水印检测的框架。
  • 推导并表征关于最坏情形对数增长率的最优 e 值。
  • 为证明水印设计,形式化一个关于分布与传输计划的最坏情况优化。
  • 在对扰动和私钥的情况下,实证评估检测效率和生成质量,与基线(如 SEAL)进行比较。
  • 强调该方法使随时有效推断成为可能,而不牺牲效用。

实验结果

研究问题

  • RQ1e 值是否能够为水印检测提供有效的可选停止保证而不扩大第一类错误?
  • RQ2与基线方法相比,Anchored E-Watermarking 是否提高检测效率并维持生成质量?
  • RQ3在最坏条件下,理论最优的 e 值及相应的停止时间是多少?
  • RQ4在真实世界语言模型中,该方法在不同扰动和私钥下的表现如何?

主要发现

SchemeQuality (↑)Size (↓)
Exponential0.907
Inverse Transform0.917734.0
Binary0.919
Distribution Shift0.912145.0
SEAL0.90184.5
LABEL:thm:log-growth0.91972.0
  • Anchored E-Watermarking 在检测效率方面显著优于基线,同时维持高生成质量。
  • 在与最佳非锚定基线相比,速度提升近 2×(从 145 词元到 72.0 词元)。
  • 所提方法的质量分数与基线相比保持竞争力,显示检测性与实用性之间的良好权衡。
  • 该框架实现了随时有效推断,解决了基于传统 p 值检验的固定时界限制。
  • 在真实世界语言模型上的实证结果显示在保持文本质量的前提下获得显著的效率提升。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。