Skip to main content
QUICK REVIEW

[論文レビュー] Towards Anytime-Valid Statistical Watermarking

Baihe Huang, Zhongcong Xu|arXiv (Cornell University)|Feb 19, 2026
Advanced Steganography and Watermarking Techniques被引用数 0
ひとこと要約

本論文はAnchored E-Watermarkingを提案し、e-valueベースのウォーターマーキングが検出効率をベースラインより改善しつつテキスト品質を維持し、より高速な検出でanytime-valid推論を可能にすることを示す。

ABSTRACT

The proliferation of Large Language Models (LLMs) necessitates efficient mechanisms to distinguish machine-generated content from human text. While statistical watermarking has emerged as a promising solution, existing methods suffer from two critical limitations: the lack of a principled approach for selecting sampling distributions and the reliance on fixed-horizon hypothesis testing, which precludes valid early stopping. In this paper, we bridge this gap by developing the first e-value-based watermarking framework, Anchored E-Watermarking, that unifies optimal sampling with anytime-valid inference. Unlike traditional approaches where optional stopping invalidates Type-I error guarantees, our framework enables valid, anytime-inference by constructing a test supermartingale for the detection process. By leveraging an anchor distribution to approximate the target model, we characterize the optimal e-value with respect to the worst-case log-growth rate and derive the optimal expected stopping time. Our theoretical claims are substantiated by simulations and evaluations on established benchmarks, showing that our framework can significantly enhance sample efficiency, reducing the average token budget required for detection by 13-15% relative to state-of-the-art baselines.

研究の動機と目的

  • anytime-valid推論と柔軟な停止を可能にするウォーターマーキング手法の必要性を動機づける。
  • 生成品質を保ちつつ検出効率を向上させるAnchored E-Watermarkingを提案する。
  • 最適なe-valueフレームワークと停止時間への影響を理論的に正当化する。
  • 実世界の言語モデルを用いたベースラインとの系統的比較を行い、効率改善を報告する。

提案手法

  • p値の代わりにe値を用いるウォーターマーク検出フレームワークとしてAnchored E-Watermarkingを提案する。
  • worst-caseの対数成長率に関して最適なe値を導出・特徴づける。
  • ウォーターマーキング設計を正当化するため、分布と輸送計画のworst-case最適化を定式化する。
  • 摂動と秘密鍵の組み合わせを横断したベースライン(例:SEAL)と比較して検出効率と生成品質を実証的に評価する。
  • このアプローチがutilityを損なうことなくanytime-valid推論を可能にすることを強調する。

実験結果

リサーチクエスチョン

  • RQ1e値はウォーターマーク検出に対してType-Iエラーの膨張を伴わずに有効な選択停止保証を提供できるか?
  • RQ2Anchored E-Watermarkingは検出効率を改善し生成品質をベースラインと比較して維持できるか?
  • RQ3worst-case条件下で理論的な最適e値と対応する停止時刻はどうなるか?
  • RQ4実世界の言語モデルにおいて異なる摂動と秘密鍵の下で提案手法はどのように機能するか?

主な発見

SchemeQuality (↑)Size (↓)
Exponential0.907
Inverse Transform0.917734.0
Binary0.919
Distribution Shift0.912145.0
SEAL0.90184.5
LABEL:thm:log-growth0.91972.0
  • Anchored E-Watermarkingは検出効率でベースラインを大幅に上回りつつ高い生成品質を維持する。
  • 最良の非アンカー基準と比較して約2×の速度向上(145トークンから72.0トークンへ)を達成。
  • 提案手法の品質スコアはベースラインと競合的であり、検出性と有用性のトレードオフが好ましいことを示す。
  • このフレームワークはanytime-valid推論を可能にし、従来のp値ベース検定の固定ホライズン制限を解消する。
  • 実世界の言語モデルでの実証結果は、テキスト品質を維持しつつ大幅な効率向上を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。