[论文解读] TIACam: Text-Anchored Invariant Feature Learning with Auto-Augmentation for Camera-Robust Zero-Watermarking
TIACam 通过文本引导的不变特征与可微分自增强实现相机鲁棒的零水印,获得在现实畸变下的水印回收的最优性能。
Camera recapture introduces complex optical degradations, such as perspective warping, illumination shifts, and Moiré interference, that remain challenging for deep watermarking systems. We present TIACam, a text-anchored invariant feature learning framework with auto-augmentation for camera-robust zero-watermarking. The method integrates three key innovations: (1) a learnable auto-augmentor that discovers camera-like distortions through differentiable geometric, photometric, and Moiré operators; (2) a text-anchored invariant feature learner that enforces semantic consistency via cross-modal adversarial alignment between image and text; and (3) a zero-watermarking head that binds binary messages in the invariant feature space without modifying image pixels. This unified formulation jointly optimizes invariance, semantic alignment, and watermark recoverability. Extensive experiments on both synthetic and real-world camera captures demonstrate that TIACam achieves state-of-the-art feature stability and watermark extraction accuracy, establishing a principled bridge between multimodal invariance learning and physically robust zero-watermarking.
研究动机与目标
- 在相机诱发畸变(透视、光照、莫尔条纹)下保持不可察觉性的同时推动鲁棒的零水印。
- 开发一个统一框架,联合学习不变表示和带文本锚的语义对齐。
- 在不修改图像像素的前提下,将二进制水印绑定到不变特征空间,并在真实世界捕获中实现可靠提取。
提出的方法
- 引入一个带可微分几何、光度、噪声、滤波、压缩和莫尔畸变模块的学习型自增强器。
- 使用文本锚定的不变特征学习器,通过对抗训练与鉴别器实现图像与文本表示的跨模态对齐。
- 利用一个零水印头将二进制水印信息绑定到不变特征空间,而不改变图像像素。
- 在自增强器与不变特征提取器之间建立对抗循环,以最大化特征的不变性同时保留语义内容。
- 采用基于 CLIP 的架构,其中一个冻结的图像编码器与一个可训练的不变提取器共同生成鲁棒特征,并由跨模态鉴别器监督。
- 利用一个小型可学习的码本和投影头完成水印的登记与提取,使从畸变图像中实现逐比特的水印回收。
实验结果
研究问题
- RQ1如何学习对相机鲁棒、语义保持的图像表示以实现零水印?
- RQ2一个可微分自增强器能否发现现实相机风格的畸变来挑战不变性,特征提取器能否对抗它们?
- RQ3文本引导的跨模态对齐是否能提升在真实世界捕获中水印提取的鲁棒性?
主要发现
- TIACam 在叠加、光度、透视、JPEG、莫尔条纹以及滤波等畸变下实现高度不变性,在原始特征与畸变特征之间的余弦相似度方面明显优于 SimCLR、BYOL、Barlow Twins、VICReg 和 VIbCReg。
- 在畸变综合情形(All),TIACam 保持强不变性,正样本对相似度平均约为 98%,负样异分离约为 -47%。
- 在语义迁移测试中,TIACam 使用冻结特征上的线性探针在 CIFAR-100、Imagenette、MSCOCO 和 Caltech-256 上获得顶级的 Top-1 和 Top-5 精度。
- 对于真实世界的相机畸变,TIACam 在屏幕-相机和打印-相机场景中实现近乎完美的水印提取(例如屏幕-相机的 30/100 位分别为 99.1%/98.2%),并在截图场景中也表现出鲁棒性(例如 97.4%/95.2%)。
- 消融实验表明,TIACam 的不变性提升在多数据集上相对于仅使用 CLIP 的基线提升了约 13–15% 的余弦相似度,验证了不变特征学习框架的收益。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。