QUICK REVIEW

[論文レビュー] CRoSS: Diffusion Model Makes Controllable, Robust and Secure Image Steganography

Jiwen Yu, Xuanyu Zhang|arXiv (Cornell University)|May 26, 2023

Advanced Steganography and Watermarking Techniques被引用数 27

ひとこと要約

CRoSS は deterministic DDIM inversion を conditional diffusion models と組み合わせて、プロンプト/LoRAs/ControlNets からの秘密/public キーを活用し、追加訓練なしでカバーレス、制御可能、堅牢、かつ安全な画像ステガノグラフィを実現します。

ABSTRACT

Current image steganography techniques are mainly focused on cover-based methods, which commonly have the risk of leaking secret images and poor robustness against degraded container images. Inspired by recent developments in diffusion models, we discovered that two properties of diffusion models, the ability to achieve translation between two images without training, and robustness to noisy data, can be used to improve security and natural robustness in image steganography tasks. For the choice of diffusion model, we selected Stable Diffusion, a type of conditional diffusion model, and fully utilized the latest tools from open-source communities, such as LoRAs and ControlNets, to improve the controllability and diversity of container images. In summary, we propose a novel image steganography framework, named Controllable, Robust and Secure Image Steganography (CRoSS), which has significant advantages in controllability, robustness, and security compared to cover-based image steganography methods. These benefits are obtained without additional training. To our knowledge, this is the first work to introduce diffusion models to the field of image steganography. In the experimental section, we conducted detailed experiments to demonstrate the advantages of our proposed CRoSS framework in controllability, robustness, and security.

研究の動機と目的

セキュリティ、制御性、堅牢性の観点で、既存の画像ステガノグラフィの制約を特定する。
カバーレスステガノグラフィのための可逆的な画像翻訳を実現する拡散モデルベースのフレームワークを提案する。
CRoSS が従来手法よりもセキュリティ、制御性、堅牢性を向上させることを示す。
プロンプト、LoRAs、ControlNets がコンテナ内容を制御する鍵として機能する方法を示す。
さまざまな劣化や攻撃下での性能を評価する。

提案手法

決定論的 DDIM サンプリングを用いた条件付き拡散モデル（Stable Diffusion v1.5）を採用する。
DDIM Inversion を使用して秘密画像とコンテナ画像の間で可逆的な画像翻訳を作成し、カバーレスステガノグラフィを可能にする。
隠す/露出プロセスを、秘密画像 x_sec とコンテナ画像 x_cont の間の前方/後方翻訳として、秘密鍵/公開鍵 (k_pri, k_pub) を用いて定義する。
鍵をプロンプト、LoRAs、または ControlNets を介して表現し、コンテナ内容を制御し露出性を保護する。
Hide (x_noise = ODESolve(x_sec; εθ, k_pri, 0, T); x_cont = ODESolve(x_noise; εθ, k_pub, T, 0)) および Reveal (x′_noise = ODESolve(x′_cont; εθ, k_pub, 0, T); x_rev = ODESolve(x′_noise; εθ, k_pri, T, 0)) のアルゴリズムを提供する。
SIDベースの検出器を用いたステガノ分析によるセキュリティ評価と NIQE 指標、プロンプト/ControlNets/LoRAs を用いた制御性評価、Gaussian/JPEG 劣化および実世界チャネルによるロバスト性評価を行う。

実験結果

リサーチクエスチョン

RQ1追加の訓練なしで拡散モデルは安全で、制御可能で、堅牢な画像ステガノグラフィを提供できるか。
RQ2DDIM inversion はカバーレスステガノグラフィのための秘密画像とコンテナ画像間の可逆翻訳をどう可能にするか。
RQ3プロンプト、LoRAs、ControlNets はコンテンツと露出性を制御する秘密鍵/公開鍵として効果的に機能するか？
RQ4一般的な劣化とステガノ分析における CRoSS の性能は従来手法と比較してどうか？
RQ5CRoSS における鍵の選択がセキュリティと制御性に与える影響は？

主な発見

手法	NIQE ↓	検出精度 - 50 ↓	XuNet	YedroudjNet
Baluja	3.43 b1 0.08	45.18 b1 1.69	43.12 b1 2.18	46.88 b1 2.37
ISN	2.87 b1 0.02	5.14 b1 0.44	3.01 b1 0.29	8.62 b1 1.19
HiNet	2.94 b1 0.02	5.29 b1 0.44	3.12 b1 0.36	8.33 b1 1.22
RIIS	3.13 b1 0.05	0.73 b1 0.13	0.24 b1 0.08	4.88 b1 1.15
CRoSS (ours)	3.04	1.32	0.18	2.11

CRoSS はコンテナ画像で競争力のある視覚品質を達成する（NIQE スコアはベースラインと類似）。
CRoSS はステガノ分析に対する優れた耐性を示し、検出精度は約50%付近で、ベースラインより回避再現率が高い。
実験では、プロンプト、LoRAs、ControlNets によって導かれた内容を隠し露出させることで制御性を示した。
さまざまな劣化下で露出された秘密画像の意味的忠実度を維持し、一般的な歪み下での PSNR において競合より優れた性能を示す。
このフレームワークは追加訓練を必要とせず、可逆翻訳のために DDIM inversion を活用する。
CRoSS は複数のキーモダリティ（プロンプト、深度マップ、セグメンテーションマップ、落書き、LoRAs）をサポートし、個別化された柔軟なステガノグラフィを実現する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。