QUICK REVIEW

[論文レビュー] Baiting AI: Deceptive Adversary Against AI-Protected Industrial Infrastructures

Aryan Mohammadi Pasikhani, Prosanta Gope|arXiv (Cornell University)|Jan 13, 2026

Smart Grid Security and Resilience被引用数 0

ひとこと要約

本論文は、産業制御システムに対して戦略的なタイミングで wear-out 攻撃を実施し、製品品質とアクチエータ寿命を劣化させつつAIベースの防御を回避するマルチエージェントDRLベースの敵対者を提案し、産業レベルのICSテストベッド上で検証する。

ABSTRACT

This paper explores a new cyber-attack vector targeting Industrial Control Systems (ICS), particularly focusing on water treatment facilities. Developing a new multi-agent Deep Reinforcement Learning (DRL) approach, adversaries craft stealthy, strategically timed, wear-out attacks designed to subtly degrade product quality and reduce the lifespan of field actuators. This sophisticated method leverages DRL methodology not only to execute precise and detrimental impacts on targeted infrastructure but also to evade detection by contemporary AI-driven defence systems. By developing and implementing tailored policies, the attackers ensure their hostile actions blend seamlessly with normal operational patterns, circumventing integrated security measures. Our research reveals the robustness of this attack strategy, shedding light on the potential for DRL models to be manipulated for adversarial purposes. Our research has been validated through testing and analysis in an industry-level setup. For reproducibility and further study, all related materials, including datasets and documentation, are publicly accessible.

研究の動機と目的

DRLを用いてICSに対して stealthy、戦略的なタイミングの wear-out 攻撃を実行する新規の敵対戦略を特定する。
実世界に近い産業環境におけるAI駆動の検知器に対するDRLベースの敵対者の影響を評価する。
学習した敵対ポリシーを curriculum に再利用して min–max 敵対訓練を通じて検知器を強化できることを示す。
再現性とさらなる研究を促進するために産業規模のテストベッドと公開可能な資料を提供する。

提案手法

ブラック/グレー/ホワイトボックス脅威モデルで動作する二代理王 DRL 敵対者（Scheduler と Disturber）を導入する。
状態 s、行動 delay(pkt, period)、観測 o を用いた部分観測可能マルコフ決定過程（POMDP）として攻撃をモデル化する。
報酬関数を運用的な撹乱と機密性の組み合わせとして定義する（R = α·D + β·(1−C)）。
Siemens PLCs と PROFINET を用いたICSテストベッドでDNNベースのIDS検知器（DenseNet、CNN、ResNet、LSTM、Transformer）を用いて攻撃を検証する。
ブラックボックスで IDS の recall を 17.34% から 27.61% に、グレーBOXで 28.96% から 69.24% に、ホワイトBOXで最大 99.95% に低下させる事例を示す。
Appendix V-A で敵対訓練を通じて検知器を硬化させる Min-Max フレームワークへ攻撃モデルを再利用する。

実験結果

リサーチクエスチョン

RQ1DRLベースの敵対者はICSにおいて AI 主導の防御を回避しつつ wear-out 攻撃をスケジュールし実行できるのか。
RQ2戦略的にタイミングを計り低速・低振幅の摂動がアクチエータの摩耗、製品品質、システム検出性に与える影響はどの程度か。
RQ3黒箱・グレー箱・ホワイトボックス条件下で DRL駆動の stealthy 敵対者に直面した場合、現在の DNN ベース IDS はどの程度効果的か。
RQ4学習した敵対ポリシーを防御訓練カリキュラムへ変換して検知器の頑健性を向上させることができるか。
RQ5産業規模のICSテストベッドは現実世界に近い設定でこの種の攻撃の実現性と影響を検証できるのか。

主な発見

DRL駆動の敵対者はホワイトボックス設定で IDS recall を最大 99.95% 部分まで低下させる stealthy 攻撃 variantes を作成できる。
ブラックボックス設定では recall の低下が 17.34% から 27.61% の範囲。
グレー箱設定では recall の低下が 28.96% から 69.24% の範囲。
Siemens S7 PLC と PROFINET を用いた産業規模ICSテストベッド上で攻撃を実証。
新規の low-and-slow wear-out 戦略を強調し、AI防御を回避しつつアクチエータ寿命と製品品質を劣化させる。
本研究で用いた資料とデータセットは再現性のため公開可能。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。