Skip to main content
QUICK REVIEW

[論文レビュー] Learning the Enigma with Recurrent Neural Networks

Sam Greydanus|arXiv (Cornell University)|Aug 24, 2017
Chaos-based Image/Signal Encryption参考文献 18被引用数 23
ひとこと要約

この論文では、平文と暗号文のペairを用いて学習することで、多表式換言(特にヴィジェニー、オートキー、3ホイール・エンigma)の復号関数を学習する、長短期記憶(LSTM)ネットワークを用いたシーケンス・ツー・シーケンスRNNモデルを提案する。主な貢献は、RNNが複雑で決定論的な暗号の効率的で内部的な表現を自律的に学習でき、既知の平文攻撃を介して暗号解析が可能であることを示したことである。これは、未学習の鍵やより長いメッセージに対しても一般化可能である。

ABSTRACT

Recurrent neural networks (RNNs) represent the state of the art in translation, image captioning, and speech recognition. They are also capable of learning algorithmic tasks such as long addition, copying, and sorting from a set of training examples. We demonstrate that RNNs can learn decryption algorithms -- the mappings from plaintext to ciphertext -- for three polyalphabetic ciphers (Vigenère, Autokey, and Enigma). Most notably, we demonstrate that an RNN with a 3000-unit Long Short-Term Memory (LSTM) cell can learn the decryption function of the Enigma machine. We argue that our model learns efficient internal representations of these ciphers 1) by exploring activations of individual memory neurons and 2) by comparing memory usage across the three ciphers. To be clear, our work is not aimed at 'cracking' the Enigma cipher. However, we do show that our model can perform elementary cryptanalysis by running known-plaintext attacks on the Vigenère and Autokey ciphers. Our results indicate that RNNs can learn algorithmic representations of black box polyalphabetic ciphers and that these representations are useful for cryptanalysis.

研究の動機と目的

  • ブラックボックスな多表式換言の復号論理を自動で逆設計する汎用的で自動化された手法を開発すること。
  • RNNが暗号の構造に関する事前知識なしに、複雑な暗号のアルゴリズム的表現を学習できるかどうかを調査すること。
  • モデルの未学習の鍵やメッセージ長に対する一般化能力を評価すること。
  • RNNのメモリ使用量が、暗号化プロセスの時間依存性と相関するかどうかを検討すること。
  • 学習された表現が、キーフレーズ再構築などの暗号解析タスクにどのように有用かを検討すること。

提案手法

  • モデルは、3000ユニットのLSTMネットワークを用いて、復号をシーケンス・ツー・シーケンス翻訳タスクとして定式化する。
  • 学習データは、各暗号に対して対応するキーフレーズを伴う平文・暗号文のシーケンスペアから構成される。
  • モデルは各文字をワンホットベクトルとして処理し、LSTMの隠れ状態を通じてアテンションに類似したメカニズムを暗黙的に使用する。
  • モデルの性能は、学習時とは異なる鍵や、学習長さを超えるより長いメッセージシーケンスへの一般化性によって評価される。
  • 内部表現は、異なる暗号に対して個々のメモリユニットの活性化を可視化することで分析される。
  • キーフレーズ再構築は、平文と暗号文ベクトルを入力に含める形で行い、モデルにキーフレーズを予測させるように学習させる。

実験結果

リサーチクエスチョン

  • RQ1RNNは、入力と出力の例のみから、エンigmaのような複雑な多表式換言の決定論的復号関数を学習できるか?
  • RQ2RNNが要請するメモリ容量は、暗号化プロセスの時間依存性と相関するか?
  • RQ3RNNは、学習時に見られなかった鍵や、学習時を超える長さのメッセージシーケンスに対しても一般化できるか?
  • RQ4LSTMのメモリユニットの内部活性化は、元の暗号の意味的な構造的特徴を反映しているか?
  • RQ5学習された内部表現は、キーフレーズ再構築のような暗号解析タスクに活用できるか?

主な発見

  • LSTMモデルは、ヴィジェニーおよびオートキー暗号の復号において99%を超える正確性を達成した。オートキーのタスクは動的鍵更新のため、より多くのメモリを要した。
  • 未学習の鍵や学習データを超える長さのメッセージシーケンスに対しても、モデルは効果的に一般化しており、強固な内部表現学習が行われていることが示された。
  • メモリ使用量は暗号の複雑さに比例した:エンigmaはヴィジェニーに比べてはるかに多くのメモリを要し、これはより高い時間依存性を反映している。
  • 個々のLSTMメモリユニットの活性化は、暗号の定性的な特徴を模倣しており、構造的な内部表現が存在している可能性を示唆している。
  • モデルは、1〜6文字のヴィジェニーのキーフレーズを99%以上の正確性で再構築でき、オートキーのキーフレーズについても95%以上の正確性を達成した。
  • 本研究は、RNNが既知の平文攻撃を介して基本的な暗号解析を実行でき、学習された表現が暗号の逆設計に有用であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。