QUICK REVIEW

[論文レビュー] Quantum Prisoner's Dilemma and High Frequency Trading on the Quantum Cloud

Faisal Shah Khan, Ning Bao|arXiv (Cornell University)|Apr 9, 2021

Quantum Mechanics and Applications参考文献 17被引用数 8

ひとこと要約

本稿では、今日の準量子クラウドインフラ上でのEisert-Wilkens-Lewenstein（EWL）量子ゲームプロトコルを用いて、高頻度取引（HFT）を量子囚人のジレンマゲームとしてモデル化することを提案する。量子もつれと中継通信を活用することで、古典的HFT戦略よりも優れた報酬を達成する近似的にパレート最適なナッシュ均衡を実現し、将来的な完全な量子ネットワークが協力的で強化学習駆動の契約を可能にし、HFTの結果において真のパレート最適性（3,3）を達成できることを予測する。

ABSTRACT

High-frequency trading (HFT) offers an excellent user case and a potential killer application of the commercially available, first generation quasi-quantum communication and computation technologies. To this end, we offer here a simple but complete game-theoretic model of HFT as the famous two player game, Prisoner's Dilemma. We explore the implementation of HFT as a game on the (quasi) quantum cloud using the Eisert, Wilkens, and Lewenstein quantum mediated communication protocol, and how this implementation can increase transaction speed and improve the lot of the players in HFT. Using cooperative game-theoretic reasoning, we also note that in the near future when the internet is properly quantum, players will be able to achieve Pareto-optimality in HFT as an instance of reinforced learning.

研究の動機と目的

高頻度取引（HFT）のためのゲーム理論的枠組みを、非協力的および協力的ゲーム理論を用いて確立すること。
量子ゲーム理論、特にEWLプロトコルがHFTにどのように応用可能かを示し、取引結果の改善を実証すること。
現在の準量子クラウドインフラがHFTのパフォーマンスと報酬最適化に与える影響を分析すること。
完全な量子インターネットの長期的潜在的可能性を、強化学習を用いた協力的でパレート最適な結果を達成する手段として探求すること。
量子ゲーム理論と実用的金融応用（高頻度取引）を結びつけること。

提案手法

市場行動を反映する報酬順序（売却, 買付）≻（買付, 買付）≻（売却, 売却）≻（買付, 売却）を有する2人用囚人のジレンマゲームとしてHFTをモデル化する。
2キュービットの量子回路を用い、ユニタリ操作ともつれゲートJ(γ)を用いてEisert-Wilkens-Lewenstein（EWL）量子ゲームプロトコルを適用する。
レフェリーが中継する量子通信プロトコルを用いてもつれ状態の量子重ね合わせを生成し、古典的でないナッシュ均衡を可能にする。
現在のクラウド制限に起因するノイズが混在する準量子状態下での結果を分析し、(2.5, 2.5)に近い近似的にパレート最適な報酬を得ることを示す。
完全な量子インターネット下での将来のパフォーマンスを予測し、高精度なもつれが理論的上限（3,3）の実現を可能にする量子戦略プロファイルを提示する。
協力的ゲーム理論と強化学習を統合し、繰り返しプレイと行動履歴を用いて、インcentivesとディスインcentivesによりパレート最適な結果を強制可能な契約の形成をモデル化する。

実験結果

リサーチクエスチョン

RQ1高頻度取引を形式的に量子版の囚人のジレンマとしてモデル化可能か？
RQ2EWL量子ゲームプロトコルは、古典的戦略と比較してHFTにおける報酬結果をどのように改善するか？
RQ3現在の準量子クラウドインフラは、古典的システムと比較してどれほどHFTのパフォーマンスを向上可能か？
RQ4量子もつれと中継通信が、HFTにおける近似的にパレート最適な結果を達成する上で果たす役割は何か？
RQ5将来的な完全な量子インターネット上での量子方策空間における強化学習は、協力的でパレート最適な結果をHFTで達成可能か？

主な発見

現在のノイズ混在する準量子状態下で、EWLプロトコルによる量子囚人のジレンマ実装は、(2.5, 2.5)のナッシュ均衡報酬を達成し、古典的（1,1）ナッシュ均衡と比較して顕著な改善を示す。
ノイズの影響によるもつれの制限がある中でも、量子プロトコルは古典的戦略よりもパレート最適（3,3）に近い報酬を達成でき、HFTにおける量子的優位性を示している。
本稿では、純粋な量子戦略ナッシュ均衡（3,3）が非協力的状況下では根本的に非合理的であると特定しており、これは古典的戦略集合のいかなる戦略に対しても最適反応ではないからである。
協力的ゲーム理論は、繰り返しプレイと行動履歴を用いた合意に基づく契約により、インcentivesとディスインcentivesを用いてパレート最適な結果の強制を可能にする。
将来的には、完全な量子インターネットが高精度なもつれをサポートし、量子強化学習を用いて理論的上限（3,3）の実現を可能にする。
囚人のジレンマにおける量子戦略が、古典的ポリシー選択よりもパレート最適であることが証明されており、量子エージェントがこのようなゲームを含む強化学習タスクにおいて、古典的エージェントを上回ることを示唆している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。