QUICK REVIEW

[論文レビュー] Reconstruction of a Photonic Qubit State with Quantum Reinforcement Learning

Shang Yu, F. Albarrán-Arriagada|arXiv (Cornell University)|Aug 28, 2018

Neural Networks and Reservoir Computing被引用数 2

ひとこと要約

本稿では、限定的な数のコピーしか入手できない状況下で、未知の光子量子ビット状態を再構築するための準量子強化学習プロトコルを提案する。単回測定とフィードバック信号（報酬／罰則）を繰り返し用いて光子エージェント量子ビットの状態を調整することで、50回未満の反復で88％を超える忠実度を達成し、リource制限のある状況における量子状態再構築のスケーラブルな手法を示している。

ABSTRACT

An experiment is performed to reconstruct an unknown photonic quantum state with a limited amount of copies. A semi-quantum reinforcement learning approach is employed to adapt one qubit state, an agent, to an unknown quantum state, an environment, by successive single-shot measurements and feedback, in order to achieve maximum overlap. The experimental learning device herein, composed of a quantum photonics setup, can adjust the corresponding parameters to rotate the agent system based on the measurement outcomes 0 or 1 in the environment (i.e., reward/punishment signals). The results show that, when assisted by such a quantum machine learning technique, fidelities of the deterministic single-photon agent states can achieve over 88% under a proper reward/punishment ratio within 50 iterations. This protocol offers a tool for reconstructing an unknown quantum state when only limited copies are provided, and can also be extended to higher dimensions, multipartite, and mixed quantum state scenarios.

研究の動機と目的

未知の状態のコピー数が非常に少ない状況における量子状態再構築の課題に対処すること。
光子エージェントが未知のターゲット状態に合わせて自身の状態を適応させるフィードバックベースの学習プロトコルを開発すること。
量子機械学習技術を用いた光子系における状態再構築の可能性を実証すること。
単一量子ビット系にとどまらず、高次元、多粒子、混合状態の量子状態へこの手法を拡張すること。

提案手法

測定結果に基づいて状態パラメータを調整することで進化する強化学習エージェントを実装するため、光子量子装置を用いる。
各単回測定の後、環境が二値のフィードバック（結果1に対して報酬、0に対して罰則）を提供する。
フィードバックに応じて、報酬と未知状態との重なりを最大化する学習ルールに従い、制御されたユニタリ操作によりエージェントの状態を回転させる。
各エピソードは測定とパラメータ更新から成り、最大50回の反復を繰り返す反復的プロセスである。
報酬／罰則比を最適化することで、再構築状態の収束性と忠実度を向上させる。
単一光子状態と線形光学素子を用いた実験的実装により、プロトコルを実現する。

実験結果

リサーチクエスチョン

RQ1限定的なコピー数でのみ、光子エージェントが未知の単一光子量子ビット状態を再構築できるか。
RQ2報酬／罰則比が状態再構築プロセスの忠実度と収束速度にどのように影響するか。
RQ3この強化学習手法を高次元状態やエンタングル状態へどの程度まで拡張できるか。
RQ4有限の反復回数と現実的な実験的制約下で、再構築状態が達成可能な最大忠実度は何か。

主な発見

適切な報酬／罰則比を用いることで、再構築されたエージェント状態と未知のターゲット状態との間で88％を超える忠実度が達成された。
50回未満の反復で忠実度の向上が観察され、学習プロセスの高速収束が示された。
実験的セットアップにより、光子量子ビットと単回測定を用いたフィードバック駆動型量子機械学習プロトコルが成功裏に実装された。
この手法はコピー数が限られている状況でも頑健であるため、状態準備が高コストまたは希少な状況に適している。
原則として高次元のクイッド系や多粒子もつれ状態へスケーラブルに拡張可能である。
結果として、光子量子情報系における実用的量子状態再構築に向けた準量子強化学習の有効性が示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。