QUICK REVIEW

[論文レビュー] Transfer Learning for Neural Networks-based Equalizers in Coherent Optical Systems

Pedro J. Freire, Daniel Abode|arXiv (Cornell University)|Apr 11, 2021

Optical Network Technologies参考文献 54被引用数 59

ひとこと要約

本稿では、コherent光通信システムにおけるニューラルネットワーク（NN）ベースのイコライザを迅速に再構成するためのトランスファーラーニング（TL）を提案する。これにより、トレーニング時間とデータ量を最大99%まで削減できる。事前に訓練済みのCNN+biLSTMイコライザを、送信パワー、変調フォーマット、シンボルレート、またはファイバー種別といった新しい伝送条件に適応させるために微調整することで、TLは再トレーニングから完全に回避でき、動的光ネットワークにおける柔軟性と実用性を著しく向上させる。

ABSTRACT

In this work, we address the question of the adaptability of artificial neural networks (NNs) used for impairments mitigation in optical transmission systems. We demonstrate that by using well-developed techniques based on the concept of transfer learning, we can efficaciously retrain NN-based equalizers to adapt to the changes in the transmission system, using just a fraction (down to 1%) of the initial training data or epochs. We evaluate the capability of transfer learning to adapt the NN to changes in the launch power, modulation format, symbol rate, or even fiber plants (different fiber types and lengths). The numerical examples utilize the recently introduced NN equalizer consisting of a convolutional layer coupled with bi-directional long-short term memory (biLSTM) recurrent NN element. Our analysis focuses on long-haul coherent optical transmission systems for two types of fibers: the standard single-mode fiber (SSMF) and the TrueWave Classic (TWC) fiber. We underline the specific peculiarities that occur when transferring the learning in coherent optical communication systems and draw the limits for the transfer learning efficiency. Our results demonstrate the effectiveness of transfer learning for the fast adaptation of NN architectures to different transmission regimes and scenarios, paving the way for engineering flexible and universal solutions for nonlinearity mitigation.

研究の動機と目的

動的光伝送システムにおけるニューラルネットワークベースのイコライザの適応性の欠如に対処する。
送信パラメータ（例：送信パワー、変調フォーマット、シンボルレート、ファイバー種別）の変更ごとに、NNイコライザを再トレーニングする不切実性を克服する。
トランスファーラーニングが、高いイコライジング性能を維持しながらトレーニングデータ量とエポック数を著しく削減できることを実証する。
ファイバー設備の変更を含む多様な光伝送シナリオにおける、トランスファーラーニングの限界と有効性を調査する。
一般化能と再構成可能性を向上させることで、次世代光ネットワークに向けた実用的で柔軟かつ汎用的な非線形イコライゼーションソリューションを実現する。

提案手法

標準設定（例：34.4 GBd、16-QAM、5 dBm送信パワー、SSMFまたはTWCファイバー）で事前に訓練済みのCNN+biLSTMニューラルネットワークイコライザをソースモデルとして使用する。
新しい伝送シナリオ（例：異なる送信パワー、変調フォーマット、シンボルレート、またはファイバー種別）に対応する小さなターゲットデータセット上で、事前学習モデルの特定層を微調整することでトランスファーラーニングを適用する。
層の凍結または微調整を段階的に制御することでトレーニングプロセスを最適化する：送信パワーおよび変調フォーマットの変更には畳み込み層を、シンボルレートの変更にはbiLSTM層を微調整し、メモリサイズを調整する。
予測されたシンボルの実部および虚部を回帰的に予測する目的関数を用い、予測値と実際のシンボル間の平均二乗誤差を最小化する。
トレーニングから再始動した場合と比較して、同じQファクター性能に到達するまでに必要なエポック数およびデータセットサイズを評価することで、トレーニング効率を測定する。
ファイバー設備の入れ替え（SSMFからTWC、およびその逆）を含む複数のテストケースで、ソースおよびターゲット設定を体系的に変化させ、トランスファーの耐性を評価する。

実験結果

リサーチクエスチョン

RQ1トランスファーラーニングは、新しい伝送条件に適応させるために、事前学習済みNNイコライザのトレーニングエポック数およびデータセットサイズをどの程度削減できるか？
RQ2例えば、高パワーから低パワーへの転送、または低シンボルレートから高シンボルレートへの転送といった、転送方向が再トレーニングされたイコライザの性能および収束に与える影響は？
RQ3SSMFからTWCに至るような、非線形性および分散特性が顕著に異なるファイバー種別間で知識を転送する場合、トランスファーラーニングの性能限界はどこか？
RQ4送信パワー、変調フォーマット、シンボルレート、ファイバー種別といった複数のシステムパラメータを同時に変更した場合でも、トランスファーラーニングは高いイコライジング性能を維持できるか？
RQ5CNN+biLSTMのようなNNのアーキテクチャ設計は、光イコライゼーションタスクにおけるトランスファーラーニングの有効性にどのように影響するか？

主な発見

送信パワー、変調フォーマット、またはシンボルレートの変更に適応する際、トレーニングに必要なエポック数が最大99%削減された（例：100エポックから1エポックまで）。
Qファクター性能を維持したまま、トレーニングデータセットサイズを最大99%まで削減できた（例：100%から1%まで）。これは高いデータ効率を示している。
異なるファイバー種別間（例：18×50 km SSMFから9×50 km TWC）での転送においても、必要なデータセットサイズは50%削減されたが、エポックの削減は10%にまで低下した。
最も良好な転送性能は、TWCファイバーでは「パワー則」（高パワーから低パワーへ）に従い、SSMFでは「シンボルレート則」（低レートから高レートへ）に従った場合に達成された。これは、物理層の特性が転送方向性に影響を与えることを示している。
シンボルレートの変更においては、畳み込み層を凍結したままbiLSTM層のみを再トレーニングすることで、トレーニングの複雑さを顕著に低減できた。これは、アーキテクチャに配慮したトランスファーラーニング戦略の有効性を確認している。
最も挑戦的なケース（他のパrameterが同一の状態でSSMFからTWCへのファイバー交換）においても、データセットサイズは50%削減された。これは、大きなチャネル関数の違いがある中でも、トランスファーラーニングの高い耐性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。