QUICK REVIEW

[論文レビュー] Wireless TokenCom: RL-Based Tokenizer Agreement for Multi-User Wireless Token Communications

Farshad Zeinali, Mahdi Boloursaz Mashhadi|arXiv (Cornell University)|Feb 12, 2026

Wireless Signal Modulation Classification被引用数 0

ひとこと要約

この論文は、トークナイザー合意、サブチャネル割り当て、ビームフォーミングを共同最適化するハイブリッド DQN–DDPG 強化学習フレームワークを提案し、TokenCom における意味品質を向上させ、ビデオのフリーズを低減します。

ABSTRACT

Token Communications (TokenCom) has recently emerged as an effective new paradigm, where tokens are the unified units of multimodal communications and computations, enabling efficient digital semantic- and goal-oriented communications in future wireless networks. To establish a shared semantic latent space, the transmitters/receivers in TokenCom need to agree on an identical tokenizer model and codebook. To this end, an initial Tokenizer Agreement (TA) process is carried out in each communication episode, where the transmitter/receiver cooperate to choose from a set of pre-trained tokenizer models/ codebooks available to them both for efficient TokenCom. In this correspondence, we investigate TA in a multi-user downlink wireless TokenCom scenario, where the base station equipped with multiple antennas transmits video token streams to multiple users. We formulate the corresponding mixed-integer non-convex problem, and propose a hybrid reinforcement learning (RL) framework that integrates a deep Q-network (DQN) for joint tokenizer agreement and sub-channel assignment, with a deep deterministic policy gradient (DDPG) for beamforming. Simulation results show that the proposed framework outperforms baseline methods in terms of semantic quality and resource efficiency, while reducing the freezing events in video transmission by 68% compared to the conventional H.265-based scheme.

研究の動機と目的

事前学習済みトークナイザー/コードブックペアを用いた意味的・目標指向の無線パラダイムとして TokenCom を動機づける。
マルチユーダー下りリンク TokenCom におけるトークナイザー合意、サブチャネル割り当て、ビームフォーミングの結合最適化の混合整数非凸問題を定式化する。
問題を解くためのハイブリッド強化学習解法（離散決定には DQN、連続行動には DDPG）を開発する。
適応的なトークナイザー合意が意味品質とリソース効率を改善し、ビデオフリーズを低減することを示す。
現実的なビデオトークナイゼーション設定の下で、より多くのユーザー数とアンテナ数へのスケーラビリティを示す。

提案手法

状態がチャネル条件、レート、選択されたトークナイザーペアを捉えるMDPとして問題をモデル化する。
DQN が離散的なトークナイザーとサブチャネル割り当てを選択し、DDPG が連続的なビームフォーミングベクトルを出力するハイブリッドアーキテクチャを使用する。
報酬を意味品質と電力消費を正規化した効用とし、制約違反にペナルティを課す。
状態にはエピソードごとに条件付けするために選択されたトークナイザー/デトークナイザーのペア ηm_i を含める。
DQN にはTD損失、DDPG にはベルマン/アクタークリティック更新を用いた経験再生とターゲットネットワークを用いて学習する。
エピソードベースのトークン選択とスロットごとのリソース割り当てを詳述するアルゴリズム（Algorithm 1）を提供する。

実験結果

リサーチクエスチョン

RQ1マルチユーザー TokenCom システムにおいて、トークナイザー合意、サブチャネル割り当て、ビームフォーミングを共同で最適化するにはどうすればよいか？
RQ2ハイブリッド DQN–DDPG RL フレームワークはチャネル条件と意味要件に適応してトークナイザーの選択を調整し、システム効用を最大化できるか？
RQ3適応的 TA が動画品質指標とリソース効率に与える影響はベースラインと比較してどうか？
RQ4より多くのユーザーや大規模なアンテナ配列でフレームワークはどのようにスケールするか？
RQ5提案手法における意味品質、レート、電力のトレードオフはどうなるか？

主な発見

提案フレームワークは意味品質とリソース効率の点でベースラインを上回る。
従来の H.265 ベースの方式と比較してビデオフリーズを顕著に低減する（要約欄に 68% 減少と記載）。
ユーザー数とアンテナ数の変動に対してもPSNRが高く、U=4, N=64 で従来ベースラインより約 10 dB の PSNR 優位を示す。
初期探索後もフリーズ率が低く安定しており、トークナイザー-NT 適応が効果的であることを示す。
送信電力の増加とアンテナ増加に伴い性能が向上し、シナリオ間でのスケーラビリティと頑健性を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。