[论文解读] Wireless Power Control Based on Large Language Models
PC-LLM 通过带有干扰感知偏置的预训练大语言模型来解决 MAC 层功率控制问题,优于 WMMSE 和 GNN 基线,并表现出强烈的零-shot 泛化能力。
This paper investigates the power control problem in wireless networks by repurposing pre-trained large language models (LLMs) as relational reasoning backbones. In hyper-connected interference environments, traditional optimization methods face high computational cost, while standard message passing neural networks suffer from aggregation bottlenecks that can obscure critical high-interference structures. In response, we propose PC-LLM, a physics-informed framework that augments a pre-trained Transformer with an interference-aware attention bias. The proposed bias tuning mechanism injects the physical channel gain matrix directly into the self-attention logits, enabling explicit fusion of wireless topology with pre-trained relational priors without retraining the backbone from scratch. Extensive experiments demonstrate that PC-LLM consistently outperforms both traditional optimization methods and state-of-the-art graph neural network baselines, while exhibiting exceptional zero-shot generalization to unseen environments. We further observe a structural-semantic decoupling phenomenon: Topology-relevant relational reasoning is concentrated in shallow layers, whereas deeper layers encode task-irrelevant semantic noise. Motivated by this finding, we develop a lightweight adaptation strategy that reduces model depth by 50\%, significantly lowering inference cost while preserving state-of-the-art spectral efficiency.
研究动机与目标
- 在超密无线网络中最大化用户速率的网络全局效用,同时满足每个节点的功率约束。
- 通过使用具有全局注意力的 Transformer 和拓扑感知偏置,突破 MPNN 的聚合瓶颈。
- 将预训练的大语言模型作为关系推理骨干用于 MAC 层优化。
- 展示对未见干扰分布的零-shot 泛化能力并分析逐层拓扑对齐。
提出的方法
- 将预训练的 Transformer 主干(BERT-Large)改造为用于干扰建模的图 Transformer。
- 通过将信道增益矩阵映射到自注意力分数来注入干扰感知偏置,使用偏置投影器。
- 在送入 Transformer 之前通过一个轻量的两层 MLP 将节点特征投影。
- 使用 LoRA 仅对注意力层中的低秩适配器进行微调,保持主干固定。
- 增加一个带 Sigmoid 激活的功率推断头,在 [0, Pmax] 内生成发射功率。
- 根据论文中的目标函数,以生成的功率向量最大化网络效用进行无监督训练。
实验结果
研究问题
- RQ1带有干扰感知偏置的预训练 LLM 主干是否能够在功率控制方面超过传统优化(如 WMMSE)和 GNN 基线?
- RQ2在使用 PC-LLM 时,干扰的关系推理在网络层的哪个位置最活跃(浅层 vs 深层)?
- RQ3拓扑感知偏置是否能够在不重新训练的情况下实现对未见干扰分布的零-shot 泛化?
- RQ4在不牺牲光谱效率的前提下,是否可以降低模型深度以降低推理成本?
主要发现
- PC-LLM 在不同网络条件下始终优于最优的 WMMSE 基准和最先进的 GNN 基线。
- 该框架对未见干扰分布具有出色的零-shot 鲁棒性,无需额外微调。
- 关系推理在浅层 Transformer 层集中,与任务无关的语义噪声在较深层编码。
- 一种轻量化的适应策略将模型深度降低约 50%,在保持最先进光谱效率的同时降低推理时延。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。