[论文解读] Decentralized Baseband Processing for Massive MU-MIMO Systems
本文提出了一种用于大规模MU-MIMO系统的去中心化基带处理(DBP)架构,该架构将基站(BS)的天线阵列划分为多个簇,每个簇配备独立的射频链路、调制电路和计算硬件。通过使用仅依赖于本地信道状态信息的新型ADMM-based数据检测与波束成形算法,该方法在实现接近最优误码率性能的同时,显著降低了互连带宽与计算复杂度,该结论已通过大规模GPU集群实现验证,适用于拥有数千根天线的系统。
Achieving high spectral efficiency in realistic massive multi-user (MU) multiple-input multiple-output (MIMO) wireless systems requires computationally-complex algorithms for data detection in the uplink (users transmit to base-station) and beamforming in the downlink (base-station transmits to users). Most existing algorithms are designed to be executed on centralized computing hardware at the base-station (BS), which results in prohibitive complexity for systems with hundreds or thousands of antennas and generates raw baseband data rates that exceed the limits of current interconnect technology and chip I/O interfaces. This paper proposes a novel decentralized baseband processing architecture that alleviates these bottlenecks by partitioning the BS antenna array into clusters, each associated with independent radio-frequency chains, analog and digital modulation circuitry, and computing hardware. For this architecture, we develop novel decentralized data detection and beamforming algorithms that only access local channel-state information and require low communication bandwidth among the clusters. We study the associated trade-offs between error-rate performance, computational complexity, and interconnect bandwidth, and we demonstrate the scalability of our solutions for massive MU-MIMO systems with thousands of BS antennas using reference implementations on a graphic processing unit (GPU) cluster.
研究动机与目标
- 解决大规模MU-MIMO系统中因拥有数千根天线而导致的集中式基带处理中互连与计算瓶颈问题。
- 降低每系统原始基带数据速率超过200 Gbit/s的情况,该速率已超出当前互连技术(如CPRI)与芯片I/O带宽的限制。
- 通过在天线簇之间去中心化信号处理,实现可扩展、模块化且能效更高的基站设计。
- 在避免集中式处理的前提下,实现与ZF/MMSE方法相当的接近最优频谱效率。
- 通过基于GPU的参考实现,在大规模天线阵列上验证其可行性与可扩展性。
提出的方法
- 将基站天线阵列划分为C个独立的簇,每个簇拥有自己的射频链路、基带/射频电路以及本地计算硬件。
- 开发一种基于ADMM的检测算法,仅使用本地信道状态信息(CSI),并在簇之间交换极少的共识信息。
- 设计一种广义的基于ADMM的下行链路波束成形算法,利用本地CSI并仅需极低的簇间通信带宽。
- 采用交替方向乘子法(ADMM)将大规模优化问题分解为每个簇的较小、分布式子问题。
- 在每个簇内使用共轭梯度法高效求解局部子问题。
- 在GPU集群上实现算法,以验证在拥有数千根天线的系统中的可扩展性与性能表现。
实验结果
研究问题
- RQ1去中心化基带处理是否能在显著降低互连带宽的同时,实现接近最优的误码率性能?
- RQ2在去中心化架构中,计算复杂度、误码率与簇间通信带宽之间的权衡关系如何表现?
- RQ3基于ADMM的算法是否能够仅使用本地CSI,实现可扩展、局部化的数据检测与波束成形?
- RQ4在实际的大规模MU-MIMO配置中,与集中式ZF/MMSE相比,去中心化处理的性能上限是什么?
- RQ5该架构在实际中可扩展至拥有数千根基站天线的系统吗?
主要发现
- 所提出的去中心化数据检测与波束成形算法在性能上接近最优,与集中式ZF/MMSE方法相当。
- 算法仅需本地信道状态信息,并仅交换极少的共识数据,将簇间通信降至原始基带数据速率的极小比例。
- GPU集群实现表明,该方法可扩展至拥有数千根天线的大规模MU-MIMO系统,并实现高吞吐量。
- 该方法将互连带宽需求降低至当前高速互连技术可支持的水平,从而克服了集中式设计中的主要瓶颈。
- 该方法支持模块化且可扩展的基站架构,适用于实际5G部署。
- 未来采用FPGA或ASIC实现有望实现Gb/s量级吞吐量,并显著提升能效。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。