-
在毫米波(millimeter wave, mmWave)通信系统中,使用大规模多输入多输出(massive multiple input multiple output, Massive MIMO)结合波束赋形(beamforming, BF)技术可提高空间自由度[1],实现mmWave的定向远距传输[2]。由于基站(base station, BS)会发射大量定向窄波束[3],所以利用波束搜索技术使移动台(mobile station, MS)和BS快速对准到最优波束是mmWave通信技术的重要研究方向之一[4]。
目前,搜索精度最高的是mmWave穷举搜索算法[3,5]。此类方案的缺点是随着波束数量变多,算法的开销会急剧增大,导致通信时延。为了解决此问题,现有mmWave波束搜索方案研究主要从以下几个方向展开。文献[5-9]提出了基于固定码本的波束搜索算法,这类方案主要通过提前定义波束码本以降低搜索训练开销,搜索方法可使用穷举法搜索或分级搜索以减少搜索次数。为了提高搜索效率,文献[10-12] 提出了在双频通信系统中基于辅助信息和并行传输的波束搜索算法,利用Sub-6 GHz频段和mmWave频段的空间相关性,基于并行信道间的映射关系,实现了利用辅助信息减少mmWave信道估计和波束训练开销。但是由于在实践中这种映射关系往往不是完美的双射,会导致搜索性能不佳,并且这类方案应用场景只局限于双频通信系统。文献[13-15]将机器学习引入波束搜索领域,利用深度神经网络(deep neural network, DNN)的分类预测能力完成波束训练,但针对特定场景训练DNN,使得方案泛化性能受限。文献[16-17]提出了基于压缩感知的波束搜索算法,利用mmWave信道的稀疏性,使用压缩感知算法估计波达方向,算法计算复杂度高,应用范围有限。
与上述研究方向不同,本文考虑场景因素对mmWave传输的影响,提出了一种基于场景化的特征选择和波束预测方案。本方案分为离线和在线两个阶段。首先,对于给定应用场景,在离线阶段选择特征波束构建特征波束集(波束索引的子集),并使用交叉验证确定特征波束集的大小,达到缩小波束搜索范围减少波束训练开销的目的。接下来考虑到场景化特征波束集与最优波束之间为隐式、非线性映射关系,采用了DNN模型逼近该映射,从而减少在线阶段mmWave信道估计和波束训练的开销。最后,使用场景化DNN模型即可在线预测最优波束,完成波束搜索。
-
如图1所示,考虑到mmWave天线通常采用模拟BF或混合BF[18],本文采用模拟BF架构,由一条射频(radio frequency, RF)链连接全部天线端口。假设BS配备均匀平面阵列(uniform planar array, UPA)天线, MS配备单个全向天线。其中,BS部署的UPA具有
$ {N_{{\rm{BS}}}} $ 个阵列元件,其中$ {N_{{\rm{BS}}}} = N_{{\rm{BS}}}^{\rm{v}} \times N_{{\rm{BS}}}^{\rm{h}} $ ,而$ N_{BS}^{\rm{v}} $ 和$ N_{{\rm{BS}}}^{\rm{h}} $ 分别是垂直和水平方向上的阵列元件的数量,天线间隔为半波长。 -
本文采用mmWave几何(物理)信道模型[18],该信道模型的优点在于它能够捕获信号传播的物理特性,包括对环境几何形状、材料、频带等的依赖性[18],这对于本文的场景化波束预测至关重要。基于此模型的mmWave信道可以表示为:
$$ {{\boldsymbol{h}}_{{\text{mmW}}}}(k) = \sum\limits_{d = 0}^{D - 1} {\sum\limits_{l = 1}^L {{\alpha _l}{{\rm{e}}^{ - {\rm{j}}\frac{{2{{\text{π}}}k}}{K}d}}p(d{T_{\rm{S}}} - {\tau _l}){\boldsymbol{a}}({\theta _l},{\phi _l})} } $$ (1) 式中,L为信道的多径数量;
$ a({\theta _l},{\phi _l}) $ 为阵列响应;$ {\alpha _l} $ 、$ {\tau _l} $ 、$ {\theta _l} $ 、$ {\phi _l} $ 分别为第$ l $ 条信道的路径增益(包括路径损耗)、延迟、到达俯仰角和到达方位角;TS为采样周期;D为循环前缀长度。假设最大延迟小于DTS。 -
在模拟BF中,大小为
$ {N_{{\rm{CB}}}} \times 1 $ 的BF向量$ {\boldsymbol{f}}_{{\rm{RF}}}^k $ 从大小为$ {N_{{\rm{CB}}}} \times K $ 的预定义量化码本矩阵$ {\boldsymbol{F}} $ 中得到,其中K是波束的总数量。因此,码本矩阵${\boldsymbol{F}} = \left[ {{\boldsymbol{f}}_1},{{\boldsymbol{f}}_2}, \cdots ,\right. \left.{{\boldsymbol{f}}_K} \right]$ 将波束索引与天线阵列元素对应起来。基于上述配置,对于三维空间中的任意方向
$ \left( {{\theta _k},{\phi _k}} \right) $ ,阵列响应矩阵可以表示为:$$\begin{split} {{\boldsymbol{G}}_k} =& \left[ \begin{array}{*{20}{c}} &\varphi _{1,1}^k &\varphi _{1,2}^k &\cdots &\varphi _{1,N_{BS}^h}^k\\ &\varphi _{2,1}^k &\varphi _{2,2}^k &\cdots &\varphi _{2,N_{BS}^h}^k\\ &\vdots &\vdots &\ddots &\vdots \\ &\varphi _{N_{BS}^v,1}^k &\varphi _{N_{BS}^v,2}^k &\cdots &\varphi _{N_{BS}^v,N_{BS}^h}^k \end{array} \right]=\\ &\qquad\qquad\quad \left[ {{\boldsymbol{g}}_1^k{\rm{ }}{\boldsymbol{g}}_2^k{\rm{ }} \cdots {\rm{ }}{\boldsymbol{g}}_{N_{BS}^h}^k} \right] \end{split}$$ (2) 式中,
$ \varphi _{u,v}^k $ 为UPA$ \left( {u,v} \right) $ 处的第k束波束的相位响应,$ u = 1,2, \cdots ,N_{{\rm{BS}}}^{\rm{v}} $ ,$ v = 1,2, \cdots ,N_{{\rm{BS}}}^{\rm{h}} $ 。因此,码本矩阵$ {\boldsymbol{F}} $ 由相应列堆叠而成,即:$$ \begin{split} {\boldsymbol{F}}_k^{\text{T}}{\text{ = }}&\left[ {\mathop {{\boldsymbol{g}}_1^k}\nolimits^{{\rm{T}}} {\text{ }}\mathop {{\boldsymbol{g}}_2^k}\nolimits^{{\rm{T}}} {\text{ }} \cdots {\text{ }}\mathop {{\boldsymbol{g}}_{N_{BS}^h}^k}\nolimits^{{ {\rm{T}}}}} \right] = \\ &\left[ {{\boldsymbol{f}}_1^k{\text{ }}{\boldsymbol{f}}_2^k{\text{ }} \cdots {\text{ }}{\boldsymbol{f}}_{N_{BS}^h}^k} \right] \end{split} $$ (3) 码本矩阵
$ {\boldsymbol{F}} $ 的第k列即是第k束波束的BF向量。如果令$ {\boldsymbol{f}} \in {{\boldsymbol{C}}^{{M_{{\text{mmW}}}} \times 1}} $ 表示下行链路BF向量,那么MS处的接收信号可以表示为:$$ {{\boldsymbol{y}}_{{\text{mmW}}}}\left( {\bar m} \right){\text{ }} = {\text{ }}{\boldsymbol{h}}_{{\text{mmW}}}^{\text{T}}\left( {\bar m} \right){\boldsymbol{f}}{\text{ + }}{n_{{\text{mmW}}}}\left( {\bar m} \right) $$ (4) 式中,
$ {{\boldsymbol{h}}_{{\text{mmW}}}}\left( {\bar m} \right) \in {{\boldsymbol{C}}^{{M_{{\text{mmW}}}} \times 1}} $ 表示在第$ \bar m $ 个子载波从基站的mmWave阵列到MS处的下行链路信道;BF向量$ {\boldsymbol{f}} $ 选自码本$ {\boldsymbol{F}} $ 即$ {\boldsymbol{f}} \in {\boldsymbol{F}} $ ,$ \left| {\boldsymbol{F}} \right| = {N_{{\rm{CB}}}} $ 。 -
本节论证依据功率损耗概率最小化准则选择场景化最优特征波束的合理性,作为算法的理论基础。然后给出了场景化特征选择和波束预测方案。
-
波束特征是指波束所对应信道的某些特征。这些特征可以是接收信号的强度[19]或来自接入点信道的多径特征[20]。本文定义波束特征是给定位置处不同波束的接收功率。此外还需定义接收功率损耗,本文将波束最大接收功率与通过波束索引k选择的波束接收功率之比定义为功率损耗,功率损耗可以表示为:
$$ {{\xi = }}\frac{{\mathop {{\text{max}}}\limits_{l \in B} {{\text{γ}}_l}}}{{{{\text{γ}}_k}}} $$ (5) 式中,
$ {{\text{γ}}_k} = {\left\| {{{\boldsymbol{h}}_k}} \right\|^2} $ 是索引为k的波束接收功率;$ \mathop {{\text{max}}}\limits_{l \in B} {{\text{γ}}_l} $ 是集合$ B $ 中波束的最大接收功率,集合$ B $ 由所有发射波束构成。集合$ S $ 是特征波束集且$ S \subset B $ 。接下来,功率损耗概率定义为对于某些阈值$ c \geqslant 1 $ 时,$ {\text{ξ }} \gt c $ 的概率,即:$$ {P}_{\text{pl}}\left(c,S\right)=\mathbb{P}\left[\text{ξ} \gt c\right] =\mathbb{P}\left[\underset{k\in \cal{B}}{\text{max}}{\text{γ}}_{k} \gt c\underset{i\in \mathcal{S}}{\text{max}}{\text{γ}}_{i}\right] $$ (6) 基于上述定义,选择特征波束的目标是最大化接收功率,该目标可以通过选择波束以最小化功率损耗概率
$ {P_{{\text{pl}}}}\left( {c = 1,S} \right) $ 来实现。对于给定的训练预算Nb(即特征波束集大小),该问题可以公式化为子集选择问题,即:$$ \mathop {{\text{minimize}}}\limits_{S \subset B} {\text{ }}{P_{{\text{pl}}}}\left( {1,S} \right) $$ (7) 式中,
$ \left| S \right| = {N_b} $ ,$ \left| S \right| $ 表示集合$ S $ 的基数。问题(7)是一个子集选择问题,本质上是组合问题,通常很难解决,特别是当$ \left| B \right| $ 较大时将变得更难求解。不过根据$ {P_{{\text{pl}}}}\left( {1,S} \right) $ 的构成,该问题存在一个有效的解决方法。问题(7)可以等价于
$ \mathop {{\text{maximize}}}\limits_{S \subset B} {\text{ }}{\bar P_{{\text{pl}}}}\left( {1,S} \right) $ ,其中$ {\bar P_{{\text{pl}}}}\left( {1,S} \right) = 1 - {P_{{\text{pl}}}}\left( {1,S} \right) $ 。由于:$$ {\bar P_{{\text{pl}}}}\left( {1,S} \right) = \sum\limits_{l \in S} \mathbb{P} \left[ {{{\text{γ}}_l} = \mathop {\max }\limits_{k \in \mathcal{B}} {{\text{γ}}_k}} \right] $$ 是一个模函数,那么由算法1给出的贪婪解就是最优的,详见文献[21]。这是一个已知的结论,并已被多篇文献引用(详见文献[22])。
命题 1
$ {\bar P_{{\text{pl}}}}\left( {1,S} \right) $ 是模函数证明: 根据式(6)中功率损耗概率,当c = 1时,
$$ {P_{{\text{pl}}}}\left( {1,S} \right) = \mathbb{P}\left[ {\mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k} \gt \mathop {{\text{max}}}\limits_{i \in S} {{\text{γ}}_i}} \right] =$$ (8) $$ \sum\limits_{l \in B} {\mathbb{P}\left[ {{{\text{γ}}_l} \gt \mathop {{\text{max}}}\limits_{i \in S} {{\text{γ}}_i}|{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right]} \mathbb{P}\left[ {{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right]= $$ (9) $$ \sum\limits_{l \in B\backslash S} {\mathbb{P}\left[ {{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right]}= $$ (10) $$ 1 - \sum\limits_{l \in S} {\mathbb{P}\left[ {{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right]} $$ (11) 其中式(9)是全概率公式在事件
$ \left\{ {{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right\} $ 上的应用。此外式(10)中如果$ l \in S $ ,则$ \mathbb{P}\left[ {{{\text{γ}}_l} \gt \mathop {{\text{max}}}\limits_{i \in S} {{\text{γ}}_i}|{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right] = 0 $ ,如果$ l \in B\backslash S $ ,那么$ \mathbb{P}\left[ {{{\text{γ}}_l} \gt \mathop {{\text{max}}}\limits_{i \in S} {{\text{γ}}_i}|{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right] = 1 $ 。根据
$ \sum\limits_{l \in B} \mathbb{P} \left[ {{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right] = 1 $ ,可得到式(11),从而可得:$$ {\bar P_{{\text{pl}}}}\left( {1,S} \right) = \sum\limits_{l \in \mathcal{S}} {\mathbb{P}\left[ {{{\text{γ}}_l} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right]} $$ (12) 因此,对任意的
$ S \subset R \subset B $ 以及$ \forall n \in B\backslash T $ ,总是存在:$$\begin{split} {{\bar P}_{{\rm{pl}}}}\left( {1,S \cup \left\{ n \right\}} \right) - {{\bar P}_{{\rm{pl}}}}\left( {1,S} \right) =& {{\bar P}_{{\rm{pl}}}}\left( {1, R \cup \left\{ n \right\}} \right) - {{\bar P}_{{\rm{pl}}}}\left( {1,R} \right)=\\ &\mathbb{P} \left[ {{{\rm{\gamma }}_n} = \mathop {{\rm{max}}}\limits_{k \in B} {{\rm{\gamma }}_k}} \right]\\[-15pt] \end{split}$$ (13) 虽然算法1能够直观有效的选择特征波束,但是使用贪婪搜索来解决最小化问题不够高效。为此,可以将最优波束概率定义为:
$$ \begin{split} & {P_{{\text{opt}}}}\left( i \right) = \mathbb{P}\left[ {{{\rm{{\gamma }}}_i} = \mathop {{\text{max}}}\limits_{k \in B} {{\text{γ}}_k}} \right]= \\ &\quad \mathbb{P}\left[ {{{\rm{{\gamma }}}_i} \geqslant {{\rm{{\gamma }}}_k},\forall k \in B\backslash \left\{ i \right\}} \right] \end{split} $$ (14) 通过证明命题1可以提出了一个更有效的特征选择解决方案。即,根据式(11),当
$ i \in B{\backslash }{S_{n - 1}} $ 时,最小化$ {P_{{\text{pl}}}}\left( {1,S{}_{n - 1} \cup \left\{ i \right\}} \right) $ 等价于:$$ k = \mathop {{\text{argmax}}}\limits_{i \in B{\backslash }{S_{n - 1}}} {P_{{\text{opt}}}}\left( i \right) $$ (15) 这意味着算法1等价于将波束的最优波束概率降序排列,选择前Nb个波束即可完成特征波束集的构造。因此,该方案所需要训练的波束个数远小于
$ \left| B \right| $ 。算法1 mmWave波束的贪婪搜索算法
输入
$ {S_0} $ ,$N_b $ ,$ {S_n} $ ,$ {S_m} $ 输出 特征波束
$ {S_t} $ 算法初始化:设定n = 1;将
$ {S_0} $ ,$ {S_m} $ 初始化为空集for n = 1 : Nb do
${S_m} = \mathop {{\text{arg\;min}}}\limits_{i \in B\backslash {S_{n - 1}}} {\text{ }}{P_{{\text{pl}}}}\left( {1,{S_{n - 1}} \cup \left\{ i \right\}} \right)$ $ {S_t} = {S_{n - 1}} \cup {S_m} $ end for
-
在本文2.1节的基础上,本小节使用基于局部学习的特征选择聚类算法(local learning based clustering algorithm with feature selection, LLC-fs)计算最优波束概率[24],通过交叉验证确定特征波束集大小,获得场景化的特征波束集。假设将给定场景均匀划分为P个部分,MS部署在这P处收集训练数据。假设发射波束码本集合
$ B $ 的维度为K,训练数据集T由P个K维接收功率向量组成,记作${{\boldsymbol{r}}_i}$ ,$ i = 1,2, \cdots P $ 。当MS位于位置i时,BS通过交替发射K个波束生成接收向量${{\boldsymbol{r}}_i}$ ,$ i = 1,2, \cdots P $ 。数据集T可以随机分为训练集$ {P_{{\rm{train}}}} $ 和测试集$ {P_{{\rm{test}}}} $ ,大小分别占数据集T的70%和30%。根据以下两个步骤获得场景化特征波束集。1) 对K个场景化波束加权并排序
首先,在不考虑
$ {P_{{\rm{train}}}} $ 中元素排列顺序的情况下,将所有元素以矩阵形式输入LLC-fs算法。然后,LLC-fs算法将根据最优波束概率降序输出K个波束的索引,将LLC-fs算法输出的K维加权向量,记作z。2) 生成场景化特征波束集
假设正整数Nb是特征波束集
$ S $ 的大小($ {N_{\text{b}}} \leqslant K $ ),选择z的前Nb项即可生成特征波束集$ S $ 。Nb可以通过交叉验证算法确定[25]。具体而言,令$ \mu $ 表示波束搜索期望精度,令特征波束集$ S $ 的初始大小为N0,使用$ {S_0} $ 训练生成的波束预测DNN模型,并用与$ {P_{{\rm{test}}}} $ 相关的测试点计算DNN预测精度$ {\mu _0} $ ,判断$ {\mu _0} $ 是否达到$ \mu $ ,并据此不断修改N0的大小,直到$ {\mu _0} = \mu $ 。算法2总结了场景化特征波束集的产生过程,并在图2中做了直观的展示。使用特征波束集离线训练波束预测DNN模型的具体步骤将在2.3节详细阐述。算法2 基于LLC-fs的波束训练算法
输入 训练数据集T,期望精确度
$ \mu $ ,即时精确度$ {\mu _t} $ ,特征波束集大小Nb输出 场景化特征波束集S和DNN模型M
算法初始化:设定Nb = 1;
$ {\mu _t} = 0 $ ;将数据集T随机分为两个子集,其中70% 用于训练集$ {P_{{\rm{train}}}} $ 和30% 用于为测试集$ {P_{{\rm{test}}}} $ 将
$ {P_{{\rm{train}}}} $ 输入LLC-fs算法,输出波束索引按降序排序的加权向量zfor
$ {\mu _t} $ = 0 :$ \mu $ do令
$ {S_t} $ 和$ {M_t} $ 为即时特征波束集和即时DNN模型,$ {S_t} $ 由z的前Nb项组成。利用
$ {S_t} $ 生成给定应用场景的$ {M_t} $ ,并使用$ {P_{{\rm{test}}}} $ 验证$ {M_t} $ 预测结果,得到即时精确度$ {\mu _t} $ 。$ {N_b} = {N_b} + {\text{ }}1 $ $ S = {S_t} $ $ M = {M_t} $ end for
-
根据本文第1节中设定的系统和信道模型,下行可达速率可以表示为:
$$ {\boldsymbol{R}}({{\boldsymbol{y}}_{{\text{mmW}}}}(u),{\boldsymbol{f}}) = \sum\limits_{u = 1}^U {{\text{lo}}{{\text{g}}_2}(1 + SNR{{\left| {{\boldsymbol{h}}_{{\text{mmW}}}^{\text{T}}(u){\boldsymbol{f}}} \right|}^2})} $$ (16) 式中,
${{\boldsymbol{h}}_{{\text{mmW}}}}(u)$ 表示mmWave下行信道;${{\boldsymbol{y}}_{{\text{mmW}}}}(u) = {\left| {{\boldsymbol{h}}_{{\text{mmW}}}^{\text{T}}(u){\boldsymbol{f}}} \right|^2}$ 表示接收功率;${\boldsymbol{f}}$ 表示BF向量,如第1节所示,假设$ {\boldsymbol{f}} $ 在模拟域中产生。每个子载波的信噪比定义为:$$ {\rm{SNR}} = \frac{{{P_{{\text{mmW}}}}}}{{K\sigma _{{{\rm{mm}}W} }^2}} $$ (17) 最优BF向量
${{\boldsymbol{f}}^*}$ 为:$$ {{\boldsymbol{f}}^*} = \mathop {\arg {\text{max}}}\limits_{{\boldsymbol{f}} \in {\boldsymbol{F}}} {\text{ }}{\boldsymbol{R}}({{\boldsymbol{y}}_{{\text{mmW}}}}(u),{\boldsymbol{f}}) $$ (18) 对于
${\boldsymbol{f}}$ 的约束使得下行可达速率的优化问题是一个非凸问题,${{\boldsymbol{f}}^*}$ 需要通过穷举搜索获得。然而,实现这样的搜索需要估计${{\boldsymbol{h}}_{{\text{mmW}}}}$ 并且在线穷举波束训练,在应用Massive MIMO技术后,这两者较大的训练开销都将难以接受。为了减少这些开销,本文将利用特征波束集离线训练场景化的DNN模型在线预测最优BF向量。对于给定的环境,令
$ \{ {{\text{x}}_u}\} $ 表示MSu位置的集合,$\{ {{\boldsymbol{h}}_{{\text{mmW}}}}\}$ 和$\{ {{\boldsymbol{h}}_{{\rm{fea}}}}\}$ 分别表示MSu与mmWave天线阵列之间的信道和特征信道集合,其中$\{ {{\boldsymbol{h}}_{{\rm{fea}}}}\}$ 由$\{ {{\boldsymbol{h}}_{{\text{mmW}}}}\}$ 经过特征选择得到的。当MS位置相同并采用大规模天线阵列时,可以认为$ \{ {{\text{x}}_u}\} $ 与$\{ {{\boldsymbol{h}}_{{\rm{fea}}}}\}$ 和$\{ {{\boldsymbol{h}}_{{\text{mmW}}}}\}$ 间存在双射映射函数[26-27],定义为:$$ \begin{split}{\varPhi}:&\left\{{\text{x}}_{u}\right\}\iff \left\{{{\boldsymbol{h}}}_{\text{mmW}}\right\}\\ &\left\{{\text{x}}_{u}\right\}\iff \left\{{{\boldsymbol{h}}}_{{\rm{fea}}}\right\}\end{split} $$ (19) 那么接下来,可以将MS位置与下行可达速率的映射函数定义为
${\varPsi }$ :$$ \varPsi\text{ }:\text{ }\left\{{\text{x}}_{u}\right\}\to \{{\boldsymbol{R}}({{\boldsymbol{y}}}_{\text{mmW}}(u),{{\boldsymbol{f}}}_{n})\} $$ (20) 式中,n是码本F的索引,
$n = 1,2, \cdots ,\left| {\boldsymbol{F}} \right|$ 。${\varPsi }$ 将mmWave信道以及下行可达速率R与BF向量${\boldsymbol{f}}$ 相结合起来。因此,结合式(19)和式(20)可以推导出mmWave特征信道和下行可达速率之间存在映射关系${\varGamma }$ :$$ \varGamma\text{ }:\text{ }\left\{{{\boldsymbol{h}}}_{fea}\right\}\to \{{\boldsymbol{R}}({{\boldsymbol{y}}}_{\text{mmW}}(u),{{\boldsymbol{f}}}_{n})\} $$ (21) 利用特征波束集预测最优mmWave波束的过程如下。
将BSA服务区域分为多个子区域,假设MS1进入或停留在BSA服务的子区Q,且子区Q 的特征波束集SQ已获得。下面分别说明DNN模型的离线训练过程和在线预测过程。
1) DNN模型的离线训练过程
首先要构建训练网络的数据集,使用本文第2.2节所提方法生成场景化特征波束集S。其次,在每个相干时间内,通过下行链路导频估计mmWave信道,并且对mmWave下行链路进行穷举波束训练,记录每个BF向量
$ {\boldsymbol{f}} $ 对应的下行可达速率。令$ {{\boldsymbol{R}}^u} = \left\{ {R({\boldsymbol{y}}_{{\text{mmW}}}^u,{{\boldsymbol{f}}_1}), \ldots ,R({\boldsymbol{y}}_{{\text{mmW}}}^u,{{\boldsymbol{f}}_{\left| {\boldsymbol{F}} \right|}})} \right\} $ 表示MSu处所有码本波束的下行可达速率。于是,在每个相干时间数据点$( {{\boldsymbol{y}}_{{\text{mmW}}}^u,{{\boldsymbol{R}}^u}} )$ 会被添加到数据集中。最后,利用构建的训练集训练DNN模型直至收敛。基站通过该模型直接使用MS1的Nb个接收功率来预测最优mmWave波束。2) DNN模型的在线预测过程
根据特征波束集产生过程可知,给定的应用场景可以由Nb个特征波束代表。在线波束预测阶段在收到通信请求后开始,MS1发送上行导频报告向BSA所处应用场景及位置。接下来,BSA选择MS1所处位置的场景化特征波束集
$ S $ 和DNN模型,并激活属于S的Nb个波束来覆盖MS1,MS1将相应的Nb个接收功率向量记为y,并将y发送回BSA。在基站侧将y输入所属场景化的DNN模型,输出用于服务MS1的最优波束索引kopt,至此在线阶段波束预测结束。这节省了与mmWave穷举波束训练过程相关的所有训练开销。算法3中总结了上述在线处理的过程。算法3 基于在线波束预测算法
输入 场景化的特征波束集
$ {S_Q} $ 和DNN模型$ {M_Q} $ 。输出 最优波束索引kopt。
MS1发送上行导频报告向BSA所处位置。
BSA根据MS1所处位置,激活属于
$ {S_Q} $ 的Nb个波束覆盖MS1。MS1将接收到的Nb个接收功率向量记作y,并将其发送回BSA。
在基站一侧将y输入
$ {M_Q} $ 。输出预测的最优波束索引kopt。
BSA将kopt发送回MS1。
-
深度学习模型通过离线训练具有逼近非平凡函数的能力,DNN利用辅助信息预测最优mmWave波束的可行性已被证明[28]。对于本文的波束预测问题,特征波束集中的每个特征波束所对应的信道被映射到Nb个索引之一。这可以看作一个分类问题并利用DNN卓越的分类预测能力解决。DNN的任务是学习如何将特征波束接收功率向量映射到实值Nb维向量p中。因此,本文使用有单个输入层、多个隐藏层和单个输出层的多层感知器网络,该网络包含一系列非线性向量变换,如图3所示。隐藏层选用ReLU作为激活函数为神经网络引入非线性因素,在每一个隐含层后增加了Dropout层,降低网络对单个神经元的依赖,确保正则化的同时避免过拟合,增强了泛化能力。所有全连接层具有相同的宽度,每层有MNN个神经元。
在该神经网络中,预测任务的输出数量随着特征波束集的大小而不同,假设预测波束索引有Nb个波束选择,最后一层是具有Nb个神经元的全连接层,其将输入的多维波束特征向量映射到Nb维分类空间,并将映射输入到Softmax层,通过计算输入向量中每个元素i的如下概率生成概率分布:
$$ {p_i} = {{{{\rm{e}}^{{t_i}}}}}\bigg/{{\displaystyle\sum\limits_{j = 1}^{{N_b}} {{e^{{t_j}}}} }} $$ (22) 式中,
$ {t_j} $ 是Nb维投影向量的第j个元素(SoftMax的输入);$ {p_i} $ 是第i个波束索引的预测概率。最后,概率最高的索引将是用于服务MS的最优mmWave波束索引kopt。表1总结了训练DNN过程中的具体参数。表 1 深度神经网络配置参数
参数 值 隐藏层数/个 5 隐藏层神经元数/个 2048 优化器 SGDM 动量 0.9 丢弃率 10% l2正则化 1×10−4 学习率 0.001 数据集大小 9050 数据集分割 30%~70% 特征波束集大小 10 最大迭代数 100 -
令
$ \Delta = \max \left| {\left[ {{{\boldsymbol{y}}_{{\text{mmW}}}}} \right]} \right| $ 表示归一化因子,接收功率向量由归一化因子处理后分解为实部和虚部,最后重新组合成新的向量。长度为$ 2 {N_b} N_{{\rm{BS}}}^v $ 的新实值向量将作为神经网络的输入。对于数据集中的波束预测标签,可以建模为$ N_{{\rm{BS}}}^h $ 维独热向量。每个mmWave信道的一个独热向量在对应的最优BF向量的索引处为1(可由式(18)计算得到)数据集准备就绪后,训练DNN模型以实现最小化交叉熵损失函数,该函数定义为:$$ {I} = - \sum\limits_{i = 1}^D {{{\boldsymbol{t}}_i}} {\log _2}({{\boldsymbol{p}}_i}) $$ (23) 式中
$ {{\boldsymbol{t}}_i} = \left[ {{t_1},{t_2}, \cdots ,{t_D}} \right] $ 是目标的独热向量;${{\boldsymbol{p}}_i} = \left[ {p_1}, {p_2}, \cdots ,\right. \left.{p_D} \right]$ 是DNN预测属于第i类的概率。 -
本文使用DeepMIMO 数据集的两个开源仿真场景[29],分别是28 Ghz的室外环境“O1_28”和60 Ghz的室内场景“I3_60”。图4是“O1_28”的示意图,包含两条街道和一个十字路口。街道两侧共部署18个基站(BS1 - BS18),MS位于在3个均匀的x-y网格中。图5是室内场景“I3_60”的示意图,是一个包含走廊的会议室。会议室内墙部署BS1和BS2。MS位于在2个均匀的x-y网格中,分别是视距(line of sight, LOS)传播网格和非视距(non line of sight, NLOS)传播网格。最后,所有MS都配备了一个偶极子天线,其轴线与z方向对齐。本文设置了以下4种场景来检验所提方案的性能。生成这4种场景数据集所需参数如表2所示,这4种场景的基站天线数、OFDM子载波数、OFDM采样因子、天线间距和带宽均相同,分别为64、512、1、半波长和0.5 GHz。
表 2 DeepMIMO数据集生成参数
参数 场景1 场景2 场景3 场景4 数据集生成场景 O1_28 O1_28 I3_60 I3_60 激活基站序号 BS10 BS5 BS1 BS1 激活用户序号 R2150-R2200 R600-R650(E);
R4000-R4050(N);
R2150-R2200(W);
R3300-R3350(S);R1-R100 R600-R700 多径数 5 5 3 3 室外场景1:主街道场景。模拟MS和BS都在西侧街道的情景。
室外场景2:交叉路口场景。模拟BS部署在十字路口,MS位于东西南北四侧街道上的情景。
室内LOS场景3:室内视距传播场景。
室内NLOS场景4:室内非视距传播场景。
-
为了评估本文所提方案预测性能,采用预测最优波束的准确性作为性能指标。准确性分为精度Top-1和Top-n两种主要性能指标。Top-1精度定义为正确预测输入类别的频率,记作G1,可表示为:
$$ {G_1} = \frac{1}{P}\sum\limits_{p = 1}^P \mathbb{I} (\omega _p^* = {\tilde \omega _m}) $$ (24) 式中,
$ \mathbb{I}(·) $ 表示指示函数;$ \omega _p^* $ 和$ {\tilde \omega _m} $ 分别表示第p个测试样本的实际类别和预测类别。此外,由于分类DNN会产生所有波束索引的概率分布,因此本文还研究了前3个预测结果中是否包含正确类别。使用Top-3精度进行量化,记作G3,同理可以由式 (24) 得到。 -
本文使用穷举波束训练得到的系统频谱效率作为性能上界(理论值),并将本方案的预测结果与系统上界进行对比。
表3展示了在室外场景1下,Top-1和Top-3的准确率。如表所示,本文所提出方案可以明显对抗恶劣的噪声情况,具有较好的鲁棒性。如当
$ {\text{SNR}} = - 10{\text{ dB}} $ 时,Top-3准确率依然可以达到95.8%,并且当$ {\text{SNR}} = 0{\text{ dB}} $ 时,该模型Top-1和Top-3准确率等于85.9%和97.0%。这表明经过特征选择后,少量的mmWave波束训练也可以得到媲美穷举法的性能,即训练特征波束集中的10个波束而不是扫描整个码本(本例中为64个波束)。表 3 波束预测Top-1和Top-3准确率
SNR/dB Top-1/% Top-3/% −10 74.0 95.8 −5 83.1 96.4 0 85.9 97.0 5 87.3 97.1 10 89.5 97.4 15 89.7 98.5 20 90.2 98.9 为了验证所提方案在不同场景下的有效性,在图6a~图6d中分别展示了室外场景1、室内LOS场景3和室内NLOS场景4在不同信噪比下Top-1和Top-3的频谱效率。为考察所提方案在同一室外环境不同子区的特征提取和波束预测性能,图6b同时考察了室外场景1和室外场景2的Top-1性能,便于绘图起见,图6b仅考察Top-1准确率。
从图6a~图6d中可以看出,在不同场景下本方案Top-3可达率几乎与上界一致,随着SNR的提高,Top-1和Top-3频谱效率与上界的差距逐渐变小。并且当SNR ≥ −2 dB后, 图6a~图6d的Top-1可达率平均值比上界平均值分别小0.1185、0.0761和0.2013 bps/Hz。在图6b中可以看出由于户外场景2的各个子区距离基站较远,通信质量较差导致Top-1准确率略低于室外场景1,但SNR ≥ 0 dB后,都具有较好的预测准确率。
-
为了研究特征波束集的大小Nb对本方案预测性能的影响,在仅改变室外场景1配置中Nb大小时,得到了不同Nb的Top-3频谱效率,如图7所示。
本例中码本包含64个波束,当Nb = 5时,Top-1可达率平均值与上界平均值相差0.3284 bps/Hz,预测性能较差。当Nb 分别等于10、15、20时,Top-1可达率平均值比上界平均值分别少0.1185、0.1104、0.1055 bps/Hz。可以发现随着Nb增大,Top-1可达率逐渐增大并趋于稳定,从而也反映出本方案提取的特征波束是有效的。
Scenario-Based mmWave Feature Selection and Beam Prediction Algorithm
-
摘要: 为减少毫米波波束训练的时间和功耗开销,提出了一种基于通信场景的波束特征选择和预测算法。首先,根据功率损耗概率最小化准则选择最优特征波束,并利用最优波束概率生成特征波束集(波束索引的子集)。其次,为了获得通信场景的最优波束概率,采用基于局部学习的特征选择聚类算法(LLC-fs)。最后,由于场景化特征波束集与最优波束之间为隐式、非线性映射关系,利用了DNN模型逼近该映射,进而使用离线训练模型实现从特征波束集到最优波束的预测。仿真结果表明,使用离线训练场景化DNN模型即可在线预测最优毫米波波束。预测性能可以逼近穷举波束搜索算法,并有效减小波束搜索的开销。Abstract: To reduce the time and power overhead of millimeter wave (mmWave) beam training, a beam feature selection and prediction algorithm based on communication scenarios is proposed. First, the optimal feature-beam is selected according to the power loss probability minimization criterion, and a feature-beam set (a subset of beam indices) is generated using the optimal beam probability. Second, to obtain the optimal beam probability for communication scenarios, the local learning based clustering algorithm with feature selection (LLC-fs) is adopted. Finally, since there is an implicit and nonlinear mapping relationship between the scene-based feature-beam set and the optimal beam, the DNN model is used to approximate the mapping, and the offline training model is used to realize the prediction from the feature-beam set to the optimal beam. The simulation results show that the optimal mmWave beam can be predicted online by using the offline-trained scene-based DNN model. The prediction performance can approach the exhaustive beam search algorithm and effectively reduce the overhead of beam search.
-
Key words:
- beam prediction /
- beam training /
- deep neural network /
- feature selection /
- mmWave communications
-
表 1 深度神经网络配置参数
参数 值 隐藏层数/个 5 隐藏层神经元数/个 2048 优化器 SGDM 动量 0.9 丢弃率 10% l2正则化 1×10−4 学习率 0.001 数据集大小 9050 数据集分割 30%~70% 特征波束集大小 10 最大迭代数 100 表 2 DeepMIMO数据集生成参数
参数 场景1 场景2 场景3 场景4 数据集生成场景 O1_28 O1_28 I3_60 I3_60 激活基站序号 BS10 BS5 BS1 BS1 激活用户序号 R2150-R2200 R600-R650(E);
R4000-R4050(N);
R2150-R2200(W);
R3300-R3350(S);R1-R100 R600-R700 多径数 5 5 3 3 表 3 波束预测Top-1和Top-3准确率
SNR/dB Top-1/% Top-3/% −10 74.0 95.8 −5 83.1 96.4 0 85.9 97.0 5 87.3 97.1 10 89.5 97.4 15 89.7 98.5 20 90.2 98.9 -
[1] 黄劲安, 区奕宁, 董力, 等. 5G空口设计与实践进阶[M]. 北京: 人民邮电出版社, 2019. HAUNG J N, QU Y N, DONG L, et al. 5G air interface designing and network construction advancing[M]. Beijing: The People's Posts and Telecommunications Press, 2019. [2] KEBEDE T, WONDIE Y, STEINBRUNN J, et al. Precoding and beamforming techniques in mm wave-massive MIMO: Performance assessment[J]. IEEE Access, 2022, 10: 16365-16387. doi: 10.1109/ACCESS.2022.3149301 [3] KUTTY S, SEN D. Beamforming for millimeter wave communications: an inclusive survey[J]. IEEE Communications Surveys & Tutorials, 2016, 18(2): 949-973. [4] 侯嘉智. 5G毫米波波束搜索算法研究[D]. 重庆: 重庆邮电大学, 2020. HOU J Z. Research on 5G millimeter wave beam search algorithm[D]. Chongqing: Chongqing University of Posts and Telecommunications, 2020. [5] de DONNO D, PALACIOS J, WIDMER J. Millimeter-wave beam training acceleration through low-complexity hybrid transceivers[J]. IEEE Transactions on Wireless Communications, 2017, 16(6): 3646-3660. doi: 10.1109/TWC.2017.2686402 [6] 吴伟. 毫米波MIMO无线通信系统中的混合波束成型技术研究[D]. 北京: 北京邮电大学, 2019. WU W. Research on hybrid beamforming technology in millimeter-wave MIMO wireless communication system [D]. Beijing: Beijing University of Posts and Telecommunications, 2019. [7] WANG J Y, LAN Z, PYO C W, et al. Beam codebook-based beamforming protocol for multi Gbps millimeter wave WPAN systems[J]. IEEE Journal on Selected Areas in Communications, 2009, 27(8): 1390-1399. doi: 10.1109/JSAC.2009.091009 [8] LEE H, KO Y. Low complexity codebook-based beamforming for MIMO-OFDM systems in millimeter wave wpAN[J]. IEEE Transactions on Wireless Communications, 2011, 10(11): 3607-3612. doi: 10.1109/TWC.2011.091911.102114 [9] 张仁民. 毫米波通信系统多分辨率码本设计与低开销波束训练技术研究[D]. 南京: 东南大学, 2019. ZHANG R M. Multi-Resolution codebook design and low-overhead beam training for millimeter-wave communications[D]. Nanjing: Southeast University, 2019. [10] CHEN H J, SUN C Y, JIANG F, et al. Beams selection for mmwave multi-connection based on sub-6 GHz predicting and parallel transfer learning[C]//2021 IEEE/CIC International Conference on Communications in China. Xiamen: IEEE, 2021: 469-474. [11] ALRABEIAH M, ALKHATEEB A. Deep learning for mmwave beam and blockage prediction using sub-6GHz channels[J]. IEEE Transactions on Communications, 2020, 68(9): 5504-5518. doi: 10.1109/TCOMM.2020.3003670 [12] ALI A, GONZÁLEZ-PRELCIC N, Jr HEATH R. Millimeter wave beam-selection using out-of-band spatial information[J]. IEEE Transactions on Wireless Communications, 2018, 17(2): 1038-1052. doi: 10.1109/TWC.2017.2773532 [13] MA K, HE D X, SUN H C, et al. Deep learning assisted calibrated beam training for millimeter-wave communication systems[J]. IEEE Transactions on Communications, 2021, 69(10): 6706-6721. doi: 10.1109/TCOMM.2021.3098683 [14] KAO W, ZHAN S, LEE T. AI-Aided 3-D beamforming for millimeter wave communications[C]//2018 International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS). Ishigaki: IEEE, 2018: 278-283. [15] JOUNG S, JEONG C, CHOI S. Deep learning based beam selection for wide beam sweeping system[C]//2022 International Conference on Electronics Information and Communication (ICEIC). Jeju: IEEE, 2022: 1-3. [16] KIM T, LOVE D. Virtual AoA and AoD estimation for sparse millimeter wave MIMO channels[C]//2015 IEEE 16th International Workshop on Signal Processing Advances in Wireless Communications (SPAWC). Stockholm: IEEE, Jeju: IEEE, 2015: 146-150. [17] HAN Y, LEE J. Two-Stage compressed sensing for millimeter wave channel estimation[C]//2016 IEEE International Symposium on Information Theory (ISIT). Barcelona: IEEE, 2016: 860-864. [18] HEATH R, Jr GONZÁLEZ-PRELCIC N, RANGAN S, et al. An overview of signal processing techniques for millimeter wave MIMO systems[J]. IEEE Journal of Selected Topics in Signal Processing, 2016, 10(3): 436-453. doi: 10.1109/JSTSP.2016.2523924 [19] LAKMALI B, DIAS D. Database correlation for GSM location in outdoor & indoor environments[C]//2008 4th International Conference on Information & Automation for Sustainability. Colombo: IEEE, 2008: 42-47. [20] KUPERSHTEIN E, WAX M, COHEN I. Single-Site emitter localization via multipath fingerprinting[J]. IEEE Transactions on Signal Processing, 2013, 61(1): 10-21. doi: 10.1109/TSP.2012.2222395 [21] EDMONDS J. Matroids and the greedy algorithm[J]. Mathematical Programming, 1971, 1(1): 127-136. doi: 10.1007/BF01584082 [22] CALINESCU G, CHEKURI C, PAL M, et al. Maximizing a monotone submodular function subject to a matroid constraint[J]. SIAM Journal on Computing, 2011, 40(6): 1740-1766. doi: 10.1137/080733991 [23] NEMHAUSER G, WOLSEY L, FISHER M. An analysis of approximations for maximizing submodular set functions—I[J]. Mathematical programming, 1978, 14(1): 265-294. doi: 10.1007/BF01588971 [24] ZENG H, CHEUNG Y. Feature selection and kernel learning for local learning-based clustering[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2011, 33(8): 1532-1547. [25] TANAKA A, IMAI H. Kernel ridge regression with autocorrelation prior: Optimal model and cross-validation[C]//2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Barcelona: IEEE, 2020: 3872-3876. [26] ALRABEIAH M, ALKHATEEB A. Deep learning for TDD and FDD massive MIMO: Mapping channels in space and frequency[C]//2019 53rd Asilomar Conference on Signals, Systems, and Computers. Pacific Grove: IEEE, 2019: 1465-1470. [27] VIEIRA J, LEITINGER E, SARAJLIC M, et al. Deep convolutional neural networks for massive MIMO fingerprint-based positioning[C]//2017 IEEE 28th Annual International Symposium on Personal, Indoor, and Mobile Radio Communications (PIMRC). Montreal: IEEE, 2017: 1-6. [28] HORNIK K, STINCHCOMBE M, WHITE H. Multilayer feedforward networks are universal approximators[J]. Neural Networks, 1989, 5(2): 359-366. [29] ALKHATEEB A. Deep MIMO: A generic deep learning dataset for millimeter wave and massive MIMO applications[EB/OL]. [2022-02-23]. https://arxiv.org/pdf/1902.06435.pdf.