基于HAGA的D2D-NOMA资源分配优化算法

引用本文

宋勇春, 王茜竹, 高正念. 基于HAGA的D2D-NOMA资源分配优化算法[J]. 计算机工程, 2022, 48(2), 275-280, 290. DOI: 10.19678/j.issn.1000-3428.0060148.

SONG Yongchun, WANG Qianzhu, GAO Zhengnian. D2D-NOMA Resource Allocation Optimization Algorithm Based on HAGA[J]. Computer Engineering, 2022, 48(2), 275-280, 290. DOI: 10.19678/j.issn.1000-3428.0060148.

基金项目

重庆市科技重大主题专项重点示范项目（cstc2018jszx-cyztzxX0035）；重庆市教委科学技术研究项目（KJQN201800642）

作者简介

宋勇春（1995—），女，硕士研究生，主研方向为移动通信技术;
王茜竹，正高级工程师;
高正念，硕士研究生

文章历史

收稿日期：2020-11-30
修回日期：2021-01-12

Contents Abstract Full text Figures/Tables PDF

基于HAGA的D2D-NOMA资源分配优化算法

宋勇春^1,2 , 王茜竹^1,2 , 高正念^1,2

1. 重庆邮电大学电子信息与网络工程研究院, 重庆 400065;
2. 新一代信息网络与终端协同创新中心, 重庆 400065

收稿日期：2020-11-30；修回日期：2021-01-12

基金项目：重庆市科技重大主题专项重点示范项目（cstc2018jszx-cyztzxX0035）；重庆市教委科学技术研究项目（KJQN201800642）

作者简介：宋勇春（1995—），女，硕士研究生，主研方向为移动通信技术; 王茜竹，正高级工程师; 高正念，硕士研究生.

E-mail：dachun818@foxmail.com

摘要：针对无线系统带宽资源有限、基站负载压力大、传输时延长等问题，提出一种基于非正交多址接入技术的D2D系统吞吐量最大化资源分配算法。在不同用户的服务质量约束条件下，建立D2D系统吞吐量最大化资源分配模型。该模型的优化目标是一个混合整数非线性规划问题，将其解耦为信道匹配与功率分配2个子问题并分别进行处理，利用自适应惩罚函数法处理约束条件并提出一种基于爬山策略的自适应遗传算法以对问题进行求解。仿真结果表明，与GA、AGA算法相比，该算法能够有效提高D2D系统的吞吐量，且收敛性能更好。

D2D-NOMA Resource Allocation Optimization Algorithm Based on HAGA

SONG Yongchun^1,2 , WANG Qianzhu^1,2 , GAO Zhengnian^1,2

1. Institute of Electronic Information and Network Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China;
2. Collaborative Innovation Center for Information Communication Technology, Chongqing 400065, China

Abstract: To address the limited bandwidth resources for wireless systems, heavy loading pressure of base stations, and long-distance transmission delay, this paper proposes a resource allocation algorithm to maximize the throughput of Device-to-Device(D2D) systems based on the Non-Orthogonal Multiple Access(NOMA). A resource allocation model is constructed to maximize the throughput of D2D systems based on Quality of Service(QoS) constraints of different users. The optimization problem is simplified into a mixed integer nonlinear programming problem, which is subsequently decoupled into two sub-problems: channel matching and power allocation. On this basis, the constraint conditions are treated with the adaptive penalty function method, and an adaptive genetic algorithm based on Hill-climbing strategy is proposed to solve the problem. Simulation results show that compared with GA and AGA, the proposed algorithm can effectively improve the throughput of D2D systems and provide better convergence performance.

开放科学（资源服务）标志码（OSID）：

0 概述

根据思科数据显示，预计到2022年，全球每月数据流量将达到77艾字节^[1]。移动数据流量需求呈指数级增长，将导致当前无线网络的带宽资源匮乏以及基站严重过载。为缓解上述问题，D2D（Device-to-Device）技术应运而生，该技术允许邻近设备在没有基站的辅助下进行数据交换^[2]，在短距离通信场景中可以大幅提升设备之间的信道增益，降低通信时延及终端发射功率并延长终端待机时间^[3]。此外，通过复用蜂窝用户的信道进行通信，能够有效提高无线资源的利用率^[4]。D2D技术的引入使得无线通信网络的运行更加灵活高效，但是，基于传统的正交多址接入（Orthogonal Multiple Access，OMA）方式的D2D通信，一个资源块只允许一个D2D用户通信，无线资源并未得到充分利用^[5]。

在非正交多址接入（Non-Orthogonal Multiple Access，NOMA）技术中，接收端利用连续干扰消除（Serial Interference Cancellation，SIC）技术对发送的叠加信号进行解调^[6]，实现了多用户功率域的复用，从而大幅提高了系统吞吐量和频谱效率，因此，NOMA被视为5G最有前景的候选技术之一^[7]。文献[8]分析表明，将NOMA技术应用于D2D通信场景能较好地提高D2D系统的吞吐量，但其所带来的链路干扰问题不可忽略，且引入功率域复用后，同一个子载波被多个用户共用，使得该场景下的资源分配变得更加复杂，为解决该问题，需要合理优化信道与功率分配。

目前，对基于NOMA的D2D通信场景资源分配问题的研究已经取得较多成果。文献[9]在保证蜂窝用户服务质量（QoS）的条件下，提出一种逐步迭代算法，从而求解资源分配问题的次优解并实现D2D用户对的速率最大化。文献[10]基于随机固定功率分配系数，研究一种求解子信道匹配问题的低复杂度算法，采用SCA（Successive Convex Approximation）迭代获得次优功率分配方案，从而最大化系统总速率。文献[11]研究一种联合子信道分配、用户配对、功率控制的资源分配方案，以最小化传输功率。文献[12]在多个蜂窝用户以NOMA方式通信时，保证其SIC解调顺序时的蜂窝用户功率，通过对偶迭代给D2D用户分配合适资源，实现D2D用户对的总速率最大化。文献[13]研究一种联合信道分配与功率分配的资源分配方案，基于一对一的双边匹配解决资源匹配问题，并利用拉格朗日乘子法求解最优功率分配系数。文献[14]以能效最大化和时延最小化为目标，提出一种基于多对一匹配进行子载波分配的方案，使用拉格朗日函数求得功率分配方案。文献[15]构建一种基于纳什均衡的模型，考虑NOMA用户不同程度的干扰，从而最大化每个参与者的自身利益。但是，传统优化算法在解决此类NP问题时计算复杂，而启发式算法鲁棒性高、容易实现、复杂度低，因此，其在最优化算法领域被广泛应用，且越来越多的学者将其用于资源分配任务。文献[16]以最大化D2D通信性能为目标，提出一种基于DDM（Decoupled Direct Method）的优化框架，并利用DE（Differential Evolution）启发式算法进行求解。文献[17]提出一种基于GA（Genetic Algorithm）的资源分配方法，以最大化D2D系统的总吞吐量。

启发式算法在很大程度上依赖于控制参数的选取，且存在搜索早熟、搜索慢等问题，使其难以跳出局部最优解，算法收敛时间长。针对传统遗传算法的不足，本文结合惩罚函数法与爬山算法对其进行改进，并提出一种基于HAGA（Hill-climbing Adaptive Genetic Algorithm）的优化算法，以最大化D2D-NOMA系统的吞吐量。具体地，本文建立一种基于NOMA的D2D通信资源分配模型。在满足不同用户QoS、D2D用户发射功率及信道分配约束下，最大化D2D系统吞吐量。针对资源分配问题，提出一种基于HAGA的优化算法。利用惩罚函数法将原约束优化问题转化为无约束优化问题，并采用自适应惩罚系数优化解空间。在此基础上，对信道匹配标识和功率分配因子进行染色体编码、自适应交叉、自适应变异，以生成候选种群，然后利用爬山算法对候选种群进行二次搜索，避免优势个体丢失并加快收敛速度，从而得到全局最优解。

1 系统模型与问题描述

本文考虑单小区上行链路传输场景，假设基站可以获得所有用户的信道信息，且每一个蜂窝用户占用一个子信道，各子信道间相互正交互不干扰。在D2D组内采用非正交多址接入方式进行下行通信，D2D组内发射用户向接收用户发送叠加信号，系统模型如图 1所示。单小区包含一个基站、$ N $个蜂窝用户和$ M $组D2D用户，每个D2D组有一个发射用户和$ K $个接收用户，接收用户随机分布在以发射用户为圆心、$ d $为半径的圆中。本文假设每个D2D组内的接收用户数相等，且每个D2D组仅允许复用一个蜂窝用户信道，而同一个信道可以被多个D2D组复用。因此，在同一个信道上，D2D接收用户会受到蜂窝用户、同一组内其他接收用户以及复用同一信道的不同D2D组发射用户的干扰。

	Download: JPG larger image
图 1 系统模型 Fig. 1 System model

在本文系统中，假设集合$ C=\{{c}_{1}, {c}_{2}, \cdots, {c}_{n}, \cdots, {c}_{N}\} $表示蜂窝用户集合，其中$ {c}_{n} $表示蜂窝用户$ n $，集合$ D=\{{D}_{1}, {D}_{2}, \cdots, {D}_{m}, \cdots, {D}_{M}\} $表示$ M $个D2D组的所有接收用户，其中$ {D}_{m}=\{{d}_{m1}, {d}_{m2}, \cdots, {d}_{mk}, \cdots, {d}_{mK}\} $为组$ m $内$ K $个接收用户。同时，假设蜂窝用户的发射功率均为$ {P}_{C} $，每个D2D组内发射用户的发射总功率均为$ {P}_{D} $。蜂窝用户$ n $与基站之间的信道增益表示为$ {h}_{cn, \mathrm{B}} $，发射用户$ m $与基站之间的信道增益表示为$ {h}_{m, \mathrm{B}} $，$ {c}_{n} $与$ {d}_{mk} $之间的信道增益表示为$ {h}_{cn, mk} $，组$ m $内发射用户与接收用户$ k $之间的信道增益表示为$ {h}_{m, mk} $。不失一般性，假设$ {\left|{h}_{m, m1}\right|}^{2}\le {\left|{h}_{m, m2}\right|}^{2}\le \cdots \le {\left|{h}_{m, mk}\right|}^{2}\le \cdots \le {\left|{h}_{m, mK}\right|}^{2} $，用$ {v}_{n}^{m}\in \left\{\mathrm{0, 1}\right\} $表示信道匹配标识，$ {v}_{n}^{m} $为1时表示D2D组$ m $复用蜂窝用户$ n $的信道，$ {v}_{n}^{m} $为0时表示不复用，用$ {\sigma }^{2} $表示用户接收到的高斯白噪声功率。

由模型分析可知，子信道$ n $上基站接收到蜂窝用户的接收信噪比为：

$ \mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n}^{C}=\frac{{P}_{C}{\left|{h}_{cn, \mathrm{B}}\right|}^{2}}{\sum \limits_{M}{v}_{n}^{m}{P}_{D}{\left|{h}_{m, \mathrm{B}}\right|}^{2}+{\sigma }^{2}} $

(1)

假设D2D组$ m $复用$ {c}_{n} $信道进行数据传输，则用户$ {d}_{mk} $在子信道$ n $上的接收信噪比为：

$ \mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D}=\frac{{\alpha }_{mk}{P}_{D}{\left|{h}_{m, mk}\right|}^{2}}{{P}_{C}{\left|{h}_{cn, mk}\right|}^{2}+\sum \limits_{m^\mathrm{*}=M/m}{v}_{n}^{m^\mathrm{*}}{P}_{D}{\left|{h}_{m^\mathrm{*}, mk}\right|}^{2}+\sum \limits_{mk\mathrm{{'}}=mk+1}{\alpha }_{Dmk}{P}_{D}{\left|{h}_{m, mk}\right|}^{2}+{\sigma }^{2}} $

(2)

其中：$ {\alpha }_{mk} $为组内接收用户$ k $的功率分配系数。根据香农公式可知，第$ m $个D2D组在子信道$ n $上的容量为：

$ {R}_{Dm}^{n}=\sum \limits_{K}{\rm{lb}}\left(1\right.+{\rm{SIN}}{{\rm{R}}}_{n, mk}^{D}) $

(3)

因此，D2D系统的总吞吐量为：

$ {R}_{D\mathrm{s}\mathrm{u}\mathrm{m}}=\sum \limits_{N}\sum \limits_{M}{v}_{n}^{m}\left(\sum \limits_{K}\mathrm{l}\mathrm{b}(1+\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D})\right) $

(4)

2 算法设计 2.1 优化问题构建

本文通过优化D2D组信道匹配和组内用户在NOMA方式下的功率分配，以最大化D2D通信系统的吞吐量，目标优化问题建模为$ {P}_{1} $：

$ {P}_{1}:\underset{({v}_{n}^{m}, {\alpha }_{mk})}{\mathrm{m}\mathrm{a}\mathrm{x}}\left(\sum \limits_{N}\sum \limits_{M}{v}_{n}^{m}\left(\sum \limits_{K}\mathrm{l}\mathrm{b}(1+\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D})\right)\right) $

$ \mathrm{s}.\mathrm{t}.{\mathrm{C}}_{1}:\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n}^{C}\ge {r}_{\mathrm{t}\mathrm{h}}^{C}, \forall n\in N $

$ {\mathrm{C}}_{2}:\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D}\ge {r}_{\mathrm{t}\mathrm{h}}^{mk}, \forall k\in K, \forall m\in M $

$ {\mathrm{C}}_{3}:\sum \limits_{N}{v}_{n}^{m}\le 1, \forall m\in M, \forall n\in N $

$ {\mathrm{C}}_{4}:\sum \limits_{k\in K}{\alpha }_{mk}\le 1, \forall k\in K, \forall m\in M $

$ {\mathrm{C}}_{5}:{\alpha }_{mk}\ge {\alpha }_{mk+1}, \forall k\in K, \forall m\in M $

$ {\mathrm{C}}_{6}:{v}_{n}^{m}\in \left\{\mathrm{0, 1}\right\}, \forall m\in M, \forall n\in N $

其中：$ {r}_{\mathrm{t}\mathrm{h}}^{C} $为蜂窝用户的信噪比阈值；$ {r}_{\mathrm{t}\mathrm{h}}^{mk} $为D2D用户的信噪比阈值；$ {\mathrm{C}}_{1} $与$ {\mathrm{C}}_{2} $分别保证蜂窝用户与D2D用户满足通信QoS要求；$ {\mathrm{C}}_{3} $限定每个D2D组最多复用一个蜂窝用户的信道；$ {\mathrm{C}}_{4} $限制D2D接收用户的功率分配系数之和不能超过D2D用户的发射用户固定总功率；$ {\mathrm{C}}_{5} $保证D2D组内NOMA准则的应用；$ {\mathrm{C}}_{6} $表示信道匹配状况为复用或不复用。

2.2 基于HAGA的资源分配策略

通过分析优化目标可以发现，目标函数中存在二进制整数变量$ {v}_{n}^{m} $及连续变量$ {\alpha }_{mk} $，该优化问题属于混合整数规划的NP难题，因此，本文将其分解为2个部分进行求解。由于D2D系统性能高度依赖D2D组内NOMA方案，因此确定资源分配方案尤为重要。本文第一步通过固定功率分配系数，求解信道匹配方案；第二步根据信道匹配方案进行功率分配系数求解。

考虑到目标函数的NP难解性，使用传统方法不易处理，而遗传算法可以很好地解决此类NP问题，该类算法具有良好的全局搜索能力，但是，遗传算法未有效利用反馈信息，导致搜索速度较慢，在解决大规模计算问题时容易陷入“早熟”，且其解依赖于参数的选择。基于此，本文利用自适应惩罚函数法改进传统遗传算法的适应度函数，同时采用基于爬山策略的自适应遗传算法提升全局搜索性能并加快收敛速度。本文算法由染色体编码、适应度计算、种群选择、交叉重组、染色体变异、爬山再搜索这6个部分组成，算法流程如图 2所示。

	Download: JPG larger image
图 2 本文算法流程 Fig. 2 The procedure of algorithm in this paper

2.3 基于HAGA的信道匹配求解

假设每个D2D组中功率分配系数为固定值，用$ {\alpha }_{mk^\mathrm{*}} $表示，则原目标函数转化为$ {P}_{2} $：

$ \begin{array}{l}{P}_{2}:\underset{\left({v}_{n}^{m}\right)}{\mathrm{m}\mathrm{a}\mathrm{x}}\left(\sum \limits_{N}\sum \limits_{M}{v}_{n}^{m}\left(\sum \limits_{K}\mathrm{l}\mathrm{b}(1+\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D})\right)\right)\\ \mathrm{s}.\mathrm{t}.{\mathrm{C}}_{1}:\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n}^{C}\ge {r}_{\mathrm{t}\mathrm{h}}^{C}, \forall n\in N\\ {\mathrm{C}}_{3}:\sum \limits_{N}{v}_{n}^{m}\le 1, \forall m\in M, \forall n\in N\\ {\mathrm{C}}_{6}:{v}_{n}^{m}\in \left\{\mathrm{0, 1}\right\}, \forall m\in M, \forall n\in N\end{array} $

本文算法具体步骤如下：

1）染色体编码。为了缩短染色体长度，加快算法收敛，并尽可能减少适应度计算过程中的约束条件，本文采取实值编码方式。D2D组信道匹配染色体编码如下：

$ V=[{v}_{1}, {v}_{2}, \cdots, {v}_{m}, \cdots, {v}_{M}] $

(5)

其中：$ {v}_{m}(1\le {v}_{m}\le N，1\le m\le M) $的值对应其复用的子信道序号，如$ V=[\mathrm{2, 1}, \cdots, 2] $中值一样的表示复用同一个信道。

2）适应度计算。本文优化模型是带约束的最大化吞吐量模型，因此，需要将约束优化问题转化为无约束优化问题，而惩罚函数法是遗传算法中处理约束条件最常用的一种方法，本文引用外点惩罚法对目标函数进行处理，如下：

$ {f}_{\mathrm{f}\mathrm{i}\mathrm{t}\mathrm{n}\mathrm{e}\mathrm{s}\mathrm{s}}=G\left({v}_{n}^{m}\right)-\mathrm{m}\mathrm{i}\mathrm{n}G\left({v}_{n}^{m}\right) $

(6)

其中：$ G\left({v}_{n}^{m}\right) $为惩罚函数，计算如式（7）所示。

$ G\left({v}_{n}^{m}\right)=\sum \limits_{N}\sum \limits_{M}{v}_{n}^{m}\left(\sum \limits_{K}\mathrm{l}\mathrm{b}(1+\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D})\right)-C\left(\rho \right)\mathit{\Phi } \left({v}_{n}^{m}\right) $

(7)

为了提高算法的鲁棒性及搜索能力，本文参考文献[18]对传统惩罚函数进行改进。考虑到在优化早期种群中可行解数量较少，此时惩罚系数应较高，随着种群的进化，种群中产生的可行解增多，惩罚系数则应减小，当种群中全部是可行解时，惩罚系数应减小到0。因此，本文将惩罚系数表示为：

$ C\left(\rho \right)={\alpha }^{2}\mathrm{l}\mathrm{b}\frac{1}{{\rho }^{\alpha }} $

(8)

其中：$ \alpha $为当前个体不满足约束条件的个数；$ \rho $为可行解比例，取值为$ \left(\mathrm{0, 1}\right] $之间的实数，当$ \rho $趋近于0时表示当前种群几乎没有可行解，当$ \rho =1 $时表示当前种群全为可行解。则当前个体的惩罚项表示为：

$ \mathit{\Phi } \left({v}_{n}^{m}\right)=\sum {\phi }_{j}\left({v}_{n}^{m}\right) $

(9)

$ {\phi }_{j}\left({v}_{n}^{m}\right)=\mathrm{m}\mathrm{a}\mathrm{x}[0, {g}_{j}({v}_{n}^{m}\left)\right] $

(10)

其中：$ {g}_{j}\left({v}_{n}^{m}\right) $为不等式约束条件。因此，根据给定的适应度函数，算法可以在个体更新迭代的操作下找到最优解，下文将$ {f}_{\mathrm{f}\mathrm{i}\mathrm{t}\mathrm{n}\mathrm{e}\mathrm{s}\mathrm{s}} $简记为$ f $。

3）种群选择。本文使用轮盘赌选择方式，通过计算个体被选择的概率（即该个体的适应度$ f $与当前种群的适应度之和），对每一代种群个体进行概率性的有放回选取，便于后续优化。因此，具体的选择概率$ {P}_{\mathrm{s}\mathrm{e}\mathrm{l}} $可以表示为：

$ {P}_{\mathrm{s}\mathrm{e}\mathrm{l}}=\frac{f}{\sum f} $

(11)

4）交叉重组。本文针对取值为二进制整数的信道匹配标识，采取单点交叉法，通过随机产生的交叉位点选取2个父代个体染色体的基因进行交换组合，以产生新的个体。自适应交叉概率$ {P}_{\mathrm{c}\mathrm{r}\mathrm{o}} $为：

$ {P}_{\mathrm{c}\mathrm{r}\mathrm{o}}=\left\{\begin{array}{ll}\frac{{k}_{1}({f}_{\mathrm{m}\mathrm{a}\mathrm{x}}-f{'})}{{f}_{\mathrm{m}\mathrm{a}\mathrm{x}}-{f}_{\mathrm{a}\mathrm{v}\mathrm{g}}}, f{'}\ge {f}_{{\rm{avg}}}& \\ {k}_{2}, f{'} < {f}_{{\rm{avg}}}& \end{array}\right. $

(12)

5）染色体变异。本文针对取值为整数的信道匹配标识，采取整数值突变算法，通过对子代个体随机产生的变异位点，变异染色体上的某些基因从而生成新个体。具体的自适应变异概率$ {P}_{\mathrm{m}\mathrm{u}\mathrm{t}} $为：

$ {P}_{\mathrm{m}\mathrm{u}\mathrm{t}}=\left\{\begin{array}{l}\frac{{k}_{3}({f}_{\mathrm{m}\mathrm{a}\mathrm{x}}-f{'})}{{f}_{\mathrm{m}\mathrm{a}\mathrm{x}}-{f}_{\mathrm{a}\mathrm{v}\mathrm{g}}}, f\ge {f}_{\mathrm{a}\mathrm{v}\mathrm{g}}\\ {k}_{4}, f < {f}_{\mathrm{a}\mathrm{v}\mathrm{g}}\end{array}\right.\begin{array}{c}\\ \end{array} $

(13)

其中：$ {f}_{\mathrm{a}\mathrm{v}\mathrm{g}} $为当前种群平均适应度；$ {f}_{\mathrm{m}\mathrm{a}\mathrm{x}} $为当前种群最大适应度；$ f{'} $为2个交叉父代个体中较大的适应度；$ f $为变异个体的适应度；$ {k}_{1}\mathrm{、}{k}_{2}\mathrm{、}{k}_{3}\mathrm{、}{k}_{4} $为$ \left[\mathrm{0, 1}\right] $区间的常数。当种群内个体适应度较高时，为了使好基因尽可能保留到下一代，应使交叉概率和变异概率减小；当种群内个体适应度较低时，应使基因尽可能淘汰，因此交叉概率和变异概率应增加。通常在进化初期，种群的多样性较高，可适当增大其交叉概率，减小变异概率；在进化后期，种群多样性降低，应适当减小其交叉概率，增大变异概率^[19]。

6）新种群的再次进化。为了进一步加快算法的收敛速度并提升搜索性能，本文使用爬山算法避免遍历搜索以快速找到局部最优解。采用爬山算法对新种群的个体进行二次搜索^[20]，选取选择、交叉过后的候选种群中适应度较高的优良个体，作为爬山算法的搜索空间，在完成变异操作后利用爬山算法对新个体进行再次搜索，若搜索空间的个体适应度函数值优于变异个体，则用其更新当前变异后的候选种群，否则将其舍弃。将经过爬山算法的种群作为新种群，进入适应度计算步骤。

2.4 功率分配问题求解

由上文可获得信道分配方案，对于给定的子信道分配策略$ {v}_{n}^{m}={v}_{n}^{m^\mathrm{*}} $，则原目标函数转化为$ {P}_{3} $：

$ {P}_{3}:\underset{\left({\alpha }_{mk}\right)}{\mathrm{m}\mathrm{a}\mathrm{x}}\left(\sum \limits_{N}\sum \limits_{M}{v}_{n}^{m\mathrm{*}}\left(\sum \limits_{K}\mathrm{l}\mathrm{b}(1+\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D})\right)\right) $

由于已经确认信道匹配方案，且正交发射用户的总功率固定，因此各子信道上的D2D组功率分配系数可单独求解，原目标函数转换为$ {P}_{4} $：

$ {P}_{4}:\underset{\left({\alpha }_{mk}\right)}{\mathrm{m}\mathrm{a}\mathrm{x}}\left(\sum \limits_{M}\sum \limits_{K}\mathrm{l}\mathrm{b}(1+\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D})\right) $

$ \mathrm{s}.\mathrm{t}.{\mathrm{C}}_{2}:\mathrm{S}\mathrm{I}\mathrm{N}{\mathrm{R}}_{n, mk}^{D}\ge {r}_{\mathrm{t}\mathrm{h}}^{mk}, \forall k\in K, \forall m\in M $

$ {\mathrm{C}}_{4}:\sum \limits_{k\in K}{\alpha }_{mk}\le 1, \forall k\in K, \forall m\in M $

$ {\mathrm{C}}_{5}:{\alpha }_{mk}\ge {\alpha }_{mk+1}, \forall k\in K, \forall m\in M $

与信道匹配模型相同，本文在功率分配问题求解时同样使用HAGA算法，染色体编码同样采取实值编码；与信道匹配模型不同，该部分实值为连续值，处理如下：

1）染色体编码：

$ \alpha =[{\alpha }_{11}, {\alpha }_{12}, \cdots, {\alpha }_{1K}, \cdots, {\alpha }_{M1}, \cdots, {\alpha }_{MK}] $

(14)

其中：功率分配系数$ {\alpha }_{mk}\in \left(\mathrm{0, 1}\right) $。

2）适应度计算同样基于惩罚函数得到：

$ {f}_{\mathrm{f}\mathrm{i}\mathrm{t}\mathrm{n}\mathrm{e}\mathrm{s}\mathrm{s}}=G\left({\alpha }_{mk}\right)-\mathrm{m}\mathrm{i}\mathrm{n}G\left({\alpha }_{mk}\right) $

(15)

3）种群选择使用轮盘赌选择方式，选择概率为$ {P}_{\mathrm{s}\mathrm{e}\mathrm{l}} $。

4）交叉重组使用两点交叉法，且限制2个交叉点的选择个数为$ K $的倍数，以保证基因的片段性，交叉概率同样采用自适应交叉概率$ {P}_{\mathrm{c}\mathrm{r}\mathrm{o}} $。

5）染色体变异：由于功率分配因子是（0，1）之间的连续变量，因此本文采用高斯变异法进行基因变异，变异概率同样采用自适应变异概率$ {P}_{\mathrm{m}\mathrm{u}\mathrm{t}} $。

6）新种群的再次进化采取与信道匹配相同的基于爬山策略的二次搜索算法。

3 仿真与性能分析 3.1 仿真参数

对本文所提算法的信道匹配与功率分配性能进行仿真，并分析不同的D2D组数和D2D组发射功率对D2D系统总吞吐量、D2D系统总能效的影响。仿真场景假设某小区基站覆盖范围为500 m，小区内随机均匀分布若干蜂窝用户及若干D2D组，每个D2D组内以D2D发射用户为圆心、以50 m为半径，随机均匀分布2个或2个以上的D2D接收用户。本文信道模型为基于路径损耗的信道模型，具体仿真参数如表 1所示，仿真取最优值作为该组参数对应的仿真结果。

下载CSV 表 1 仿真参数设置 Table 1 Simulation parameters setting

3.2 算法复杂度分析

针对信道匹配部分，该算法的计算复杂度取决于适应度计算，设$ O\left(f\right) $为适应度计算的复杂度，每次迭代时种群进化具有随机性，将进化与爬山复杂度设为$ O\left(l\right) $，此外该算法的复杂度还取决于进化次数$ T $与种群大小$ Q $，则算法的复杂度为$ O\left(T\left(O\left(f\right)+O\left(l\right)\right)+Q\right) $；针对功率分配部分，算法复杂度同理，但由于功率分配部分染色体长度是信道匹配的2倍，因此其运行时间更长。

3.3 结果分析

本文首先对算法的收敛性能进行测试，需要注意的是，遗传算法受到很多因素影响，如初始种群的多样性、交叉机制、变异机制等，此外算法的收敛速度取决于种群的大小以及染色体的长度，如果种群较大或染色体较长，则收敛较慢。

在固定功率分配方案时，以信道匹配和最大化D2D系统吞吐量为优化目标，将GA、AGA、HAGA（本文算法）这3种算法运用于本文场景时的搜索及收敛性能比较如图 3所示。

	Download: JPG larger image
图 3 固定功率分配方案下的D2D系统吞吐量对比 Fig. 3 Comparison of D2D system throughput under fixed power allocation scheme

基于图 3所得的信道匹配方案，以D2D组内功率分配因子作为优化变量、最大化D2D系统吞吐量为优化目标，将GA、AGA、HAGA这3种算法应用于功率分配任务时的搜索及收敛性能比较如图 4所示。

	Download: JPG larger image
图 4 固定信道匹配方案下的D2D系统吞吐量对比 Fig. 4 Comparison of D2D system throughput under fixed channel matching scheme

从图 3可以看出，HAGA大约在60次收敛，从图 4可以看出，HAGA大约在160次收敛。HAGA的收敛、搜索性能优于AGA和GA，这是因为相较于GA，HAGA与AGA在交叉与变异概率自适应处理后更容易跳出局部最优值，找到全局最优值，同时，HAGA算法收敛性能优于AGA与GA，这是因为在每次选择、交叉、变异后的种群中引入爬山算法，会进一步搜寻更优的种群作为下一次迭代的初始种群，使得优胜劣汰的速度加快。因此，HAGA算法在全局搜索和收敛性能上都有一定提升。

图 5所示为蜂窝用户数量一定时不同D2D组数下D2D系统吞吐量的对比结果。从图 5可以看出，随着D2D组数的增加，D2D系统吞吐量增大，且HAGA算法性能最优。此外，将本文算法用于NOMA技术所获得的D2D系统吞吐量大于传统OMA技术，这是因为传统OMA技术只允许一个子信道复用一个用户，而NOMA技术允许多个用户同时复用在相同的时频资源上，因此，随着D2D用户组数的增加，系统吞吐量增大。

	Download: JPG larger image
图 5 不同D2D组数下的D2D系统吞吐量对比 Fig. 5 Comparison of D2D system throughput under different D2D groups

图 6所示为蜂窝用户与D2D组数固定、D2D组发射用户发射功率不同时的D2D系统吞吐量对比，从图 6可以看出，HAGA性能更优，且随着D2D用户发射功率的提高，D2D系统性能呈上升趋势，相较于OMA技术，基于NOMA技术的D2D系统性能更优。

	Download: JPG larger image
图 6 不同D2D用户发射功率下的D2D系统吞吐量对比 Fig. 6 Comparison of D2D system throughput under different D2D user transmission power

4 结束语

本文提出一种基于HAGA的无线资源分配算法，以在蜂窝用户与D2D用户不同的QoS约束条件下，优化D2D组信道匹配和功率分配因子，最大化D2D系统总吞吐量。考虑到优化目标函数包含二进制整数变量信道匹配因子及连续变量功率分配因子，求解难度较高，本文利用HAGA算法进行全局搜索以寻找最优信道匹配方案，然后基于所得信道匹配方案对D2D组内用户功率分配因子进行优化。仿真结果表明，该算法的收敛与搜索性能优于GA、AGA算法，其能够有效提升D2D通信系统的吞吐量。但是，在实际的D2D-NOMA系统中，由于存在时延等问题，导致难以获取完美信道状态信息，下一步将基于不完美信道状态信息对D2D-NOMA场景展开研究。

参考文献

[1]	Cisco. Cisco visual networking index: global mobile data traffic forecast update[EB/OL]. [2020-10-05]. http://www.audentia-gestion.fr/cisco/pdf/cisco-vni-forecast-feb2015-22.pdf.
[2]	HAKOLA S, TAO C, LEHTOMÄKI J, et al. Device-To-Device(D2D) communication in cellular network-performance analysis of optimum and practical communication mode selection[C]//Proceedings of Wireless Communications & Networking Conference. Washington D. C., USA: IEEE Press, 2010: 1-6.
[3]	LIN X, ANDREWS J, GHOSH A, et al. An overview of 3GPP device-to-device proximity services[J]. IEEE Communications Magazine, 2014, 52(4): 40-48. DOI:10.1109/MCOM.2014.6807945
[4]	ANSARI R I, CHRYSOSTOMOU C, HASSAN S A, et al. 5G D2D networks: techniques, challenges, and future prospects[J]. IEEE Systems Journal, 2018, 12(4): 3970-3984. DOI:10.1109/JSYST.2017.2773633
[5]	JIANG D, HUO L, LÜ Z, et al. A joint multi-criteria utility based network selection approach for vehicle-to-infrastructure networking[J]. IEEE Transactions on Intelligent Transportation Systems, 2018, 19(10): 3305-3319. DOI:10.1109/TITS.2017.2778939
[6]	LIU Y, QIN Z, ELKASHLAN M, et al. Non-orthogonal multiple access for 5G and beyond[J]. Proceedings of the IEEE, 2018, 105(12): 2347-2381.
[7]	YAKOU K, HIGUCHI K. Downlink NOMA with SIC using unified user grouping for non-orthogonal user multiplexing and decoding order[C]//Proceedings of International Symposium on Intelligent Signal Processing & Communication Systems. Washington D. C., USA: IEEE Press, 2015: 508-513.
[8]	ALEMAISHAT S, SARAEREH O A, KHAN I, et al. Efficient resource allocation algorithm for D2D communications based on NOMA[J]. IEEE Access, 2019, 7: 120238-120247. DOI:10.1109/ACCESS.2019.2937401
[9]	CHENG R, ZHOU X T, ZHANG H X, et al. Non-orthogonal multiple access in SWIPT enabled cooperative D2D network[C]//Proceedings of 2020 IEEE/CIC International Conference on Communications in China. Washington D. C., USA: IEEE Press, 2020: 62-67.
[10]	ZHAO J, LIU Y, CHAI K K, et al. Joint subchannel and power allocation for NOMA enhanced D2D communications[J]. IEEE Transactions on Communications, 2017, 65(11): 5081-5094. DOI:10.1109/TCOMM.2017.2741941
[11]	YOON T, NGUYEN T H, NGUYEN X T, et al. Resource allocation for NOMA-based D2D systems coexisting with cellular networks[J]. IEEE Access, 2018, 6: 66293-66304. DOI:10.1109/ACCESS.2018.2876354
[12]	DAI Y P, SHENG M, LIU J Y, et al. Joint mode selection and resource allocation for D2D-enabled NOMA cellular networks[J]. IEEE Transactions on Vehicular Technology, 2019, 68(7): 6721-6733. DOI:10.1109/TVT.2019.2916395
[13]	PAN Y J, PAN C H, YANG Z H, et al. Resource allocation for D2D communications underlaying a NOMA-based cellular network[J]. IEEE Wireless Communication Letters, 2018, 7(1): 130-133. DOI:10.1109/LWC.2017.2759114
[14]	BUDHIRAJA I, KUMAR N, TYAGI S. Energy-delay tradeoff scheme for NOMA-based D2D groups with WPCNs[J]. IEEE Systems Journal, 2020, 8: 1-12.
[15]	ZHENG H Y, HOU S J, LI H, et al. Power allocation and user clustering for uplink MC-NOMA in D2D underlaid cellular networks[J]. IEEE Wireless Communications Letters, 2018, 7(6): 1030-1033. DOI:10.1109/LWC.2018.2845398
[16]	CHEN J, JIA J, LIU Y W, et al. Optimal resource block assignment and power allocation for D2D-enabled NOMA communication[J]. IEEE Access, 2019, 7: 90023-90035. DOI:10.1109/ACCESS.2019.2926438
[17]	LEE S, KIM J, CHO S. Resource allocation for NOMA based D2D system using genetic algorithm with continuous pool[C]//Proceedings of 2019 International Conference on Information and Communication Technology Convergence. Washington D. C., USA: IEEE Press, 2019: 705-707.
[18]	蔡海鸾, 郭学萍. 一种新的自适应惩罚函数在遗传算法中的应用[J]. 华东师范大学学报(自然科学版), 2015(6): 36-45, 52. CAI H L, GUO X P. Application of a new adaptive penalty function in genetic algorithm[J]. Journal of East China Normal University(Natural Science), 2015(6): 36-45, 52. (in Chinese)
[19]	SRINIVAS M, PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J]. IEEE Transactions on Systems Man & Cybernetics, 2002, 24(4): 656-667.
[20]	XU H Y, ZHOU Z. Hill-climbing genetic algorithm optimization in cognitive radio decision engine[C]//Proceedings of 2013 IEEE International Conference on Communication Technology. Washington D. C., USA: IEEE Press, 2013: 115-119.