作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2022年, 第48卷, 第12期 刊出日期:2022-12-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2022, 48(12): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 先进计算技术
  • 何晓斌, 高洁, 肖伟, 陈起, 刘鑫, 陈左宁
    计算机工程. 2022, 48(12): 1-8. https://doi.org/10.19678/j.issn.1000-3428.0065928
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在E级计算时代,超算系统一般使用多层存储架构以满足应用数据访问的容量和性能需求,这种架构中不同层次的存储介质差异较大,难以实现统一名字空间管理,往往需要应用修改数据访问流程才能最大程度利用到多层存储的性能和容量优势。针对多层存储统一名字空间的问题,提出针对非易失性双列存储模块(NVDIMM)的块级缓存和针对突发缓冲存储(BB)的文件级缓存技术。基于NVDIMM的块级缓存技术对缓存窗口灵活控制,以支持数据块粒度的异步读写,实现NVDIMM与BB层统一名字空间管理;基于BB的文件级缓存技术将数据缓存在BB层中,并动态迁移和管理文件副本,实现BB层与传统磁盘文件系统统一名字空间管理。在神威E级原型验证系统中的测试结果表明,所提出的两种技术较好地解决了多层存储的透明加速难题,NVDIMM块级缓存与BB相比,在缓存窗口16 MB时128 KB顺序读写带宽分别提升27%和36%,8 KB随机读写带宽分别提升20%和37%;基于BB的文件缓存技术利用BB的高带宽支撑数据访问,与全局文件系统相比,128 KB顺序读写带宽分别提升55%和141%,8 KB随机读写带宽分别提升163%和209%。此外,实际应用的测试也表明以上两种缓存技术具有透明的存储加速效果。
  • 刘鹏飞, 朱健晨, 万良易, 江波
    计算机工程. 2022, 48(12): 9-15,23. https://doi.org/10.19678/j.issn.1000-3428.0065440
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    高光谱图像分类算法通常需要逐点对图像中的像素点进行迭代处理,计算复杂度及并行程度存在较大差异。随着高光谱遥感图像空间、光谱和辐射分辨率的不断提升,这些算法无法满足实时处理海量遥感图像数据的需求。通过分析NPU存储计算一体化模式与遥感图像分类算法的实现步骤,设计低功耗CPU+NPU异构资源计算架构的低秩稀疏子空间聚类(LRSSC)算法,将数据密集型计算转移至NPU,并利用NPU数据驱动并行计算和内置AI加速,对基于机器学习算法的海量遥感数据进行实时分类。受到big.LITTLE计算范式的启发,CPU+NPU异构资源计算架构由8 bit和低精度位宽NPU共同组成以提高整体吞吐量,同时减少图网络推理过程中的能量损耗。实验结果表明,与CPU计算架构和CPU+GPU异构计算架构的LRSSC算法相比,CPU+NPU异构计算架构的LRSSC算法在Pavia University遥感数据集下的计算速度提升了3~14倍。
  • 刘金硕, 黄朔, 邓娟
    计算机工程. 2022, 48(12): 16-23. https://doi.org/10.19678/j.issn.1000-3428.0063914
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    当使用高分辨率的图像作为图像处理算法的输入时会降低算法运行速度,将算法并行化可提升执行效率,但手动将串行程序转换为并行程序则较为繁琐,并且现有自动并行翻译工具性能不稳定,同时翻译后的程序是单一并行模式。面向基于面片的三维多视角立体视觉(PMVS)算法,提出一种从C到CUDA的自动两级并行翻译方法。使用ANTLR自动解析源C代码,通过分析数据依赖关系和循环数组私有化来识别可并行化的循环结构,将算法翻译成CPU多线程和GPU两级并行结构的代码。在算法执行过程中,将输入图像在CPU和GPU上分别进行处理,降低了算法总执行时间。实验结果表明,该方法的计算加速比随着输入图像分辨率的增加逐渐提高,最高约达到32,相比于PPCG和OpenACC自动并行翻译方法提升明显。
  • 建澜涛, 任秀江, 张祯, 石嵩, 黄益明, 张春林
    计算机工程. 2022, 48(12): 24-37. https://doi.org/10.19678/j.issn.1000-3428.0065704
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    E级计算机系统规模巨大,使得故障异常总量随之增多,导致诊断发现的难度增加,因此,迫切需要一套更加准确高效的实时维护故障诊断系统,对硬件系统进行全面的异常及故障信息实时检测、故障诊断及故障预测。传统故障诊断系统在面对数万节点规模的诊断时存在执行效率低、异常检测误报率高的问题,异常检测及故障诊断的覆盖率不足。对异常及故障检测、故障诊断与故障预测相关技术进行研究,分析技术原理及适用性,并结合E级高性能计算机实际工程需求,设计一套满足数E级高性能计算机需求的维护故障诊断系统。基于维护系统的结构组成设计可扩展的边缘诊断架构,将高性能计算机系统知识、专家知识与数理统计、机器学习相融合给出故障检测、诊断及预测算法,并针对专用场景建立预测模型。实验结果表明,该系统具有较好的可扩展性,能在10 s内完成对十万个节点规模系统的故障诊断,与传统故障诊断系统相比,异常检测某特定指标误报率从3.3%降低到几乎为0,硬件故障检测覆盖率从90.2%提升至96%以上,硬件故障诊断覆盖率从71%提升至约94%,能较准确地预测多个重要应用场景下的故障。
  • 刘博阳, 胡舒凯, 施得君, 卢宏生
    计算机工程. 2022, 48(12): 38-44,53. https://doi.org/10.19678/j.issn.1000-3428.0065450
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着近年来高性能计算系统规模的急剧扩大,高性能互连网络的可靠性成为愈发重要的问题。高维胖树是一种结合了胖树与多维环网优点的网络拓扑结构,凭借其良好的可扩展性与网络性能在E级时代具有广阔的应用前景。然而,目前关于高维胖树中容错路由算法的相关研究较为有限,其可靠性问题亟待解决。为提高高维胖树拓扑在高性能互连网络中的容错能力,进一步提高对应超算系统的运行效率,提出一种用于高维胖树中叶交换机故障的容错路由算法VTFTR。该算法结合转向模型与虚通道切换的思想,通过严格控制报文在无故障路径与容错路径中的转向,使用少量的容错虚通道与额外跳步实现高维胖树中的无死锁容错。实验结果表明,在单点故障情况下,VTFTR算法的容错路径较对比算法有2~4个跳步的减少,在4 096个节点规模的网络中,当叶交换机故障数量为10时,在故障叶交换机不同的分布情况下,该算法能够以1.4%~2.0%的吞吐率下降作为代价来保持全网无故障节点之间的互连。
  • 许乐, 安虹, 陈俊仕, 张鹏飞, 武铮
    计算机工程. 2022, 48(12): 45-53. https://doi.org/10.19678/j.issn.1000-3428.0065567
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在国产异构众核平台神威·太湖之光上的非结构网格计算具有稀疏存储、离散访存、数据依赖等特点,严重制约了众核处理器的性能发挥。为解决稀疏存储和离散访存问题,提出一种N阶对角染色算法,以有效平衡主从核计算并利用从核将全局访存转化为LDM访问。针对数据依赖造成的计算竞争问题,采用自适应和无依赖的任务划分方法,避免并行计算时的数据冲突。为对处理器架构和非结构网格计算进行优化,采用主核与从核异步并行的方式,差异化使用主从核以充分利用硬件资源,同时,取消处理器提供的寄存器通信机制,降低从核阵列的同步开销同时便于扩展到新一代神威平台。此外,使用计算访存异步重叠技术来充分隐藏访存延迟。利用SpMV、Integration、calcLudsFcc算子进行实验,结果表明,相比主核实现,组合加速算法在不同算例规模下平均取得了10倍的加速效果,加速比最高可达24倍,N阶对角染色算法相比非染色分块算法取得了超过5.8倍的性能加速,有效提升了数据局部性和计算并行度。该算法对有依赖关系的计算冲突算子同样具有良好的加速性能,验证了自适应和无依赖任务划分方法的有效性。
  • 刘振鹏, 郭超, 王仕磊, 陈杰, 李小菲
    计算机工程. 2022, 48(12): 54-61,71. https://doi.org/10.19678/j.issn.1000-3428.0063734
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    超密集网络与边缘计算相结合时,高密度的基站分布可能会对同一用户重复覆盖,该用户选择不同基站进行卸载将会对系统性能产生不同影响,由此引出卸载对象选取问题。同时边缘计算可以将部分任务卸载到边缘服务器进行处理,选择合适的卸载比例能够显著降低所需的时延和能耗,由此引出卸载比例选取问题。提出一种超密集网络环境中基于博弈论和启发式算法的边缘计算卸载策略。针对卸载对象选取问题,根据边缘服务器到用户之间的距离和工作负载定义偏好度指标,各用户根据偏好度进行博弈后选择卸载对象,并对用户进行分组,将原问题分解为若干个并行的子问题。针对卸载比例选取问题,基于萤火虫群优化算法对各用户的卸载比例进行优化,得到适当的卸载比例。与全本地处理(ALP)策略、全卸载策略(AOS)和基于粒子群优化(PSO)算法的卸载策略进行对比,实验结果表明,ALP和AOS策略在总能耗和平均时延上具有一定的局限性,相比基于PSO的卸载策略,所提策略的时延降低22%,能耗降低20%,可以有效减少系统损失。
  • 姚政, 吴怀宇, 陈洋
    计算机工程. 2022, 48(12): 62-71. https://doi.org/10.19678/j.issn.1000-3428.0065163
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    计算卸载作为移动边缘计算中最关键的技术之一而备受研究人员的关注,然而现有研究较少同时考虑拓扑结构、优化目标多样性及计算资源竞争的特性。针对移动边缘计算场景下的并发型数据流任务计算卸载及资源竞争问题,设计一种基于并发型数据流任务的多目标计算卸载混合整数模型,并给出一种基于多目标优化和多属性决策的两阶段优化框架对该模型进行求解。在多目标优化阶段,提出改进动态多种群并行NSGA-II(DMP-NSGA-II)算法,包括多种群多交叉策略、动态调整种群规模与二次局部搜索的改进策略,以解决局部收敛和全局搜索难以平衡的问题,同时设计一种基于混合式求解框架的DMP-NSGA-II算法求解多目标混合整数模型。在多属性决策阶段,提出一种基于模糊C均值聚类和灰关联投影法的后验选解方法,以选出在不同偏好下具有代表性的最优卸载决策。在测试函数和模型实例上的实验结果表明,设计的两阶段优化框架能够有效地求解所提出的模型,在ZDT系列测试函数上DMP-NSGA-II算法的HV和SP指标表现全面优于NSGA-II、MOEA/D和MOEA/D-DE算法,在模型实例上DMP-NSGA-II算法的Meantime和Meanenergy指标相较于基于混合式求解框架的NSGA-II算法,分别提升了30.1%和8.9%。
  • 人工智能与模式识别
  • 张奕, 郑婧, 蔡钢生, 王真梅
    计算机工程. 2022, 48(12): 72-78. https://doi.org/10.19678/j.issn.1000-3428.0063069
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    可计算模型能够有效替代生物实验进行长链非编码RNA(lncRNA)-疾病的关联预测,但由于存在已知数据稀疏性问题,导致现有模型的预测精度不高。针对这一局限性,提出基于图注意力网络与归纳式矩阵补全技术的双融合机制lncRNA-疾病关联预测模型(DFMP-LDA)。引入n头注意力机制,设计带有双重聚合器的图注意力网络,增强lncRNA节点与疾病节点的特征,避免数据稀疏性导致模型预测精度不高的问题。在此基础上,针对传统图注意力网络不能直接应用于潜在lncRNA-疾病对关联预测的问题,引入归纳式矩阵补全技术,应用增强后的节点特征重建lncRNA-疾病关联网络,进一步提高模型的预测精度。5折交叉验证结果表明,DFMP-LDA预测lncRNA-疾病关联的AUC值为0.932 2,AUPR值为0.770 5,在时间成本上分别较DMF-LDA、SDLDA、TPGLDA模型节省33.89%、32.17%、16.12%,预测性能较优。
  • 陈苏阳, 宋晓宁
    计算机工程. 2022, 48(12): 79-85,94. https://doi.org/10.19678/j.issn.1000-3428.0063424
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    目前的多数活体检测算法忽略了特征挖掘,导致判别性信息提取不足。提出一种融合梯度纹理和群感受野的活体检测算法。使用中心差分卷积计算感受野周围点与中心点的差值,提取图像的梯度纹理特征,设计群感受野模块,采用不同尺寸的卷积核结合空洞卷积组成多分支结构,在使用较少参数量的情况下获得更大的感受野和多尺度特征,并将两种特征融合输入到残差结构中。此外,在使用深度图进行监督的同时,增加二值掩模进行辅助监督,使得网络将学习的中心放到人脸部位,进一步提升模型的鲁棒性。在此基础上,综合深度图生成器和掩模生成器的输出结果,计算预测得分,实现端到端的活体检测。实验结果表明,该算法在公开数据集OULU-NPU 4个协议上的平均分类错误率分别为0.9%、1.9%、1.6%±2.0%和2.7%±1.8%,在数据集CASIA-MFSD和Replay-Attack上可实现无误差活体检测,并且模型参数量仅为1.1 MB,与Auxiliary和STASN等活体检测算法相比,检测精度更高,具有更好的鲁棒性。
  • 刘圣杰, 何宁, 于海港, 王程, 韩文静
    计算机工程. 2022, 48(12): 86-94. https://doi.org/10.19678/j.issn.1000-3428.0063010
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    人体关键点检测在智能视频监控、人机交互等领域具有重要应用。多数基于深度学习的人体关键点检测算法仅聚焦于增加多尺度特征或加深网络模型深度,忽略了在获取低分辨率特征图过程中因重复下采样操作而造成的信息丢失。针对该问题,提出一种高分辨率的人体关键点检测网络CASANet,以实现二维图像人体姿态估计。使用HRNet作为骨干网络,引入坐标注意力模块在1/16分辨率特征图分支上捕获位置信息和通道信息,利用自注意力模块在1/32分辨率特征图分支上捕获位置信息和通道信息的内部相关性,通过这2个模块克服网络在获取低分辨率特征图过程中的信息丢失问题。在MS COCOVAL 2017数据集上进行实验,结果表明, CASANet网络可以在参数量和计算量有少量提升的情况下获得更高的检测准确度,有效提升通道信息和位置信息的提取效果,相较基线方法,CASANet的AP值提高2.4个百分点。
  • 黄奕轩, 杜世强, 余瑶, 肖庆江, 宋金梅
    计算机工程. 2022, 48(12): 95-103. https://doi.org/10.19678/j.issn.1000-3428.0063279
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有的多视图聚类方法大多直接在原始数据样本上构建各视图的相似图,而原始数据中的冗余特征和噪声会导致聚类精度下降。针对该问题,基于特征选择和鲁棒图学习提出多视图聚类算法FRMC。在自适应选择不同视图特征时降低数据维度,减少冗余特征,同时利用自表示学习获取数据的表示系数,滤除噪声影响并得到数据样本的全局结构,从而去除样本中的噪声和离群点。在此基础上,通过自适应近邻学习构造样本鲁棒图,利用鲁棒图矩阵的加权和构建最终的亲和图矩阵,提出一种基于增广拉格朗日乘子的交替迭代算法对目标函数进行优化。在6个不同类型的标准数据集上进行实验,与SC、RGC、AWP等算法的对比结果表明,FRMC算法能够有效提升聚类精度且具有较好的收敛性与鲁棒性。
  • 徐奔业, 顾斌杰, 潘丰, 熊伟丽
    计算机工程. 2022, 48(12): 104-111,118. https://doi.org/10.19678/j.issn.1000-3428.0063542
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有双边移位投影孪生支持向量回归(PPTSVR)算法在训练阶段没有考虑不同位置样本对超平面构造的影响,当样本中存在异常点时会降低算法拟合性能。针对该问题,提出一种加权光滑投影孪生支持向量回归算法。采用孤立森林法赋予每个样本不同的权值,并且赋予样本中异常点很小的权值,通过将权值引入算法目标函数,削弱异常点对超平面构造的影响。为直接在原空间中寻求最优超平面,引入正号函数,将有约束优化问题转化为无约束优化问题,并采用Sigmoid光滑函数对目标函数进行光滑处理,证明其任意阶可微且严格凸的特性,进而在原空间中采用牛顿迭代法进行求解。在基准数据集和人工测试函数上的实验结果表明,该算法相比于现有代表性回归算法具备更好的拟合性能和更快的训练速度,尤其当训练样本中存在异常点时,相比于PPTSVR算法拟合性能提升更明显。
  • 胡彬, 王晓军, 张雷
    计算机工程. 2022, 48(12): 112-118. https://doi.org/10.19678/j.issn.1000-3428.0063365
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    元学习期望训练所得的元模型在学习到的“元知识”基础上利用来自新任务的少量标注样本,仅通过较少的梯度下降步骤微调模型就能够快速适应该任务。但是,由于缺乏训练样本,元学习算法在元训练期间对现有任务过度训练时所得的分类器决策边界不够准确,不合理的决策边界使得元模型更容易受到微小对抗扰动的影响,导致元模型在新任务上的鲁棒性能降低。提出一种半监督对抗鲁棒模型无关元学习(semi-ARMAML)方法,在目标函数中分别引入半监督的对抗鲁棒正则项和基于信息熵的任务无偏正则项,以此优化决策边界,其中对抗鲁棒正则项的计算允许未标注样本包含未见过类样本,从而使得元模型能更好地适应真实应用场景,降低对输入扰动的敏感性,提高对抗鲁棒性。实验结果表明,相比ADML、R-MAML-TRADES等当下主流的对抗元学习方法,semi-ARMAML方法在干净样本上准确率较高,在MiniImageNet数据集的5-way 1-shot与5-way 5-shot任务上对抗鲁棒性能分别约提升1.8%和2.7%,在CIFAR-FS数据集上分别约提升5.2%和8.1%。
  • 廖涛, 黄荣梅, 张顺香, 段松松
    计算机工程. 2022, 48(12): 119-126,133. https://doi.org/10.19678/j.issn.1000-3428.0063591
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有命名实体识别模型在字嵌入过程中多采用字符向量、字向量等不同单词表示向量的拼接或累加方式提取信息,未考虑不同单词表示特征之间的相互依赖关系,导致单词内部特征信息获取不足。提出一种基于交互式特征融合的嵌套命名实体识别模型,通过交互的方式构建不同特征之间的通信桥梁,以捕获多特征之间的依赖关系。采用交互机制得到包含不同单词表示信息的字嵌入向量,基于双向长短时记忆网络提取单词的表示特征,并对不同单词的表示特征进行交互,捕获特征之间的相互依赖关系。为进一步提取序列特征的上下文信息,采用基于特征交互的多头注意力机制捕获句子上下文的依赖关系。在此基础上,采用二元序列标记法过滤非实体区域,得到粗粒度候选区间,并对其进行细粒度划分以判断实体类别。实验结果表明,该模型的召回率和F1值为72.4%和71.2%,相比现有的嵌套命名实体识别模型,F1值平均提高了1.72%。
  • 卞玮, 李晨龙, 侯红卫
    计算机工程. 2022, 48(12): 127-133. https://doi.org/10.19678/j.issn.1000-3428.0063648
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    结合深度神经网络和时序点过程的深度点过程模型在进行时间预测时,会因模型本身系统误差和数值计算精度不足而导致预测值序列中存在较大偏差。为提高预测精度并有效避免模型调优同时降低数值误差,建立一种基于条件生成对抗网络(CGAN)的深度点过程二次预测模型,在深度点过程初次预测值序列的基础上进行二次预测。假设初次预测偏差来自时序点过程分布上的差异,利用CGAN对分布的变换能力来修正初次预测值序列分布为原始时序点过程序列分布,从而降低预测值序列误差。在流程上,将初次预测值序列输入生成器生成伪值序列,将伪值序列与对应的真实值序列输入判别器中判别真假,经过对抗训练得到对初次预测值序列具备修正能力的生成器。同时,为增强CGAN对时序点过程数据的匹配度,在其结构上采用CGAN+LSTM的形式,同时改进损失函数为时序点过程Wasserstein距离的对偶形式及其1-Lipschitz约束。实验结果表明,该模型具有较高的时间预测准确度,二次预测值序列的均方误差相较初次预测值序列平均降低77%以上。
  • 赵亮, 方伟
    计算机工程. 2022, 48(12): 134-139,149. https://doi.org/10.19678/j.issn.1000-3428.0063354
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    手动设计卷积神经网络结构对专业性要求高、难度大。基于梯度可微的搜索快速高效,但这类方法存在深度鸿沟和稳定性较差的问题。提出一种结合渐进式搜索和贪心指标的快速渐进式结构搜索算法(FPNAS),通过渐进式扩展搜索阶段的结构,使得搜索阶段的网络结构逐渐接近评估阶段,避免深度鸿沟造成的影响。同时,通过运用贪心指标作为选边准则,增加搜索评估的相关性并提高搜索的稳定性。针对网络结构搜索算法消耗计算资源多的问题,提出渐进式划分数据集方法,通过分阶段不同比例的数据集划分来减少结构搜索的计算资源消耗。以准确率和搜索时间作为评价指标,将FPNAS与渐进式可微结构搜索算法和贪心搜索算法进行对比,实验结果表明,FPNAS搜索出的网络结构稳定性得到改进,搜索时间分别缩短0.19和0.14个GPU Days,在CIFAR-10数据集上精度最高达到97.7%。
  • 张晓明, 郑理欣, 王会勇
    计算机工程. 2022, 48(12): 140-149. https://doi.org/10.19678/j.issn.1000-3428.0063070
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    领域知识图谱在各行各业中都发挥着重要作用,领域实体的获取则是构建领域知识图谱的重要基础。数据标注、编写抽取规则等现有的实体抽取方法往往需要较多的人工参与工作。提出一种基于图排序的实体抽取方法和基于最大信息增益的实体扩展方法来构建领域实体集,通过实体识别获得候选实体,基于维基百科的背景信息计算候选实体间的相关度构建实体图,并利用基于置信度传播的图排序算法筛选领域核心实体。在DBpedia中根据最大信息增益来平衡类与领域核心实体相关性及类的抽象程度两个因素以生成实体扩展的共性类。在此基础上,通过SKOS体系中的“Is subject of”关系获得共性类的实例实体,并根据基于字符串相似和结构相关度的方法对扩展实例实体进一步筛选,最终获得全面、准确的领域实体集。以数据结构课程为例构建该课程领域实体集,得到1 115个实体。实验结果表明,在领域数据集上,领域实体抽取F1值达到0.67,能够在较少人工参与的条件下有效获得领域实体,有助于领域知识图谱的构建。
  • 移动互联与通信技术
  • 缪欣, 陈璇, 鲍红莹, 张静轩, 余炜
    计算机工程. 2022, 48(12): 150-155,164. https://doi.org/10.19678/j.issn.1000-3428.0062218
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    扫描覆盖作为无线传感器网络中的重要应用之一,通过规划移动传感器对区域内兴趣点(POI)进行定期覆盖,因此相较于传统覆盖方法能以更低廉的成本监测POI。研究最少传感器数量-最小罚时路径扫描覆盖问题,即通过调度移动传感器扫描给定路径上的POI集合,使传感器使用数量及产生的POI总罚时成本之和最小。将该问题转换为整数规划,并基于该问题的特殊结构设计贪心算法和遗传算法,以求解大规模实例。在遗传算法基础上引入模拟退火操作,以设计一种遗传模拟退火算法,从而提高求解质量和算法局部寻优能力。实验结果表明,所提贪心算法、遗传算法及遗传模拟退火算法均有较好的收敛性,贪心算法求解质量相对较差,但求解速度快;遗传算法解的质量更好,但存在不稳定的问题,局部寻优能力较弱;遗传模拟退火算法的局部寻优能力和求解稳定性明显增强,解的质量优于其他两种算法。
  • 于晶, 鲁凌云, 李翔
    计算机工程. 2022, 48(12): 156-164. https://doi.org/10.19678/j.issn.1000-3428.0063739
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    面对车载终端数据计算量的爆炸式增长,计算卸载是缓解车辆资源不足的有效手段。相比于单独研究云计算或边缘计算,让两者相互协作可以实现优势互补,提高系统的整体服务质量。在车联网中,制定适应环境动态性的卸载决策存在较大困难,其中任务的紧急程度也是一个不容忽视的因素。构建一个基于软件定义网络的边云协作任务卸载架构,并设计任务优先级的度量标准,将动态环境中的任务卸载决策问题建模为马尔可夫决策过程,从而最大化由时延和成本构成的任务平均效用。为了求解任务卸载决策,提出基于双深度Q网络的任务卸载决策算法以及基于优先级的资源分配方案,并设计一种卸载比例计算方法,以保障卸载的任务量能够在通信时间内上传完成的同时最小化任务处理时延。实验结果表明,相比于全部本地、全部卸载和平均分配资源3种固定的卸载算法,该算法时延和效用性能提高了2倍以上,在车辆数目适中的情况下,任务的完成比例可以稳定保持在100%。
  • 王海浪, 张玲华
    计算机工程. 2022, 48(12): 165-171,179. https://doi.org/10.19678/j.issn.1000-3428.0063577
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传感器信息系统能量高效聚集(PEGASIS)协议是无线传感器网络中经典的分簇协议,由于实现简单得以广泛应用,但该协议中头节点的轮流当选策略和网络按照贪心算法成链的方法容易导致整个网络的能量消耗不均匀、节点死亡时间较早、网络延迟较大等问题。提出一种基于PEGASIS的剩余能量距离分区(PEGASIS-REDP)协议,在网络建立连接阶段对整个网络区域进行分区优化,在节点密度不变的情况下缩短差链距离。在头节点选取阶段,将节点剩余能量、区域内平均能量、距离基站的距离等多个因素作为判断头节点当选的条件,大幅减少头节点的更换次数。借助MATLAB软件仿真出PEGASIS-REDP协议建立网络的过程、在不同轮数下节点存活情况和头节点的选取情况,并在相同的实验条件下,针对不同路由协议在网络延迟、能量损耗和生命周期方面进行对比分析。实验结果表明,PEGASIS-REDP协议的网络生命周期相比于PEGASIS协议延长了19.6%,在均衡网络能耗和降低网络延时方面表现更好。
  • 张清国, 张勇, 张伟, 席瑞洁
    计算机工程. 2022, 48(12): 172-179. https://doi.org/10.19678/j.issn.1000-3428.0063758
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于蜂窝结构的混合无线传感器网络(HWSN)覆盖优化算法HWSNBCS存在移动节点平均移动距离较大的问题,为此,提出一种改进的HWSN覆盖优化算法IHWSNBCS。寻找移动传感器节点初始位置与通过HWSNBCS算法得出的候选目标位置之间的最优匹配,将移动节点移动距离之和最小化问题转化为二分图最优匹配问题,利用带权二分图匹配算法KM寻找该匹配问题的最优解,从而得到移动节点最终的目标位置,并实现对HWSNBCS算法移动节点平均移动距离的进一步优化。实验结果表明,IHWSNBCS算法在取得与HWSNBCS算法相同网络覆盖率的前提下,移动节点的平均移动距离减少幅度达到38.87%~43.28%,单个移动节点的最大移动距离减少幅度达到22.65%~66.58%,降低了系统因重新部署移动传感器节点所产生的能耗以及单个传感器节点因能量耗尽而失效的概率,从而延长了网络生命周期,同时,IHWSNBCS的ΔCov-Dist性能指标为HWSNBCS算法的1.64~1.76倍,表明移动节点移动相同距离时IHWSNBCS算法的网络覆盖率提升更大。
  • 杨涛, 郑烇, 徐正欢, 施钱宝, 彭思伟
    计算机工程. 2022, 48(12): 180-188,195. https://doi.org/10.19678/j.issn.1000-3428.0063848
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    建立准确的缓存分析模型有助于更好地预测缓存行为,对于网络性能分析与规划具有重要作用。现有面向缓存强一致性研究的分析模型普遍基于最近最少使用(LRU)缓存替换策略,然而在实际环境中需要根据不同的应用场景和缓存节点能力采取LRU、q-LRU、先进先出等不同的缓存替换策略。为扩展缓存强一致性分析模型的适用范围,基于缓存建模的基本假设构建缓存强一致性通用分析模型,并给出被动查询、主动移除、主动更新3种缓存强一致性策略下缓存命中率和服务器负载的计算方法。利用模型计算结果绘制缓存参数变化曲线图找出使缓存性能达到最优的值,通过分析模型计算结果选出给定缓存参数时对应的最优缓存替换策略。实验结果表明,该模型在3种缓存强一致性策略下均具有较高的计算精确度,其中计算结果与仿真结果的最大误差和最小误差分别为6.92%和0.06%,适用于通过特征时间近似的缓存替换策略。
  • 图形图像处理
  • 刘玉红, 陈满银, 刘晓燕
    计算机工程. 2022, 48(12): 189-195. https://doi.org/10.19678/j.issn.1000-3428.0063546
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有分块压缩感知图像重建算法存在计算量大、重构时间长,以及在低采样率下重构的图像具有严重的块效应等问题。提出一种基于通道注意力的多尺度全卷积压缩感知图像重构模型。通过均值滤波消除完整场景图像中的噪声点,减少冗余信息,以提取更加有效的信息,采用不同卷积核大小的卷积层对低频信息进行多尺度全卷积采样,得到不同感受野的图像特征信息,丰富网络中原始图像的特征信息。在此基础上,设计一种新的注意力残差模块,通过挖掘特征图通道之间的关联性以提取关键特征信息,提升重构图像的质量。在DIV2K、Set0和Set5数据集上的实验结果表明,当采样率为1%时,该模型的峰值信噪比和结构相似性相较于深度学习模型ISTA-Net分别平均提升了2.02 dB和0.078 2,相较于迭代优化模型TVAL3,重构一张256×256像素图像所花费的时间平均缩短2.608 4 s。所提模型在低采样率下能够有效利用原始图像中的信息生成更清晰的重构图像。
  • 张法正, 杨娟, 汪荣贵, 薛丽霞
    计算机工程. 2022, 48(12): 196-202. https://doi.org/10.19678/j.issn.1000-3428.0064098
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    轻量化超分辨率网络对安防监控、实时人脸识别等领域具有重要意义。然而,现有超分辨率重建网络以牺牲内存和计算成本为代价提高重建效果,从而限制其在实际场景中的应用。提出基于动态自适应层叠网络的轻量化超分辨率重建网络。利用双路残差块中的深度可分离卷积提取低频特征,并引入像素注意力机制获取更丰富的细节特征,以减少参数量并增强网络的重建能力。将双路残差块中的一部分卷积参数作为动态卷积核的子卷积,并与动态自适应模块共享,利用可学习参数调节共享卷积的权重,增强网络的非线性映射关系,充分提取图像的纹理细节信息。实验结果表明,相比VDSR、CARN、PAN等网络,该网络重建得到的图像纹理更接近原始图像,其参数量仅为传统轻量化网络CARN的1/2,在放大因子为4的Set5数据集上峰值信噪比相比CARN提高0.16 dB。
  • 尚佳童, 雷涛, 张栋, 杜晓刚, 翟钰杰
    计算机工程. 2022, 48(12): 203-211,217. https://doi.org/10.19678/j.issn.1000-3428.0065091
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    通过分割刻蚀图像计算驱油率是目前衡量油藏驱替技术的重要手段。由于刻蚀图像边缘模糊、噪声大且水油像素分散,目前主流的图像分割网络分割精度低、分割速度慢,难以获得较好的分割结果。提出一种用于刻蚀图像分割的轻量可变形编解码网络(LDNet)。在特征编码阶段利用偏移量学习水油目标形状和边缘特征,改善网络的特征表达能力,并通过深度卷积和逐点卷积有效降低网络参数量。在特征融合阶段设计协同耦合注意力模块,将通道注意力进行分解,并分别沿2个空间方向聚合特征,将特征图编码为方向和位置感知的特征图,从而将位置信息嵌入到通道注意力中,提升模型的鲁棒性。实验结果表明,LDNet网络的分割精度为89.94%,模型大小仅为16.63×106,在资源受限的设备中有效提高刻蚀图像的分割精度,降低驱油率误差,加快模型的推理速度。
  • 王国栋, 邵鹏, 王国宇, 刘少禹, 张建涛
    计算机工程. 2022, 48(12): 212-217. https://doi.org/10.19678/j.issn.1000-3428.0063448
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对浓雾场景下图像目标信息被严重遮挡,现有雾天图像清晰化算法难以取得较好去雾效果的问题,基于低秩分解并结合像素置乱提出一种新的图像去雾方法。根据低秩分解理论和散射介质成像模型,将雾天降质图像看作两部分的叠加:一部分是具有低秩特性的雾化背景,另一部分是具有高秩特性的清晰目标场景。由于目标场景本身具有局部相关性和非局部相似性而含有一定程度的低秩成分,直接进行低秩分解会导致一部分目标场景被当作雾化背景去除,因此对原始雾天图像进行像素置乱以破坏场景本身的相关性,同时雾化背景因其全局缓变特性仍保持低秩属性,从而在进行低秩分解时最大限度地保留场景信息。最后,将高秩成分进行像素归位,获得去雾后的复原场景。实验结果表明,与暗通道先验、DehazeNet等主流图像去雾方法相比,该方法针对O-HAZE数据集中浓雾图像的去雾具有更好的表现,在有效去除浓雾的同时,不会产生大面积色偏现象。
  • 黄山, 贾俊
    计算机工程. 2022, 48(12): 218-223,231. https://doi.org/10.19678/j.issn.1000-3428.0064162
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现有图像去雾方法存在的颜色失真、细节丢失以及去雾效果不自然等问题,提出一种改进的循环生成式对抗网络用于图像去雾。通过添加多尺度鉴别器作为判别器来改进原始网络结构,增强判别能力,引导网络产生更精细自然的无雾图像。同时重新设计损失函数,使用最小二乘代替交叉熵作为对抗损失,引入循环感知损失,结合原始循环一致性损失组成新的复合损失函数,提高图像颜色与细节恢复的质量。在D-HAZY和SOTS数据集上的实验结果表明:该方法能够生成较为自然的无雾图像,其主观效果和客观指标均优于对比方法,具有更好的去雾能力;与原始循环生成式对抗网络相比,峰值信噪比从19.052 dB提高至23.128 dB,结构相似性指数从0.787提高至0.867。与DehazeNet、AOD-Net与GCANet等主流去雾方法相比,峰值信噪比和结构相似性指数比排名第二的方法分别提升7.1%和4.3%。
  • 范馨月, 鲍泓, 潘卫国
    计算机工程. 2022, 48(12): 224-231. https://doi.org/10.19678/j.issn.1000-3428.0063741
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着深度学习在计算机视觉领域取得重大进展,包含多种类别的数据集不断被提出,但由于自然采集的数据集往往存在类别不平衡并呈现长尾分布的情况,导致稀有类的数据特征被频繁类的数据特征所抑制,从而严重影响模型的检测性能。为解决上述问题,提出一种新的图像实例分割方法。采用长尾实例分割数据集进行研究实验,使用基于目标尺度的数据增广方法对数据集进行处理,以达到扩充训练样本的目的,增加稀有类的目标数量,同时对稀有类数据进行重采样,解决稀有类的类别数据量过小的问题,提升模型在长尾数据集的鲁棒性。在此基础上,将均等化损失函数融入Mask R-CNN实例分割网络,以降低频繁类的数据特征对稀有类数据特征的抑制性。实验结果表明,该方法在LVIS实例分割数据集上的检测精度提升了4.9%,达到了25.7%,同时APr、APc、APf分别达到了16.2%、26.1%、30.4%,相比Baseline方法均有明显提升,在消融实验上的结果也表明该方法能有效解决长尾类问题。
  • 仇真, 奚雪峰, 崔志明, 盛胜利, 胡伏原
    计算机工程. 2022, 48(12): 232-240. https://doi.org/10.19678/j.issn.1000-3428.0064011
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    因图像数据具有大量的空间冗余信息,传统的多分辨率网络在处理图像数据时会产生较高的计算成本。而自蒸馏学习方法能够在精度与计算成本之间实现动态平衡,使模型在不增加网络深度和宽度的基础上,有效地提高模型精度。提出一种多分辨率自蒸馏网络(MRSDN),用于解决小样本学习中输入样本的空间冗余问题。从原始网络中分出一个浅层子网络以识别图像的低分辨率表示,并且保持该原始网络识别高分辨率图像特征的能力。同时,在多分辨率网络中引入改进的全局注意力机制,以减少信息损失且放大全局交互表示。利用自蒸馏学习方法将网络中更深层的知识压缩到浅层子网络中,以提升浅层子网络的泛化能力。在此基础上,将低分辨率网络中的粗粒度特征融合到高分辨率网络中,从而提高模型提取图像特征的能力。实验结果表明,在Mini-ImageNet数据集上MRSDN网络对5-way 1-shot与5-way 5-shot任务的准确率分别为56.34%和74.35%,在Tiered-ImageNet数据集上对5-way 1-shot与5-way 5-shot任务的准确率分别为59.56%和78.96%,能有效缓解高分辨率图像输入时的空间冗余问题,提高小样本图像分类的准确率。
  • 刘振国, 李钊, 宋滕滕, 何益智
    计算机工程. 2022, 48(12): 241-247,254. https://doi.org/10.19678/j.issn.1000-3428.0063606
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    双目立体匹配被广泛应用于无人驾驶、机器人导航、增强现实等三维重建领域。在基于深度学习的立体匹配网络中采用多尺度2D卷积进行代价聚合,存在对目标边缘处的视差预测鲁棒性较差以及特征提取性能较低的问题。提出将可变形卷积与双边网格相结合的立体匹配网络。通过改进的特征金字塔网络进行特征提取,并将注意力特征增强、注意力机制、Meta-ACON激活函数引入到改进的特征金字塔网络中,以充分提取图像特征并减少语义信息丢失,从而提升特征提取性能。利用互相关层进行匹配计算,获得多尺度3D代价卷,采用2D可变形卷积代价聚合结构对多尺度3D代价卷进行聚合,以解决边缘膨胀问题,使用双边网格对聚合后的低分辨率代价卷进行上采样,经过视差回归得到视差图。实验结果表明,该网络在Scene Flow数据集中的端点误差为0.75,相比AANet降低13.8%,在KITTI2012数据集中3px的非遮挡区域误差率为1.81%,能准确预测目标边缘及小区域处的视差。
  • 开发研究与工程应用
  • 任莉莉, 边璇, 王光磊, 王洪瑞
    计算机工程. 2022, 48(12): 248-254. https://doi.org/10.19678/j.issn.1000-3428.0062860
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着卷积神经网络的发展,现有改进的息肉分割U-Net网络能有效提高息肉分割准确率,但引入了大量参数,导致模型复杂度增大且计算效率降低。提出具有低复杂度、高性能的网络GLIA-Net,用于分割内窥镜图像中的息肉区域。以U-Net为基础架构,在双层卷积后加入全局与局部交互式注意力融合模块。全局注意力基于2个可学习的外部储存器,通过2个级联的线性层和归一化层来实现。局部注意力基于局部跨通道交互策略,将一维卷积代替全连接层,在保证网络性能的同时降低计算复杂度,加快网络的计算速度。结合高效通道注意力和外部注意力的优点,在不引入过多参数量和计算量的前提下融合局部注意力和全局注意力,同时在通道与空间2个维度上引入注意力机制,提取丰富的多尺度语义信息。在Kvasir数据集上的实验结果表明,GLIA-Net的平均交并比、Dice、体积重叠误差分别为69.4%、80.7%和5.0%,与ExfuseNet、SegNet、ResUNet等网络相比,在保证网络计算效率的同时具有较优的分割精度。
  • 杨思明, 单征, 曹江, 郭佳郁, 高原, 郭洋, 王平, 王景, 王晓楠
    计算机工程. 2022, 48(12): 255-260,269. https://doi.org/10.19678/j.issn.1000-3428.0063156
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对当前强化学习算法在无人机升空平台路径规划任务中样本效率低、算法鲁棒性较差的问题,提出一种基于模型的内在奖励强化学习算法。采用并行架构将数据收集操作和策略更新操作完全解耦,提升算法学习效率,并运用内在奖励的方法提高智能体对环境的探索效率,避免收敛到次优策略。在策略学习过程中,智能体针对模拟环境的动态模型进行学习,从而在有限步内更好地预测状态、奖励等信息。在此基础上,通过结合有限步的规划计算以及神经网络的预测,提升价值函数的预测精准度,以利用较少的经验数据完成智能体的训练。实验结果表明,相比同样架构的无模型强化学习算法,该算法达到相同训练水平所需的经验数据量减少近600幕数据,样本效率和算法鲁棒性都有大幅提升,相比传统的非强化学习启发类算法,分数提升接近8 000分,与MVE等主流的基于模型的强化学习算法相比,平均分数可以提升接近2 000分,且在样本效率和稳定性上都有明显提高。
  • 贺煜航, 刘棪, 陈刚
    计算机工程. 2022, 48(12): 261-269. https://doi.org/10.19678/j.issn.1000-3428.0063524
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    心电图分析是一种被广泛应用的心脏疾病诊断方法。传统的心电图分析严重依赖医生个人水平,容易出现误诊、漏诊现象,效率较低,且不能有效利用高频信号提供的有价值信息。基于卷积神经网络(CNN)的心电图自动分类方法在一定程度上提高了诊断效率,但依然存在对高频信息利用不充分的问题,且单一的卷积神经网络由于受感受野的限制和权重共享的影响,导致无法充分利用全局信息,分类准确率有待提高。提出一种基于注意力机制与图卷积网络的心电图多标签分类模型MLECG-AGCN,通过设计基于注意力机制的CNN网络,提高网络对高频信号的利用率。引入图卷积网络,以有效利用全局信息和特征空间邻域样本信息,从而协助样本进行分类,提高分类结果的准确率。基于注意力机制的CNN网络通过高通滤波器突出原始信号的高频位置,生成注意力图,并将注意力图嵌入到原始信号中,增强网络关注高频信号的能力。在PTB-XL数据集上的实验结果表明,基于注意力机制的CNN网络与自适应图卷积网络的结合有效提高了心电图分类精度,与Multi-ECGNet、ResNet18、ResNet101等模型相比,MLECG-AGCN模型取得了较高的AUROC值,为0.943 639。
  • 黄帅, 张毅
    计算机工程. 2022, 48(12): 270-280. https://doi.org/10.19678/j.issn.1000-3428.0063327
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在合成孔径雷达(SAR)图像舰船检测中,现有检测方法难以有效提取多尺度语义信息,无法准确地表示其在整个网络中的信息权重,且定位模块与分类模块相关性较弱,导致定位不准确。提出一种梯形跨尺度特征耦合网络,通过梯形特征金字塔网络提取各级语义信息,采用交叉结构代替跳连结构,提高网络的泛化能力和语意表征能力,并引入可训练权重因子表示各级语义信息的重要性。在此基础上,将定位模块与分类模块通过耦合检测头增强两者之间的相关性,引入可变形卷积对最终的定位输出进行二次校准,从而提高检测精度。实验结果表明,与FasterRCNN、CascadeRCNN、RetinaNet等主流网络相比,该网络在SSDD数据集上的检测精度提高了2.74个百分点以上,具有良好的检测性能。在近岸复杂场景下,该网络能更有效地检测密集目标和多尺度目标,降低误检和漏检的概率。
  • 曾涛, 薛峰, 杨添
    计算机工程. 2022, 48(12): 281-287,295. https://doi.org/10.19678/j.issn.1000-3428.0063136
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现实场景下因受到摄像机视角变化、行人姿态变化、物体遮挡、图像低分辨率、行人图片未对齐等因素影响导致行人判别性特征难以获取的问题,设计混合池通道注意模块(HPCAM)和全像素空间注意力模块(FPSAM),并基于这两种注意力模块提出一种通道与空间双重注意力网络(CSDA-Net)。HPCAM模块能够在通道维度上抑制无用信息的干扰,增强显著性特征的表达,以提取得到判别性强的行人特征。FPSAM模块在空间维度上增强行人特征的判别能力,从而提高行人重识别的准确率。通过在传统行人重识别深度模型框架中分阶段融入HPCAM模块和FPSAM模块,获得由粗糙到细粒度的注意力特征。实验结果表明,CSDA-Net网络在行人重识别主流数据集CUHK03、DukeMTMC-ReID和Market1501上的Rank-1准确率分别为78.3%、91.3%和96.0%,平均精度均值(mAP)分别为80.0%、82.1%和90.4%,与MGN网络相比,Rank-1准确率分别提升14.9、2.6和0.3个百分点,mAP分别提升13.7、3.7和3.5个百分点,能够提取更具鲁棒性和判别性的表达特征。
  • 杨毅, 桑庆兵
    计算机工程. 2022, 48(12): 288-295. https://doi.org/10.19678/j.issn.1000-3428.0063507
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    织物瑕疵检测是纺织行业保证产品质量的重要环节,针对织物瑕疵检测中存在小目标瑕疵检测困难、不同种类瑕疵长宽比差异大、对实时性要求高等问题,提出一种新的轻量化织物瑕疵检测算法。以YOLOv4网络为基础,使用轻量化网络MobileNetv2为主干网络,有效减少模型参数总量与运算量,以满足实时性需求。在MobileNetv2的逆残差结构中加入CoordAttention注意力模块,将空间精确位置信息嵌入到通道注意力中,增强网络聚焦小目标特征的能力。使用自适应空间特征融合(ASFF)网络改进路径聚合网络(PANet),使模型通过学习获得多尺度特征图的融合权重,从而充分利用浅层特征与深层特征,提高算法对小目标瑕疵的检测精度。采用K-means++算法确定先验框尺寸,并用Focal Loss函数修改模型损失函数,降低正、负样本不平衡对检测结果的影响,解决不同种类瑕疵长宽比差异大及类别不平衡的问题。实验结果表明,相较于YOLOv4算法,所提算法的平均精度均值提高了2.3个百分点,检测速度提升了12 frame/s,能较好地应用于织物瑕疵检测。
  • 黄晓辉, 张雄, 杨凯铭, 熊李艳
    计算机工程. 2022, 48(12): 296-303,311. https://doi.org/10.19678/j.issn.1000-3428.0063438
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    因网约车订单派送不合理,导致资源利用率和出行效率降低。基于联合Q值函数分解的框架,提出两种订单派送方法ODDRL和LF-ODDRL,高效地将用户订单请求派送给合适的网约车司机,尽可能缩短乘客等待时间。为捕获网约车订单派送场景中随机需求与供应动态变化关系,把城市定义为一张四边形网格的地图,将每辆车视为一个独立的智能体,构建多智能体马尔可夫决策过程模型,通过最大化熵与累计奖励训练智能体。将多智能体的联合Q值函数转化为易分解函数,使联合Q值函数与单个智能体值函数中的动作具有一致性,同时设计动作搜索函数,结合集中训练、分散执行策略的优点,让每辆车以分布式的方式解决订单匹配问题,而不需要与其他车辆进行协调,从而降低复杂性。实验结果表明,相比Random、Greedy、QMIX等方法,所提ODDRL和LF-ODDRL具有较优的扩展性,其中,在500×500网格上,当乘客数为10、车辆数为2时,相对于QMIX方法接送乘客所产生的总时间分别缩短5%和12%。
  • 张相芬, 刘艳, 袁非牛
    计算机工程. 2022, 48(12): 304-311. https://doi.org/10.19678/j.issn.1000-3428.0063687
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于深度学习的医学图像分割对医学研究和临床疾病诊断具有重要意义。然而,现有三维脑图像分割网络仅依赖单一模态信息,且最后一层网络的特征表达不准确,导致分割精度降低。引入注意力机制,提出一种基于深度学习的多模态交叉重构的倒金字塔网络MCRAIP-Net。以多模态磁共振图像作为输入,通过三个独立的编码器结构提取各模态的特征信息,并将提取的特征信息在同一分辨率级进行初步融合。利用双通道交叉重构注意力模块实现多模态特征的细化与融合。在此基础上,采用倒金字塔解码器对解码器各阶段不同分辨率的特征进行整合,完成脑组织的分割任务。在MRBrainS13和IBSR18数据集上的实验结果表明,相比3D U-Net、MMAN、SW-3D-Unet等网络,MCRAIP-Net能够充分利用多模态图像的互补信息,获取更准确丰富的细节特征且具有较优的分割精度,白质、灰质、脑脊液的Dice系数分别达到91.67%、88.95%、84.79%。
  • 刘文, 亓文霞, 仲国强, 王佳佳, 王大寒
    计算机工程. 2022, 48(12): 312-320. https://doi.org/10.19678/j.issn.1000-3428.0062625
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    食管癌肿瘤的诊断方式主要是医生对胸部计算机断层扫描(CT)影像进行阅片。由于医生的主观判断易受外界环境的干扰,因此诊断结果与实际结果存在偏差。基于深度学习的图像分割网络对辅助诊断食管癌肿瘤具有重要意义。因食管在整体胸部CT影像中所占的区域较小且对比度较低,传统的图像分割网络难以准确地确定食管癌肿瘤的区域。为精准分割医学CT影像中的食管癌肿瘤,提出图像分割网络Concat-UNet。基于U-Net网络,采用编码解码模式的U型对称架构对网络中的卷积模块进行改进,并引入跳跃连接和批量归一化层,将卷积模块的原始输入与提取特征后的输出进行特征融合,以增强网络的特征提取能力。在此基础上,采用BCEWithLogits与Dice损失函数相结合的方式联合训练网络。实验结果表明,相比SegNet、ERFNet、U-Net等网络,Concat-UNet在食管癌数据集上的检测精确率为91.87%,相比基准网络U-Net提升了11.64个百分点,具有较优的分割效果。