作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2021年, 第47卷, 第7期 刊出日期:2021-07-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2021, 47(7): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 刘华玲, 马俊, 张国祥
    计算机工程. 2021, 47(7): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0060557
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    推荐系统是学习用户偏好,实现个性化推荐的系统化应用技术,在商品购买、影音推荐、关联阅读等多领域得到了广泛的应用。近年来,随着多源异构数据的激增和深度学习的兴起,传统推荐算法中的表征学习模式逐步被深度学习代替。梳理推荐算法的背景和发展趋势,并给出内容推荐的算法思路及其优劣评价,分别介绍多层感知机、自动编码器、卷积神经网络以及循环神经网络等深度学习方法的网络结构和算法优势。从技术应用的视角综述深度学习在内容推荐中的应用现状与研究成果,对不同经典深度推荐算法进行分析与比较。在此基础上,指出深度学习在可解释性、学习效率等方面的不足,并对交叉领域学习、多任务学习、表征学习等未来研究方向进行展望。
  • 娄平, 杨欣, 胡辑伟, 萧筝, 严俊伟
    计算机工程. 2021, 47(7): 13-20,29. https://doi.org/10.19678/j.issn.1000-3428.0060674
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有疲劳驾驶检测方法通常将驾驶过程中采集的数据传输至云端进行分析,然而在车辆移动过程中网络覆盖范围、响应速度等因素会造成检测实时性差。为在车载嵌入式设备上对驾驶人疲劳状态进行准确预警,提出一种基于边缘计算的疲劳驾驶检测方法。通过改进的多任务卷积神经网络确定人脸区域,根据人脸的面部比例关系定位驾驶人的眼部与嘴部区域,利用基于Ghost模块的轻量化AlexNet分类检测眼部与嘴部的开闭状态,并结合PERCLOS和PMOT指标值实现疲劳检测。在NHTU-DDD数据集上的实验结果表明,该方法在树莓派4B开发板上的检测准确率达到93.5%且单帧平均检测时间为180 ms,在保障检测准确率的同时大幅降低了计算量,能较好地满足疲劳驾驶的实时检测需求。
  • 林杰, 陈春梅, 刘桂华, 祝礼佳
    计算机工程. 2021, 47(7): 21-29. https://doi.org/10.19678/j.issn.1000-3428.0059577
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    室内场景下的实时场景分割是开发室内服务机器人的一项关键技术,目前关于语义分割的研究已经取得了重大进展,但是多数方法都倾向于设计复杂的网络结构或者高计算成本的模型来提高精度指标,而忽略了实际的部署成本。针对移动机器人算力成本有限的问题,设计一种轻量化的瓶颈结构,并以此为基本元素构建轻量化场景分割网络。该网络通过与特征提取网络级联获得更深层次的语义特征,并且融合浅层特征与深层语义特征获得更丰富的图像特征,其结合深度可分离卷积与多尺度膨胀卷积提取多尺度图像特征,减少了模型的参数量与计算量,同时利用通道注意力机制提升特征加权时的网络分割精度。以512像素×512像素的图像作为输入进行实验,结果表明,该算法在NYUDv2室内场景分割数据集和CamVid数据集上的MIoU分别达到72.7%和59.9%,模型计算力为4.2 GFLOPs,但参数量仅为8.3 Mb,在移动机器人NVIDIA Jetson XavierNX嵌入式平台帧率可达到42 frame/s,其实时性优于DeepLabV3+、PSPNet、SegNet和UNet算法。
  • 苏赋, 但涛, 方东
    计算机工程. 2021, 47(7): 30-36,43. https://doi.org/10.19678/j.issn.1000-3428.0060059
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    新型冠状病毒肺炎给人类健康及社会经济造成了巨大的负面影响,而X光胸片中的肺实质提取成为新型冠状病毒肺炎诊断过程中的关键环节。在U-Net的基础上,提出一种结合编解码模式的肺实质分割算法。应用特征融合思想,构建A形特征融合模块,充分学习深层特征的语义信息。引入注意力机制,在深层卷积神经网络中加入密集空洞卷积模块和残差多核池化模块,扩大卷积感受野并提取上下文特征信息。通过改进可变形卷积和分割损失函数,提升网络模型的泛化能力和鲁棒性。实验结果表明,该算法的分割准确度、Dice系数、敏感度、Jaccard指数分别为98.16%、98.32%、98.13%、98.54%,能够实现X光胸片中肺实质部位的有效分割。
  • 郭恒亮, 柴晓楠, 韩林, 赫晓慧, 商建东
    计算机工程. 2021, 47(7): 37-43. https://doi.org/10.19678/j.issn.1000-3428.0059943
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为实现国产飞腾DSP平台对底层图像库的支持,针对原始Canny边缘检测算法计算时间过长的问题,设计一种面向FT-M7002平台的Canny梯度计算并行算法。基于FT-M7002高性能处理架构,采用单指令流多数据流向量化方式增强DSP内核指令的并行处理能力,根据FT-M7002平台向量存储器的层次结构特征,分析Canny梯度计算并行算法的访存模式,通过首地址偏移取址解决不连续访存问题,并结合双缓冲方式完成数据传输与数据计算。实验结果表明,在与原始Canny算法具有相同检测精度的情况下,该算法在卷积核大小为3×3、5×5、7×7时整体运行速度提升了1.490~2.112倍,缩小了与主流加速器件在数字图像处理领域的性能差距。
  • 人工智能与模式识别
  • 张晓明, 孙维雅, 王会勇
    计算机工程. 2021, 47(7): 44-54. https://doi.org/10.19678/j.issn.1000-3428.0057891
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    知识图谱自动化构建技术的发展以及信息量的增加导致知识图谱中引入了噪声和冲突,为了有效应用知识图谱,需要对知识的可信度进行评估。建立一种基于知识表示学习的知识可信度评估模型PTCA,利用实体之间的关联强度、实体类型信息以及多步路径信息对知识的可信度进行计算。通过三元组分类、知识图谱噪声检测以及知识图谱补全等3个任务对模型性能进行测试,结果表明,PTCA模型可以检测知识图谱内部存在的噪声和冲突,对三元组知识的可信度进行有效计算,且在有噪声干扰的数据集上的评估性能优于CKRL和PTransE模型。
  • 王涛, 刘超辉, 郑青青, 黄嘉曦
    计算机工程. 2021, 47(7): 55-58,66. https://doi.org/10.19678/j.issn.1000-3428.0058557
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    循环神经网络和Transformer在多轮对话系统的建模上依赖大量的样本数据且回复准确率过低。为此,提出一种针对任务型对话系统的建模方法。引入预训练模型对句子语意和对话过程进行深度编码,对Transformer模型进行精简,仅保留编码器部分的单向Transformer,将应答部分抽象成不同的指令,采用孪生网络对指令进行相似度排序,选择相似度最高的指令生成应答。在MultiWOZ数据集上的实验结果表明,与LSTM和基于Transformer模型相比,该方法预测速度更快,在小数据集上具有更好的性能,在大数据集上也能取得与当前先进模型相当的效果。
  • 许伟佳, 秦永彬, 黄瑞章, 陈艳平
    计算机工程. 2021, 47(7): 59-66. https://doi.org/10.19678/j.issn.1000-3428.0058372
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对传统主题模型在挖掘多源文本数据集信息时存在主题发现效果不佳的问题,设计一种基于狄利克雷多项式分配(DMA)与特征划分的多源文本主题模型。以DMA模型为基础,放宽对预先输入的主题数量的限制,为每个数据源分配专有的主题分布参数,使用Gibbs采样算法估计每个数据源的主题数量。同时,对每个数据源分配专有的噪音词分布参数以及主题-词分布参数,采用特征划分方法区分每个数据源的特征词和噪音词,并学习每个数据源的用词特征,避免噪音词集对模型聚类的干扰。实验结果表明,与传统主题模型相比,该模型能够保留每个数据源特有的词特征,具有更好的主题发现效果及鲁棒性。
  • 李琦, 谢珺, 张喆, 董俊杰, 续欣莹
    计算机工程. 2021, 47(7): 67-73,80. https://doi.org/10.19678/j.issn.1000-3428.0058173
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    单一模态包含的物体信息有限,导致在物体材质识别分类中表现不佳,而传统多模态融合方法在样本训练过程中需要输入所有数据。提出一种多模态的多尺度局部感受野在线序列极限学习机方法。对物体不同模态样本运用改进的特征提取框架,利用多尺度局部感受野感知样本信息提取特征,并将不同模态特征融合后通过在线序列极限学习机进行训练学习。在线序列极限学习机在训练过程中增量式地输入样本进行训练,当有新数据需要训练时无需对所有数据重新训练。在TUM触觉纹理数据库上进行验证,实验结果表明,多模态融合的分类精度高于单模态的分类精度,且改进的特征提取框架可以显著提升分类性能。
  • 陈恩华, 方宝富
    计算机工程. 2021, 47(7): 74-80. https://doi.org/10.19678/j.issn.1000-3428.0058110
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统基于会话的推荐算法主要利用点击物品的时序信息进行建模,忽略了挖掘物品的特征信息,且未利用物品之间的相似性。为提升推荐效果,提出一种新的基于会话的推荐算法SR-I2V。通过Skip-gram模型和层次softmax优化方法学习物品的嵌入向量,由意图递进公式对已发生的物品点击提取出意图特征向量,并根据特征向量相似度计算出每个候选项的推荐分数。实验结果表明,与I2I、PoP和S-POP等传统基于会话的推荐算法相比,该算法在Yoochoose和Diginetica两个数据集上的推荐召回率分别提高了至少4.67个百分点和3.97个百分点,平均倒数排名指标也有相应提高。
  • 李有红, 王学军, 谌裕勇, 赵跃龙, 徐文贤
    计算机工程. 2021, 47(7): 81-87. https://doi.org/10.19678/j.issn.1000-3428.0057683
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对传统智能进化社区发现算法通常存在弱化节点属性和容易过早收敛等问题,提出基于邻边属性群智能聚类的个人社交网络社区发现算法NLA/SCD。在融合邻边结构及其节点属性相似特性的基础上,定义社会蜘蛛优化算法的适应度函数,并将社区模块度增量作为算子迭代准则。在雌性和雄性个体的进化与交配过程中,利用适应度函数和模块度增量函数从局部和全局角度优化社区划分的寻优过程,以保持种群多样性并避免算法过早收敛。实验结果表明,NLA/SCD算法能有效识别属性信息多样的个人社交网络,且具有较高的运行速度和划分精度。
  • 网络空间安全
  • 常婷婷, 翟江涛, 戴跃伟
    计算机工程. 2021, 47(7): 88-94. https://doi.org/10.19678/j.issn.1000-3428.0057925
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    时间式隐信道利用数据包的包间时延来传递秘密信息,受网络时间特性复杂性的影响,网络隐信道的检测率低且虚警率较高。提出一种利用Xgboost模型的Skype时间式隐信道检测方法。在传统提取Skype时间序列的Markov转移特性、信息熵、包间时延的均值与方差、DCT系数、ε-相似度等特征的基础上,增加峰态、偏态和标准偏差的差值3种特征,以准确了解包间时延分布并进行筛选排查,同时采用五折交叉验证法结合无重复抽样技术,使每次迭代时每个样本点只有一次被划入训练集或测试集,最终通过Xgboost算法进行判决和检测。实验结果表明,与BP神经网络方法相比,该方法检测率更高且虚警率更低。
  • 王静宇, 周雪娟
    计算机工程. 2021, 47(7): 95-100. https://doi.org/10.19678/j.issn.1000-3428.0058105
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对传统属性基加密方案中单授权中心计算开销大以及安全性较差等问题,通过引入多个授权中心以及安全两方计算协议等技术,提出一种支持细粒度属性级撤销和用户级撤销的密文策略属性基加密方案。引入多个属性授权中心以颁发并更新属性版本秘钥,同时秘钥生成中心与云存储服务器之间进行安全两方计算等操作,生成并更新用户密钥,从而进行细粒度属性级撤销。在云存储服务器中,对用户列表中的用户唯一秘值及唯一身份值进行操作以实现用户级撤销,同时通过多个授权中心抵抗合谋攻击,并将部分计算工作外包给云端。分析结果表明,与基于AND、访问树和LSSS策略的方案相比,该方案有效增强了系统的安全功能,同时显著降低了系统的计算复杂度。
  • 蒋彤彤, 尹魏昕, 蔡冰, 张琨
    计算机工程. 2021, 47(7): 101-108. https://doi.org/10.19678/j.issn.1000-3428.0058517
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为实现互联网全面加密环境下的恶意加密流量精确检测,针对传统识别方法较依赖专家经验且对加密流量特征的区分能力不强等问题,提出一种基于层次时空特征与多头注意力(HST-MHSA)模型的端到端恶意加密流量识别方法。基于流量层次结构,结合长短时记忆网络和TextCNN有效整合加密流量的多尺度局部特征和双层全局特征,并引入多头注意力机制进一步增强关键特征的区分度。在公开数据集CICAndMal2017上的实验结果表明,HST-MHSA模型的流量识别F1值相较基准模型最高提升了16.77个百分点,漏报率比HAST-Ⅱ和HABBiLSTM模型分别降低了3.19和2.18个百分点,说明其对恶意加密流量具有更强的表征和识别能力。
  • 汪澍, 许翀寰, 汤中运
    计算机工程. 2021, 47(7): 109-116. https://doi.org/10.19678/j.issn.1000-3428.0060808
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于区块链技术的产品溯源系统在现代供应链系统中被广泛应用,溯源区块链适合采用联盟链来构建,其参与利益方多、共识网络差异化高的特性影响了此类区块链系统的性能和安全性。对区块链共识过程进行分析,构建模拟溯源区块链的系统模型和信誉模型,以排除拜占庭故障节点。在此基础上,设计包含代表选择和代表共识两个阶段的共识过程,并提出一种基于信誉的二阶段溯源区块链共识策略RTsBFT。实验结果表明,在相同的配置环境和条件下,相比CSBFT和PBFT策略,RTsBFT可取得更高的系统吞吐量、更短的延迟和更低的故障节点率,能够有效提高联盟链场景下溯源系统的性能和安全性。
  • 吴晓彤, 柳平增
    计算机工程. 2021, 47(7): 117-125,134. https://doi.org/10.19678/j.issn.1000-3428.0058362
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对实用拜占庭容错算法PBFT共识时延高、视图切换效率低、动态性不足等问题,提出一种基于备选投票机制的低时延共识算法IPBFT。通过增设候补集合,使系统的共识节点能够支持动态增加和减少,同时优化视图切换协议,使算法能够在只有两个阶段的情况下完成共识过程,降低系统的通信开销。在此基础上,将算法的主节点选取方式改进为投票选举机制,在节点进行共识的过程中实现主节点的选举,从而减少视图切换所需的通信次数和时延。实验结果表明,IPBFT算法较原始PBET算法具有更低的共识时延和更高的吞吐量,并且能够较好地支持节点动态的加入或退出。
  • 朱新兵, 李清宝, 张平, 陈志锋, 顾艳阳
    计算机工程. 2021, 47(7): 126-134. https://doi.org/10.19678/j.issn.1000-3428.0059386
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    物联网终端的显著特点是对外部世界进行感知与控制,但是传统安全威胁分析模型无法有效评估来自外部的攻击数据对物联网终端固件造成的危害。将新攻击面引入的攻击数据作为分析对象,通过对攻击数据在固件中的完整传播路径和交互过程进行建模,构建面向新攻击面的物联网终端固件安全威胁模型FSTM,从而分析物联网终端固件所面临的潜在威胁。分析结果表明,FSTM模型能有效描述物联网与物理世界紧耦合、与业务强相关的特性,为面向新攻击面的物联网终端安全检测技术研究提供理论指导。
  • 移动互联与通信技术
  • 金彦亮, 王妍, 齐崎, 唐晨君, 刘千红
    计算机工程. 2021, 47(7): 135-139. https://doi.org/10.19678/j.issn.1000-3428.0058078
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    无线干涉定位系统(RIPS)通过获得无线传感网络中节点的相位来实现对节点精确定位。介绍无线干涉定位算法,利用多径效应误差模型实现对RIPS定位结果的多径修正。构建RIPS室内定位仿真模型和硬件平台进行多径环境下的室内测距实验,结果显示实测误差远高于仿真误差。对此,从采样方式、反射系数和节点高度3个方面定量分析造成测距误差的原因。分析结果表明,采样方式、反射系数和定位节点高度设置是造成RIPS实际测量误差的主要因素,经过理论修正后测距误差可以降低87.61%。
  • 赵季红, 乔琳琳, 曲桦, 张文娟
    计算机工程. 2021, 47(7): 140-145,154. https://doi.org/10.19678/j.issn.1000-3428.0058226
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    网络切片是5G网络的基础架构技术,为在多个切片共享同一底层网络资源的同时保证切片的可靠性,提出一种区分业务类型的网络切片可靠性映射算法,解决底层网络链路故障、网络切片可靠性与资源利用率相互矛盾的问题。通过区分切片承载业务类型,对高可靠低时延切片请求的链路提前构建备份路径,并采用基于最大生成树链路的备份资源共享保护方法,对高带宽切片请求则采用基于链路可靠性的重映射算法恢复故障链路。仿真结果验证了该算法的有效性,与SVNE1+1和DPS-VNRA算法相比,其在切片成功运行率、长期收益开销比、物理链路利用率和故障恢复率方面均具有优势。
  • 吕亚平, 贾向东, 陈玉宛, 路艺
    计算机工程. 2021, 47(7): 146-154. https://doi.org/10.19678/j.issn.1000-3428.0058072
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对5G/B5G网络热点通信场景中基站(BS)部署的异构性以及用户设备(UE)与BS之间的耦合问题,提出一种面向密集热点区域的三层异构网络建模方案。将宏BS (MBS)和微微BS (PBS)的位置建模为泊松点过程,将分散在热点中心的UE和低功耗毫微微BS (FBS)建模为泊松簇过程,将PBS覆盖范围之外的UE和FBS建模为两个独立的泊松洞过程。在此基础上,设计UE分类和级联准则,推导簇中心和簇边缘UE的级联概率与级联距离的统计表达式,并考虑有序FBS和非有序FBS的两种级联情况。实验结果表明,当目标UE与FBS级联时,非有序FBS情况下的级联概率优于有序FBS情况,当目标UE与MBS或PBS级联时,有序FBS情况下的级联概率优于非有序FBS情况。
  • 郑娟毅, 崔卓, 苏海龙, 殷帅帅, 刘遥遥
    计算机工程. 2021, 47(7): 155-160,167. https://doi.org/10.19678/j.issn.1000-3428.0058231
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在5G移动通信系统商用落地的背景下,设计准确、高效的信道估计方法对无线网络性能优化具有重要意义。基于改进GA-Elman算法,提出一种新的无线智能传播损耗预测方法。对Elman神经网络中的连接权值、阈值和隐藏神经元进行实数编码,在隐藏神经元编码中加入二进制控制基因,同时利用自适应遗传算法对权值、阈值和隐藏神经元数量进行优化,解决网络易陷入局部极小值和神经元数目难以确定的问题,从而提高预测性能。仿真结果表明,与仅优化连接权值及阈值的GA-Elman神经网络和标准Elman神经网络相比,该方法具有较高的预测精度。
  • 王斐, 徐湛, 职如昕, 陈晋辉
    计算机工程. 2021, 47(7): 161-167. https://doi.org/10.19678/j.issn.1000-3428.0058184
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    超宽带(UWB)无线通信技术被广泛应用于室内定位领域,其能识别出多径信道中的非视距信道,有助于去除影响信号的非理想因素,提升定位精度。基于OFDM方案的UWB系统,提出一种利用卷积神经网络对信道估计出的信道冲激响应时频图像进行训练,从而识别出信道环境的方法,将信道识别问题转化为图像识别问题,同时分析时频处理参数对识别结果的影响。仿真结果表明,该方法的识别率随通信系统比特信噪比(EbN0)的增加而提升,当EbN0增加至20 dB时稳定在90%,与传统基于支持向量机的信道识别方法相比获得了10%的性能提升。
  • 曹志鹏, 刘勤让, 刘冬培, 张霞
    计算机工程. 2021, 47(7): 168-175,182. https://doi.org/10.19678/j.issn.1000-3428.0058683
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    从高效流量路由调度计算的角度出发,针对时间敏感流量调度中通常存在的计算效率低、迭代收敛慢等问题,提出一种基于最短路径负载均衡与改进遗传算法的流量调度方法。建立网络模型与流量模型并定义时间敏感网络中的流量传输约束,同时利用基于K最短路径的负载均衡路由算法与改进选择算子和交叉变异概率的遗传算法进行路由与调度计算。实验结果表明,该方法能有效缩短时延敏感流量调度任务的完成时间,提高调度计算效率,并加快迭代收敛速度。
  • 路艺, 贾向东, 纪澎善, 吕亚平
    计算机工程. 2021, 47(7): 176-182. https://doi.org/10.19678/j.issn.1000-3428.0057906
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对5G/B5G网络的热点场景中存在数据流量激增及基站与用户设备(UE)之间空间耦合的问题,构造一种基于泊松簇过程的无人机(UAV)协助的多层毫米波异构蜂窝网络模型。为提高该多层网络模型的平均区域吞吐量(AAT),提出基于最大偏置接收功率(BRP)准则的4层级联方案。借助毫米波传输模型和随机几何数学工具,通过UE级联概率及各层基站对UE干扰的拉普拉斯变换,推导出系统条件覆盖概率和AAT的数学解析表达式。研究UAV基站投影在地面上的分布方差、地面基站的密度对级联概率的影响,比较不同级联方案可获取的系统AAT。仿真结果表明,基于最大BRP准则的4层级联方案能够显著提升系统AAT,增强系统性能。
  • 体系结构与软件技术
  • 姜亚光, 陈曦, 李建彬, 闫靖晨, 刘曙元, 李坤昌
    计算机工程. 2021, 47(7): 183-188. https://doi.org/10.19678/j.issn.1000-3428.0058857
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于传统模糊测试框架的S7协议模糊测试技术存在构造困难和代码覆盖率低的问题,对测试效率和质量产生很大影响。借助神经网络模型对数据较强的学习能力和预测能力,提出一种基于长短期记忆(LSTM)神经网络的S7协议模糊测试用例生成方法。将S7协议中的特征值字段分为可变字段和不可变字段,对可变字段进行模糊处理,对不可变字段做固定值操作,进而利用局部模糊实现对S7协议帧各字段的模糊分析,生成有效的测试用例。经过学习,模型可以提取到西门子S7协议的特征,自动产生满足协议结构的测试用例。实验对不同字段进行局部模糊,结果表明,该方法预测出的数据具备真实测试用例的特征,可生成大量对特征字段关联性较大的有效测试用例,提高代码覆盖率。
  • 狄新凯, 杨海钢
    计算机工程. 2021, 47(7): 189-195,204. https://doi.org/10.19678/j.issn.1000-3428.0058640
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为消除卷积神经网络前向计算过程中因模型参数的稀疏性而出现的无效运算,基于现场可编程门阵列(FPGA)设计针对稀疏化神经网络模型的数据流及并行加速器。通过专用逻辑模块在输入通道方向上筛选出特征图矩阵和卷积滤波器矩阵中的非零点,将有效数据传递给由数字信号处理器组成的阵列做乘累加操作。在此基础上,对所有相关的中间结果经加法树获得最终输出特征图点,同时在特征图宽度、高度和输出通道方向上做粗颗粒度并行并寻找最佳的设计参数。在Xilinx器件上进行实验验证,结果表明,该设计实现VGG16卷积层综合性能达到678.2 GOPS,性能功耗比为69.45 GOPS/W,其性能与功耗指标较基于FPGA的稠密网络加速器和稀疏网络加速器有较大提升。
  • 廖汉松, 吴朝晖, 李斌
    计算机工程. 2021, 47(7): 196-204. https://doi.org/10.19678/j.issn.1000-3428.0058371
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器。通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,提高终端设备能效。在此过程中,配置CNN各层信息控制加速器进行分组运算,以适应不同大小的输入数据,同时调整加速器的数据通路,对耗时操作进行单独或结合运算,以适应不同的轻量化网络。FPGA平台验证结果表明,该处理器在100 MHz工作频率下推理SqueezeNet网络,耗时约40.89 ms,功耗为1.966 W,较手机处理器单核计算速度更快,与AMD Ryzen7 3700X、NVIDIA RTX2070 Super和Qualcomm Snapdragon 835平台相比,其消耗资源少、功耗低,在性能功耗比上也具有优势。
  • 朱文俊, 徐壮, 秦家佳, 李鹏
    计算机工程. 2021, 47(7): 205-211,217. https://doi.org/10.19678/j.issn.1000-3428.0058139
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    网络I/O在Redis存储过程中是限制存储性能的关键因素,而默认参数或人工参数配置会制约存储性能。针对参数配置不当导致存储吞吐性能下降及时延较高的问题,提出一种存储I/O优化方法GTS。考虑各阶段参数对存储性能的影响,在DPDK的优化原理基础上通过分析处理特性,采用分层模型策略实现对存储性能预测,从而寻找出最优参数调优方案。实验结果表明,与默认参数相比,GTS方法能够有效提升存储吞吐量,且在写密集下较ATH算法具有更低的时延。
  • 梁秋玲, 张向利, 张红梅, 闫坤
    计算机工程. 2021, 47(7): 212-217. https://doi.org/10.19678/j.issn.1000-3428.0057225
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    关联任务在多核处理器上并行调度所产生的通信时延,会对任务调度长度和处理器利用率造成负面影响,为了改善多核系统对关联任务的处理性能,针对关联任务在多核处理器上的调度特点,提出一种并行感知调度算法。计算各任务与终点间的最长路径值,按照该值的降序来分配任务调度次序,在分配处理器内核时兼顾关联度和任务最早可执行时间,设置最佳匹配评价函数。实验结果表明,与busHEFT和DTSV算法相比,该算法具有更短的任务调度时延、更少的通信量以及更高的处理器利用率。
  • 郑小敏, 李翔宇
    计算机工程. 2021, 47(7): 218-225. https://doi.org/10.19678/j.issn.1000-3428.0058096
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    无接触手势识别技术作为一种自然的人机交互方式,可以应用于手机、平板和可穿戴设备。为了高效实现超声手势识别嵌入式系统中采用的“一对其余”多分类随机森林算法,提出一种其推理过程的嵌入式软件实现方案。设计更精简的模型节点数据结构,以降低手势模型占用的存储空间。为节省系统能耗并缩短运行时间,利用分支定界的方法及时排除不可能产生正确解的手势类型,在保证识别率的条件下避免不必要的FLASH读取和决策树判定过程。实验结果表明,与传统的随机森林算法相比,该方案在FPGA上运行的实测时间缩短约60%,一次推理的平均判定次数低至243。
  • 图形图像处理
  • 张海涛, 秦鹏程
    计算机工程. 2021, 47(7): 226-231. https://doi.org/10.19678/j.issn.1000-3428.0058428
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对视频目标跟踪中因特征点误匹配造成跟踪性能下降的问题,在融合二进制特征描述算法(ORB)与网格统计的视频跟踪方法(GMS)框架下,提出一种基于GMS与特征点误匹配剔除(FPME)的视频目标跟踪方法。利用ORB算法确保在视频序列中特征点匹配的实时性,采用“粗-精”两阶段的剔除方法,即先利用K-means算法快速粗略地剔除误差较大的特征点匹配关系,提高正确匹配对所占的比例,再利用分裂法精确剔除偏离程度较大的匹配对,提高目标特征点之间的匹配成功率。实验结果表明,在视频序列的跨帧匹配与连续跟踪实验中,该方法相对于GMS、ASLA、HDT等当前主流算法在匹配精度、速度等评价指标上都能得到较好的结果。
  • 姜竣, 翟东海
    计算机工程. 2021, 47(7): 232-238,248. https://doi.org/10.19678/j.issn.1000-3428.0058315
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于卷积神经网络目标检测算法的浅层特征图包含丰富的细节信息,但缺乏语义信息,而深层特征图则相反。为充分利用浅层和深层特征图特征,解决多尺度目标检测问题,提出一种新的单阶段目标检测算法(AFE-SSD)。以SSD算法为基础,分别对该算法中相邻的2个特征图进行特征融合,从而丰富浅层特征层的语义信息。通过对并行空洞卷积机制进行改进,构建多尺度特征提取模块,将融合后的特征图通入多尺度特征提取模块的方式丰富其多尺度信息,同时提升主干网络的特征提取能力。在PASCAL VOC2007测试集上的实验结果表明,AFE-SSD算法的mAP为79.8%,检测速度为58.8 frame/s,与SSD、DSSD算法相比,mAP分别提升了2.4和1.2个百分点,验证了所提特征融合方式及多尺度提取模块的有效性。
  • 任立成, 杨嘉棋, 魏宇星, 张建林
    计算机工程. 2021, 47(7): 239-248. https://doi.org/10.19678/j.issn.1000-3428.0058437
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为提高全卷积孪生网络SiamFC在复杂场景下的识别和定位能力,提出一种基于多响应图融合与双模板嵌套更新的实时目标跟踪算法。使用深度ResNet-22替换AlexNet作为骨干网络以提升网络特征提取性能,建立强识别能力的骨干语义分支。在ResNet-22的浅层使用高分辨率特征,构造强定位能力的浅层位置分支,计算并融合两个分支响应。通过高置信度的双模板嵌套更新机制对两个分支的模板进行更新,以适应目标的外观和位置变化。在OTB2015和VOT2016数据集上的实验结果表明,与基于SiamFC、SiamDW等的目标跟踪算法相比,该算法在目标快速移动、遮挡等复杂场景下跟踪效果更稳定,并且运行速度达到34 frame/s,满足实时性要求。
  • 罗静蕊, 王婕, 岳广德
    计算机工程. 2021, 47(7): 249-256,265. https://doi.org/10.19678/j.issn.1000-3428.0058242
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在单传感器数码相机图像采集系统的彩色滤波阵列中,每个像素仅捕获单一颜色分量,并且在彩色图像重构过程中图像边缘等高频区域的伪影现象尤为明显。提出一种基于生成对抗网络的图像去马赛克算法,通过设计生成对抗网络的生成器、鉴别器和网络损失函数增强学习图像高频信息的能力,其中使用的生成器为具有残差稠密块和远程跳跃连接的深层残差稠密网络,鉴别器由一系列堆叠的卷积单元构成,并且结合对抗性损失、像素损失以及特征感知损失改进网络损失函数,提升网络整体性能。数值实验结果表明,与传统去马赛克算法相比,该算法能更有效减少图像边缘的伪影现象并恢复图像高频信息,生成逼真的重建图像。
  • 王囡, 侯志强, 赵梦琦, 余旺盛, 马素刚
    计算机工程. 2021, 47(7): 257-265. https://doi.org/10.19678/j.issn.1000-3428.0058167
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对语义分割中目标边缘模糊与分割不准确的问题,提出一种结合边缘检测的语义分割网络。整个网络由边缘检测网络和语义分割网络并行组成。利用边缘检测网络与语义分割网络分别提取图像的边缘特征和初步的语义分割特征,通过特征融合模块将边缘特征和语义分割特征进行融合,得到最终的语义分割结果。在CamVid数据集和Cityscapes数据集上的实验结果表明,与SegNet算法相比,该算法平均交并比分别提升了1.5和1.8个百分点,验证了所提算法的有效性。
  • 苏超群, 朱正为, 郭玉英
    计算机工程. 2021, 47(7): 266-272,288. https://doi.org/10.19678/j.issn.1000-3428.0058795
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统的目标跟踪算法易受边界效应影响,且当目标因遮挡严重、运动模糊、光照变化等产生外观变化时,目标响应图会发生突变,从而降低目标跟踪检测结果的可信度。提出一种改进的高效卷积算子(ECO)目标跟踪算法。利用高斯混合模型生成紧凑且多样化的样本数据,采用因式分解卷积方法减少模型参数,引入空间权值系数和前后两帧响应图的变化率来弱化边界效应并抑制响应图突变,以提高目标跟踪算法的鲁棒性能和精度。实验结果表明,在光照、尺度变化等多种干扰下,该算法的成功率和距离精度较原始ECO算法分别提高3.1个百分点和1.9个百分点。
  • 朱灵灵, 高超, 陈福才
    计算机工程. 2021, 47(7): 273-280. https://doi.org/10.19678/j.issn.1000-3428.0057249
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对人脸检测在移动端应用时面临的移动设备计算能力及存储资源受限等问题,设计一种基于轻量级卷积神经网络的改进人脸检测算法Lightweight-SSH。基于单点无头人脸检测器(SSH)人脸检测算法,采用基于MobileNet的轻量级卷积神经网络对样本数据进行特征提取,减少模型的参数量和计算量,通过在SSH网络的检测模块中引入可变形卷积层,提升卷积神经网络对人脸形变的建模能力。在Wider Face数据集上的实验结果表明,与常用人脸检测算法相比,Lightweight-SSH算法在保证检测精度的前提下,明显降低模型复杂度,并提高了模型检测速度。
  • 开发研究与工程应用
  • 刘丹, 耿娜
    计算机工程. 2021, 47(7): 281-288. https://doi.org/10.19678/j.issn.1000-3428.0058211
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对体检机构顾客排队等待时间长的问题,研究随机服务时间下的体检顾客调度,采用多人时间槽预约策略,并在预约调度策略的基础上优化每位顾客的体检项目顺序,提出一种包含粗糙仿真评估和精确仿真评估两阶段随机仿真优化算法。运用序优化思想将基于亲和度评估的多种群遗传算法作为迭代优化策略,并利用改进的最优计算量分配方法排除超级个体的影响,形成仿真资源的全局和自适应优化分配机制。实验结果表明,与不进行任何调度及使用体检顺序启发式调度规则的离散事件结果相比,该算法获得了更好的调度解。
  • 秦轩, 冯磊, 梁庆华, 张伟
    计算机工程. 2021, 47(7): 289-295,300. https://doi.org/10.19678/j.issn.1000-3428.0058426
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对配电站无人值守作业机器人执行巡检任务时对指针式仪表的识读需求,提出一种结合MSER-Otsu阈值分割与Hough变换直线矫正的仪表指针定位算法。利用最大稳定极值区域算法从表盘图像中粗提取出指针区域,引入迭代Otsu算法进一步对该区域进行阈值分割,将指针、阴影和背景区域像素点分离后仅保留指针的二值化图像,对其采用Hough变换进行指针中心线预定位,再以Huber loss为最优化函数对预定位直线进行矫正,最终完成指针中心线的定位。实验结果表明,该算法能在复杂环境中对仪表指针进行精确定位并计算指针偏转角度,与Hough变换算法和Huber loss拟合算法等相比,其处理速度更快且鲁棒性更高,能满足配电站巡检机器人的实际需求。
  • 徐颖蕾, 马炳先
    计算机工程. 2021, 47(7): 296-300. https://doi.org/10.19678/j.issn.1000-3428.0058252
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    结构活性作为Petri网的重要结构性质,在Petri网活性判定领域具有较高的研究价值。从Petri网有向回路对结构活性的影响入手,分析与判定无冲突Petri网的结构活性,讨论库所元素及其后置变迁之间是否存在有向回路对Petri网结构活性的影响,研究该类Petri网结构活性判定方法的相关条件与结论,得到无冲突Petri网是满足结构活性的充分必要条件。分析结果表明,该判定方法可在多项式时间内判定无冲突Petri网的结构活性。
  • 柏财通, 高志强, 李爱, 崔翛龙
    计算机工程. 2021, 47(7): 301-306. https://doi.org/10.19678/j.issn.1000-3428.0058590
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    军事装备无感控制是军事装备智能化建设进程中的一个重要研究方向,其中语音控制技术作为无人装备无感控制手段的关键组成部分,受到了越来越多的重视。为完成军事装备语音控制任务,设计一种基于门控网络的中文语音识别网络,并构建军事装备控制指令数据集,实现基于控制指令语音识别技术的军事装备控制。在传统卷积神经网络的结构基础上引入深度残差门控卷积网络,提高识别网络的准确性,同时通过多途径构建军事装备控制指令数据集,设计一套针对军事装备无感控制的语音识别方案。实验结果表明,该语音识别网络军事语音控制指令识别率可达87%,外接语言模型后可达92%,语音识别准确率高、误差率低,可完成军事装备的语音控制任务。
  • 刘奇, 赵丽霞, 郑曙光, 赵希梅
    计算机工程. 2021, 47(7): 307-313. https://doi.org/10.19678/j.issn.1000-3428.0058565
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为便于慢性肾脏疾病的计算机辅助诊断,提出一种基于DYOLO神经网络学习模型的自动超声图像肾脏检测方法。将YOLOv3和可变形卷积网络集成在一个端到端学习框架中,使得DYOLO可根据肾脏的大小和形状自适应调节接收域,以适应肾脏的各种纹理特征形变,实现临床超声图像中肾脏的自动检测。在自制KidneyDetec超声图像肾脏检测数据集上的实验结果表明,该方法在DYOLO网络模型的图像输入尺寸为416像素×416像素和608像素×608像素的情况下分别取得了89.6%和90.5%的平均精度均值,相比基于深度学习的目标检测方法具有更高的检测速度和检测精度,适用于慢性肾脏疾病的早期诊断。
  • 张震, 李孟洲, 李浩方, 马军强
    计算机工程. 2021, 47(7): 314-320. https://doi.org/10.19678/j.issn.1000-3428.0058283
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对传统SSD算法在检测小目标时容易漏检且检测精度不高的问题,提出一种改进算法。对SSD算法中各尺度特征进行尺寸大小不变的卷积操作,将卷积前后对应的特征进行轻量级网络融合,从而生成新的金字塔特征层,并加入基于残差模块的检测单元避免增加网络模型容量和运算复杂度,同时增强对小尺度目标的检测能力。基于PASCAL-VOC2007小目标数据集的实验结果表明,与传统SSD、YOLOv3、Faster RCNN等算法相比,在PASCAL-VOC2007小目标数据集中,该算法的mAP指标较传统SSD算法提高8.5%,较Faster RCNN算法提高3.9%,较YOLOv3提高2%,FPS达到83 frame/s,其检测地铁安检图片的mAP达到77.8%。