作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2022年, 第48卷, 第9期 刊出日期:2022-09-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2022, 48(9): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 潘嘉诚, 董一鸿, 陈华辉
    计算机工程. 2022, 48(9): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0064352
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    自闭症谱系障碍是一种复杂的神经系统发展障碍疾病,截至目前其病因尚不明确。图神经网络作为非欧几里得空间深度学习的重要分支,在处理图结构数据的相关任务中取得优异表现,为医学领域的成像和非成像模式的集成提供了可能,因此利用图神经网络进行自闭症等脑部疾病神经成像诊断逐渐成为研究热点。阐述传统机器学习方法在自闭症疾病预测中应用,介绍图神经网络的基本分类,按照图中节点与边关系的建模方法,从基于人群图和基于个体图两个角度对图神经网络在自闭症辅助诊断中的应用进行梳理和分析,并归纳现有诊断方法的优劣势。根据目前基于图神经网络的自闭症神经成像诊断的研究现状,总结了脑神经科学领域辅助诊断技术面临的主要挑战和未来研究方向,对于自闭症等脑部疾病辅助诊断的进一步研究具有指导意义和参考价值。
  • 董卫宇, 李海涛, 王瑞敏, 任化娟, 孙雪凯
    计算机工程. 2022, 48(9): 12-19. https://doi.org/10.19678/j.issn.1000-3428.0063443
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    入侵检测系统(IDS)在发现网络异常和攻击方面发挥着重要作用,但传统IDS误报率较高,不能准确分析和识别异常流量。目前,深度学习技术被广泛应用于网络流量异常检测,但仅仅采用简单的深度神经网络(DNN)模型难以有效提取流量数据中的重要特征。针对上述问题,提出一种基于堆叠卷积注意力的DNN网络流量异常检测模型。通过堆叠多个以残差模块连接的注意力模块增加网络模型深度,同时在注意力模块中引入卷积神经网络、池化层、批归一化层和激活函数层,防止模型过拟合并提升模型性能,最后在DNN模型中得到输出向量。基于NSL-KDD数据集对模型性能进行评估,将数据集预处理生成二进制特征,采用多分类、二分类方式验证网络流量异常检测效果。实验结果表明,该模型性能优于KNN、SVM等机器学习模型和ANN、AlertNet等深度学习模型,其在多分类任务中识别准确率为0.807 6,较对比模型提高0.034 0~0.097 5,在二分类任务中准确率和F1分数为0.860 0和0.863 8,较对比模型提高0.013 0~0.098 8和0.030 6~0.112 8。
  • 牛淑芬, 闫森, 吕锐曦, 周思玮, 张美玲
    计算机工程. 2022, 48(9): 20-27,36. https://doi.org/10.19678/j.issn.1000-3428.0063450
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着5G/6G移动通信技术的发展,车联网对于车辆对基础设施、车辆对车辆之间快速交换信息的要求明显提高。然而,在5G/6G网络切片技术中,不同的网络切片采用不同的密码体制,从而会形成异构网络通信。异构车联网可以实现车辆信息的即时共享,但开放的无线通信通道使车辆隐私信息易被泄露,这需要保证共享数据的机密性和完整性。提出一种隐私保护性异构聚合签密方案。该方案使用异构签密技术,在公钥基础设施和基于身份的密码系统(IBC)网络切片环境中可实现不同密码系统注册车辆之间的异构安全通信,同时采用聚合技术,在IBC环境中的车辆将接收到的密文消息进行聚合并对其解密。为确保解密后的密文消息完整,接收车辆对消息进行批量验证,以减少解签密过程所需的时间及传输量。在随机预言模型下,该方案对适应性选择密文攻击具有不可区分性,对适应性选择消息攻击具有存在性与不可伪造性。实验结果表明,相比基于边缘计算的无证书聚合签密方案与车联网高效签密方案,该方案在发送车辆对消息进行签密的阶段中所用时间减少了18.91%~63.12%,在接收车辆对密文进行解签密的阶段中所用时间减少了5.91%~33.66%,具有较高的计算效率。
  • 甘红楠, 张凯
    计算机工程. 2022, 48(9): 28-36. https://doi.org/10.19678/j.issn.1000-3428.0064406
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有基于近邻图的近似最近邻搜索(ANNS)算法通常将数据库中被检索向量组织成近邻图结构,根据用户设定参数搜索查询向量的近似最近邻。为提升基于近邻图的ANNS算法在给定召回率下的搜索效率,提出一种参数自适应方法AdaptNNS。采集数据库中的被检索向量并对采样结果进行聚类,利用聚类中心向量和最近邻分类器提取查询负载特征,同时将查询负载特征与不同的召回率相结合作为输入特征训练梯度提升决策树(GBDT)模型。在查询处理过程中,根据应用程序指定的召回率获取最终输入特征,并通过GBDT模型预测最优搜索参数,提升ANNS算法的吞吐量。在Text-to-Image、DEEP和Turing-ANNS数据集上的实验结果表明,当达到相同的目标召回率时,AdaptNNS方法相比于Baseline方法最多可将DiskANN和HNSW算法的吞吐量提升1.3倍,具有更高的近似最近邻搜索效率。
  • 高庆吉, 李天昊, 邢志伟, 刘佩佩
    计算机工程. 2022, 48(9): 37-44,54. https://doi.org/10.19678/j.issn.1000-3428.0063863
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为降低室外大规模点云场景中多类三维目标语义分割的计算复杂度,提出一种融合区块特征的语义分割方法。采用方形网格分割方法对三维点云进行区块划分、采样以及组合,求取简化的点云组合区块集,将其输入至区块特征提取和融合网络中从而获得每个区块的特征修正向量。设计点云区块全局特征修正网络,以残差的方式融合特征修正向量与原始点云全局特征,修正因分割造成的错误特征。在此基础上,将方形网格分割尺寸作为神经网络的参数引入反向传播过程中进行优化,从而建立高效的点云语义分割网络。实验结果表明,反向传播算法可以优化分割尺寸至最佳值附近,所提网络中的全局特征修正方法能够提高语义分割精度,该方法在Semantic3D数据集上的语义分割精度达到78.7%,较RandLA-Net方法提升1.3%,且在保证分割精度的前提下其点云预处理计算复杂度和网络计算时间明显降低,在处理点数为10万~100万的大规模点云时,点云语义分割速度较SPG、KPConv等方法提升2~4倍。
  • 杨桂松, 吴笑天, 高丽, 何杏宇
    计算机工程. 2022, 48(9): 45-54. https://doi.org/10.19678/j.issn.1000-3428.0064071
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在移动群智感知中,现有的任务分配方法大多关注平台的整体感知质量,未充分考虑任务对工人、预算等资源的竞争,无法有效保障大规模任务分配场景下每个任务的感知质量,从而导致平台资源利用率降低。针对该问题,提出一种面向单任务质量保障的任务分配方法。为高效利用平台预算,考虑任务的难度和位置以及工人的设备能耗和理性因素,设计平台的激励成本。为保障每个任务的感知质量,考虑任务间的资源竞争情况并设计2种衡量指标,分别是从任务的角度根据差异化感知质量需求设计任务覆盖效率,以及从工人的角度基于最大熵原理设计工人利用效率,将这2种衡量指标相结合作为平台的系统效用,在平台资源有限的情况下以平台系统效用最大化为优化目标,提出一种融合交叉和变异操作的天牛群(BSO)算法。实验结果表明,与PSO、GA等基线方法相比,BSO算法的系统效用最大值平均提升13.51%,寻优速度平均提高40.61%,利用该算法获取的具有最大系统效用的任务分配方案可以有效保障每个任务的感知质量。
  • 邓天民, 谭思奇, 蒲龙忠
    计算机工程. 2022, 48(9): 55-62. https://doi.org/10.19678/j.issn.1000-3428.0062843
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    交通信号灯的检测与识别是提升无人驾驶系统安全性的关键技术,传统基于深度学习的识别方法不能在精度和速度之间达到较好的平衡,难以满足实际环境下的检测要求。YOLOv5具有网络规模小的优势,适合在交通场景下进行交通信号灯检测。对YOLOv5网络进行改进,提出TL-YOLOv5s网络用于交通信号灯识别。通过简化主干网络中卷积层的数量提高特征提取效率,同时对残差组件进行密集连接和多层次跨连接,得到2种新的CSP残差结构替换原网络中的残差结构,增强网络特征融合能力,提高识别精度。考虑到交通信号灯的小目标属性,在网络中保留中小目标检测尺度而去除大目标检测尺度,进一步提升识别速率。在法国巴黎LaRA信号灯数据集上进行实验,结果表明,TL-YOLOv5s网络mAP值达到70.1%,相比于基线网络YOLOv5提升6.3个百分点,且检测速度达到22.4 frame/s,能够满足现实环境下的实时性要求。
  • 人工智能与模式识别
  • 郭可翔, 王衡军, 白祉旭
    计算机工程. 2022, 48(9): 63-70. https://doi.org/10.19678/j.issn.1000-3428.0062306
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    文本校对是自然语言处理领域的重要分支。深度学习技术因强大的特征提取与学习能力被广泛应用于中文文本校对任务。针对现有中文文本错误检测模型忽略句子连续词间的局部信息、对于长文本的上下文语义信息提取不充分等问题,提出一种基于多通道卷积神经网络(CNN)与双向门控循环单元(BiGRU)的字词级文本错误检测模型。利用Word2vec向量化待检错文本,采用CNN挖掘待检错文本的局部特征,使用BiGRU学习待检错文本的上下文语义信息及长时依赖关系,并通过Softmax处理后输出文本分类结果以判断文本中是否含有字词错误,同时采取L2正则化和dropout策略防止模型过拟合。在SIGHAN2014和SIGHAN2015中文拼写检查任务数据集上的实验结果表明,与基于长短时记忆网络的文本错误检测模型相比,该模型的检错F1值提升了3.01个百分点,具有更优的字词级文本错误检测效果。
  • 黄君扬, 王振宇, 梁家卿, 肖仰华
    计算机工程. 2022, 48(9): 71-77,88. https://doi.org/10.19678/j.issn.1000-3428.0064560
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    自然语言转换为结构化查询语言(NL2SQL)是语义解析领域的重要任务,其核心为对数据库模式和自然语言问句进行联合学习。现有研究通过将整个数据库模式和自然语言问句联合编码构建异构图,使得异构图中引入大量无用信息,并且忽略了数据库模式中不同信息的重要性。为提高NL2SQL模型的逻辑与执行准确率,提出一种基于自裁剪异构图与相对位置注意力机制的NL2SQL模型(SPRELA)。采用序列到序列的框架,使用ELECTRA预训练语言模型作为骨干网络。引入专家知识,对数据库模式和自然语言问句构建初步异构图。基于自然语言问句对初步异构图进行自裁剪,并使用多头相对位置注意力机制编码自裁剪后的数据库模式与自然语言问句。利用树型解码器和预定义的SQL语法,解码生成SQL语句。在Spider数据集上的实验结果表明,SPRELA模型执行准确率达到71.1%,相比于相同参数量级别的RaSaP模型提升了1.1个百分点,能够更好地将数据库模式与自然语言问句对齐,从而理解自然语言查询中的语义信息。
  • 刘宇航, 尹小庆, 林云
    计算机工程. 2022, 48(9): 78-88. https://doi.org/10.19678/j.issn.1000-3428.0062044
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在复杂网络中,现有基于结构相似性的链路预测方法较少考虑全局和局部拓扑信息之间平衡性、准确度和复杂度之间平衡性以及网络资源动态流动的问题。将网络资源流量作为相似性判断依据,提出一种准局部链路预测方法。根据网络中节点重要性的不同来为它们分配对应的资源,以保证资源分配的合理性。针对网络资源提出一种动态流动机制,将节点对双向流动的资源之和作为相似程度的量化指标。引入节点对之间中间路径节点的概念,分析中间路径节点在资源流动过程中的稀释作用。在此基础上,计算初始资源量和稀释作用量从而得到网络资源流量方法的性能评估指标值。在Jazz、NS等11个真实世界的网络中进行实验,对比该方法与CN、Salton等常见基准方法在准确度和鲁棒性方面的性能表现,结果表明,所提方法能够充分利用准局部信息,既能考虑资源流动性又能解决平衡性问题,可有效提高链路预测性能。
  • 徐上上, 孙福振, 王绍卿, 董家玮, 吴田慧
    计算机工程. 2022, 48(9): 89-95,104. https://doi.org/10.19678/j.issn.1000-3428.0062235
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统基于图神经网络的社交推荐算法通过加强用户和项目特征的学习提升预测精度,但随着用户数据日益稀疏和社交关系趋于复杂,推荐质量提升缓慢。为挖掘用户和项目的潜在关联关系,提出一种结合图神经网络的异构信任推荐算法(GraphTrust)。在显式信任关系的基础上获取用户的潜在好友,根据动态影响力传播模型将图神经网络中的节点和边进行分类,通过不同类型的边在不同节点间进行影响力传播扩散,捕捉隐藏在高阶网络结构中的影响力扩散特征,并使用户和项目的潜在特征随着影响力传播过程达到平衡状态,最终将用户交互的项目特征作为辅助特征与用户特征聚合进行评分预测。在Yelp和Flickr数据集上的实验结果表明,当潜在特征维数为64时,GraphTrust算法相比于DiffNet++算法的命中率和归一化折损累计增益分别提升了13.2%、22.2%和20.4%、25.5%,在一定程度上提高了推荐过程的可解释性和预测精度,并且缓解了数据稀疏问题。
  • 付鹏程, 杨关, 刘小明, 刘阳, 张紫明, 成曦
    计算机工程. 2022, 48(9): 96-104. https://doi.org/10.19678/j.issn.1000-3428.0062339
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    视觉问答作为多模态数据处理中的重要任务,需要将不同模态的信息进行关联表示。现有视觉问答模型无法有效区分相似目标对象且对于目标对象之间的空间关系表达不准确,从而影响模型整体性能。为充分利用视觉问答图像和问题中的细粒度信息与空间关系信息,基于自底向上和自顶向下的注意力(BUTD)模型及模块化协同注意力网络(MCAN)模型,结合空间域特征和频率域特征构造多维增强注意力(BUDR)模型和模块化共同增强注意力网络(MCDR)模型。利用离散余弦变换得到频率信息,改善图像细节丢失问题。采用关系网络学习空间结构信息和潜在关系信息,减少图像和问题特征出现对齐错误,并加强模型推理能力。在VQA v2.0数据集和test-dev验证集上的实验结果表明,BUDR和MCDR模型能够增强图像细粒度识别性能,提高图像和问题目标对象间的关联性,相比于BUTD和MCAN模型预测精确率分别提升了0.14和0.25个百分点。
  • 詹京吴, 黄宜庆
    计算机工程. 2022, 48(9): 105-112,120. https://doi.org/10.19678/j.issn.1000-3428.0062264
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    A*算法通过启发信息指引搜索方向,被广泛应用于移动机器人的路径规划,但其规划出的搜索路径存在冗余节点且与障碍物相近,无法满足动态避障需求。对标准A*算法进行改进,设计安全A*算法并融合动态窗口法进行路径规划。定义安全距离因子引入A*算法的启发函数中,提高算法规划路径的安全性,同时采用平面结构法对算法规划得到的路径进行优化,根据相邻节点与障碍物之间的位置关系判断该相邻节点间是否存在障碍物,由此减少路径拐点数,提高路径平滑度。由于当移动机器人处于未知环境时,仅靠A*算法不能避开障碍物到达目标点,因此借助动态窗口法的局部避障功能。通过安全A*算法规划全局最优路径节点坐标,设计融合子函数改进动态窗口法的评价函数,解决动态窗口法易陷入局部最优的问题。实验结果表明,在复杂环境中,该方法通过融合安全A*算法和动态窗口法,能够确保在安全路径基础上实时随机避障,使机器人安全到达终点。
  • 王国栋, 叶剑, 谢萦, 钱跃良
    计算机工程. 2022, 48(9): 113-120. https://doi.org/10.19678/j.issn.1000-3428.0062417
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在边缘设备上运行深度神经网络模型并进行实时性分析,需要对网络模型进行压缩以减少模型参数量和计算量,但现有剪枝算法存在耗时长和模型压缩率低的问题。提出一种基于梯度设置不同阈值的结构化剪枝算法。对神经元进行细粒度评价,采用神经网络的梯度信息衡量权重的重要性,通过网格搜索和计算曲率的方式获取不同网络层的剪枝权重阈值,根据搜索后的剩余参数量确定不同网络层的卷积核中需要剔除的冗余参数。在此基础上,保留网络层中有效参数较多的卷积核,实现对卷积核个数的调整,进而重新训练以保证模型精度。分别对VGG16、ResNet50分类模型和SSD、Yolov4、MaskRCNN目标检测模型进行剪枝实验,结果表明,经该算法剪枝后,分类模型参数量减少92%以上,计算量减少70%以上,目标检测模型参数量减少75%以上,计算量减少57%以上,剪枝效果优于Rethinking、PF等算法。
  • 郝志峰, 陈正鸣, 谢峰, 陈薇, 蔡瑞初
    计算机工程. 2022, 48(9): 121-129. https://doi.org/10.19678/j.issn.1000-3428.0062335
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    因果发现旨在通过观测数据挖掘变量间的因果关系,在实际应用中需要从观测数据中学习隐变量间的因果结构。现有方法主要利用观测变量间的协方差信息(如四分体约束)或引入非高斯假设(如三分体约束)来解决线性因果模型下的隐变量结构学习问题,但大多限定于分布明确的情况,而实际应用环境往往并不满足这种假设。给出任意分布下隐变量结构的识别性证明,指出在没有混淆因子影响的情况下,两个隐变量的因果方向可识别所需要的最小条件是仅需要其中一个隐变量的噪声服从非高斯分布。在此基础上,针对线性隐变量模型提出一种在任意分布下学习隐变量因果结构的算法,先利用四分体约束方法学习得到隐变量骨架图,再通过枚举骨架图的等价类并测量每一个等价类中的三分体约束来学习因果方向,同时将非高斯约束放宽到尽可能最小的变量子集,从而扩展线性隐变量模型的应用范围。实验结果表明,与MIMBuild和三分体约束方法相比,该算法得到了最佳的F1值,能够在任意分布下学习更多的隐变量因果结构信息,且具有更强的鲁棒性。
  • 体系结构与软件技术
  • 周雍浩, 徐金龙, 李斌, 钱宏, 聂凯
    计算机工程. 2022, 48(9): 130-138. https://doi.org/10.19678/j.issn.1000-3428.0062139
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术。并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序。实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率。
  • 刘鹏, 刘杰, 贾讯
    计算机工程. 2022, 48(9): 139-145. https://doi.org/10.19678/j.issn.1000-3428.0062745
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    某自主指令架构系列芯片(简称为GCXP)主要使用基于扫描链重用的硬件调试机制,与主流商用嵌入式芯片产品相比,该硬件调制机制安全性较低且不具备用户交互、程序下载等功能,同时缺乏嵌入式调试软件生态,不利于嵌入式产品的推广与应用。参考ARM CoreSight、RISCV Debug SPEC及SiFive开源芯片Debug Module的实现细节,结合GCXP特权架构,提出一种软硬件协同的调试中断陷入机制。使用自主特权架构中的特权程序替代部分调试中断硬件逻辑,使得在调试模块设计时无需进行CPU协同修改以及操作系统软件接口和上位机调试软件的二次开发,从而避免CPU硬件逻辑修改后大量的验证工作,同时无缝兼容历史CPU IP。分析结果表明,该中断陷入机制与RISCV Debug SPEC协议能够实现良好的协同,可以与SiFive参考开源调试模块协同工作,支持主流交互式调试软件及硬件工具,且调试模块的代码及功能覆盖率都能达到100%,可以满足流片需求。
  • 黄正伟, 刘宏伟, 徐渊
    计算机工程. 2022, 48(9): 146-154. https://doi.org/10.19678/j.issn.1000-3428.0062281
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    IToF深度探测技术是当前主流的3D感知实现方案之一,该技术的核心部件是IToF传感芯片。随着当今社会数字化与智能化进程的加快,各科技领域对IToF传感芯片的需求日益提高,然而IToF传感芯片产能的提升引起了由芯片运行所带来的功耗问题。针对IToF传感器设计一款基于第五代精简指令集架构(RISC-V)的极低功耗专用处理器IToF-miniRV。IToF-miniRV包含支持RV32I指令集、RV32M指令集和自定义IToF型指令的处理器,以及用于加速深度计算和光幅度运算的IToF硬件加速器。将IToF-miniRV处理器与蜂鸟E203、PULPissimo这两款开源的基于RISC-V的超低功耗处理器分别部署在Xilinx Zynq-7000芯片上,进行FPGA资源使用情况和运行功耗的对比实验,结果表明,相比蜂鸟E203和PULPissimo,IToF-miniRV处理器的FPGA资源使用率分别减少5.2和10.9个百分点,运行功耗分别下降37.6%和89.7%。
  • 杨周凡, 韩林, 李冰洋, 谢景明, 韩璞, 刘勇杰
    计算机工程. 2022, 48(9): 155-161. https://doi.org/10.19678/j.issn.1000-3428.0063418
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    供水管网仿真广泛应用于城市供水输配调度,是城市供水管网监测与维护的重要技术手段。由于在面向城市级的大规模管网中产生了海量的计算数据,因此在一般计算平台上无法满足管网仿真计算的算力需求。为提升城市级供水管网仿真的计算效率,提出一种有效的并行化方案。基于“嵩山”超级计算机系统采用中央处理器+数据缓存单元(CPU+DCU)架构,利用其在密集数据计算方面的优势,对“嵩山”超级计算机进行供水管网仿真。参照可移植性异构计算接口(HIP)异构编程模型,在“嵩山”超级计算机上实现供水管网仿真的异构计算,并结合管道数据分割方案,使用消息传递接口开启多进程以实现DCU加速数据通信传递。通过重定义数据类型解决计算过程中结构体传输问题,实现单节点内多DCU的大规模密集计算。在不同计算平台和多种计算策略仿真上的对比结果表明,与传统x86平台相比,该优化方案在小规模数据与大规模数据上的加速比分别达到5.269、10.760,与采用计算统一设备架构异构编程模型的传统GPU异构平台相比,计算性能有明显提高。
  • 冯一飞, 丁楠, 叶钧超, 柴志雷
    计算机工程. 2022, 48(9): 162-170. https://doi.org/10.19678/j.issn.1000-3428.0063200
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对量化高频交易应用场景对数据传输低延迟高带宽的需求,定制一种领域专用的TCP/IP协议栈,并将其卸载到专用硬件加速模块上。采用模块化设计实现专用硬件逻辑,并与FAST协议硬件加速模块共同构成完整的低延迟高带宽高频交易系统。通过调整最大报文长度,实现64 Byte数据对齐,提升内核与高带宽内存(HBM)间的读写速率,并对内存结构进行优化,实现主机端与HBM间的4通道并行读写管理。对各功能模块进行数据流优化,最终构建全流水线架构。模块间统一使用AXI4-Stream接口连接,并绕过内存进行数据传输,实现传输性能的提升。实验结果表明,TCP/IP卸载引擎在Xilinx Alevo U50数据中心加速卡上可获得38.28 Gb/s的网络吞吐率,基础网络通信穿刺延迟最低为468.4 ns,在叠加FAST解码协议后延迟为677.9 ns,与传统软件处理网络堆栈(Intel i9-9900x+9802BF)的方式相比,TCP/IP引擎的吞吐率提升1倍,延迟降低为1/12,且延迟稳定,波动范围在10 ns左右,在满足量化高频交易场景需要的同时,有效减轻了CPU的负载。
  • 王小雪, 王晓锋, 刘渊
    计算机工程. 2022, 48(9): 171-179,196. https://doi.org/10.19678/j.issn.1000-3428.0062658
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在现有OpenStack云平台与Docker容器技术的集成方案中,基于容器初始资源请求的调度模型由于未充分考虑容器运行时的实际资源使用情况,导致资源利用率较低。为满足云计算领域的高资源利用率和低成本需求,构建基于OpenStack云平台的Docker调度模型(DSM),将其与OpenStack的Keystone、Glance以及Neutron组件的API进行交互,获取创建容器所需的镜像、网络等资源,同时调用Docker Engine提供的API部署容器,对容器生命周期进行高效灵活管控。通过融合初始化模块、资源实时感知模块、容器调度模块、资源实时监测模块和容器迁移模块,并在容器调度模块中利用资源可用度评估与优先级决策调度机制为容器选择最优的计算节点,实现OpenStack云平台中资源的高效利用。实验结果表明,与经典Nova-Docker和Yun集成方案采用的调度模型相比,DSM调度模型在CPU和内存利用率上至少提升38.54、30.17个百分点和38.40、28.69个百分点。
  • 图形图像处理
  • 马亚彤, 王松, 刘英芳
    计算机工程. 2022, 48(9): 180-188. https://doi.org/10.19678/j.issn.1000-3428.0064490
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于多模态融合的人体动作识别技术被广泛研究与应用,其中基于特征级或决策级的融合是在单一级别阶段下进行的,无法将真正的语义信息从数据映射到分类器。提出一种多级多模态融合的人体动作识别方法,使其更适应实际的应用场景。在输入端将深度数据转换为深度运动投影图,并将惯性数据转换成信号图像,通过局部三值模式分别对深度运动图和信号图像进行处理,使每个输入模态进一步转化为多模态。将所有的模态通过卷积神经网络训练进行提取特征,并把提取到的特征通过判别相关分析进行特征级融合。利用判别相关分析最大限度地提高两个特征集中对应特征的相关性,同时消除每个特征集中不同类之间的特征相关性,将融合后的特征作为多类支持向量机的输入进行人体动作识别。在UTD-MHAD和UTD Kinect V2 MHAD两个多模态数据集上的实验结果表明,多级多模态融合框架在两个数据集上的识别精度分别达到99.8%和99.9%,具有较高的识别准确率。
  • 郑伟鹏, 罗晓曙, 蒙志明
    计算机工程. 2022, 48(9): 189-196. https://doi.org/10.19678/j.issn.1000-3428.0062811
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    人脸表情识别作为人机交互的一种重要方法,广泛应用于智能医疗、公安测谎系统、车载安全系统等领域。现有人脸表情识别方法多数存在参数量冗余、计算成本高、特征表达瓶颈等问题。提出一种基于改进轻量级秩扩展网络ReXNet的人脸表情识别方法。通过构建改进的ReXNet以提取人脸表情特征,在参数量较少的条件下解决特征表达瓶颈的问题,增强对表情局部特征的关注,获得高层次的表情特征,同时融合坐标注意力模块,将位置信息嵌入到通道注意力中,精准地定位和识别感兴趣的特征,建立位置信息与局部特征之间的长依赖关系,减少计算开销。在此基础上,将细化模块引入到改进的网络架构中,利用类别上下文信息细化分类结果,增强类间的分化效果,从而提高人脸表情识别的准确率。实验结果表明,该方法在RAF-DB和FERPlus数据集上的人脸表情识别准确率分别达到88.43%和88.8%,相比VGG16-PLD、SHCNN、ResNet+VGG等方法,具有较高的准确率和较优的鲁棒性。
  • 高海韬, 李丹宁, 王彬, 唐鑫鑫
    计算机工程. 2022, 48(9): 197-203,212. https://doi.org/10.19678/j.issn.1000-3428.0062656
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    运动模糊图像复原的目的是改善运动图像质量,从而为图像处理任务提供高质量的清晰图像以保证算法能够准确获取图像信息,其中运动模糊图像的点扩散函数(PSF)求解是影响复原图像质量的关键步骤。针对现有运动模糊图像PSF参数估计方法中存在的估计误差大、有效估计范围有限等问题,在分析频谱图像特征的基础上,提出一种改进的PSF参数估计方法。通过图像增强处理和形态学变换去除频谱图像中的十字亮线和噪点干扰,获取形态合适的条纹图像以完成Radon变换检测。利用二值频谱图像的条纹特征自适应地控制形态学运算精度,从而保证算法的执行效率和鲁棒性。对条纹进行边缘测定,消除由条纹自身宽度导致的角度估计误差,以提高参数估计结果的精度。实验结果表明,该方法能够提高模糊参数估计的准确率和有效估计范围,由此构建的PSF能复原出更加清晰的重建图像,复原图像总体峰值信噪比不低于25 dB。
  • 王富平, 于俊涛, 张锲石
    计算机工程. 2022, 48(9): 204-212. https://doi.org/10.19678/j.issn.1000-3428.0062266
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统彩色边缘检测算法在提高边缘检测准确性时可能将噪声检测为边缘,而在提高噪声鲁棒性时会将部分边缘当作噪声进行抑制,导致部分边缘信息丢失。为解决传统彩色边缘检测算法在边缘检测准确性与噪声鲁棒性之间的矛盾问题,提出一种基于自适应各向异性高斯方向导数(ANDD)的彩色边缘检测算法。通过彩色图像的微分自相关矩阵构建反映边缘类型的度量准则,以自适应地确定每个像素处ANDD滤波器的形状,从而准确提取不同类型的边缘特征,采用ANDD滤波器组对图像进行平滑处理,提取在三个通道上的ANDD特征。在此基础上,利用奇异值分解得到最优融合权值,并融合三个通道的ANDD特征,以增强彩色边缘强度。实验结果表明,该算法在无噪声和含噪声环境下的Pratt品质因子分别为0.849 6和0.791 4,与彩色Canny、RCMG-MM和FRPOS算法相比,在保持较高边缘检测准确率的同时具有较优的噪声鲁棒性。
  • 于长志, 张连新, 孙鹏飞, 陈东生, 宋颖慧, 姚云飞, 李炼, 李代杨
    计算机工程. 2022, 48(9): 213-222,229. https://doi.org/10.19678/j.issn.1000-3428.0062692
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    端面对接在航空航天、自动化装配、人机交互等领域有着重要应用,然而端面检测仍存在圆姿态解不唯一、解精度不高、对接效率较低等问题。为提高测量精度和鲁棒性,以背靠视觉和排列点激光为测量手段,提出一种基于法向约束的端面对接定位方法。通过背靠视觉分别采集端面圆特征图像,在对圆特征进行边缘提取的基础上采用随机采样一致性算法进行圆特征拟合,降低图像噪声的影响,提高特征拟合的鲁棒性。根据单目相机圆位姿解算模型,得到二义性的端面圆中心位置和姿态解,将排列点激光拟合得到的平面法向量作为法向约束,并取圆姿态解与法向约束的夹角最小者为正确的圆姿态解。最后,由机器人先后进行姿态和位移迭代调整,完成端面的对接装配。机器人小角度姿态、小位移的实验结果表明,该方法具有姿态调整准确度高、位移调整收敛快的特点,姿态最大偏差为0.03°,中心位移X方向最大偏差为0.01 mm、Y方向最大偏差为0.03 mm。
  • 王春智, 牛宏侠
    计算机工程. 2022, 48(9): 223-229. https://doi.org/10.19678/j.issn.1000-3428.0062764
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对沙尘天气下图像色彩偏移严重及对比度低等问题,提出一种基于直方图均衡化与带色彩恢复的多尺度视网膜(MSRCR)增强的沙尘降质图像增强算法。通过偏色校正和图像增强两个步骤进行图像恢复,将RGB图像各通道预处理后利用限制对比度自适应直方图均衡方法得到校正后的图像,对图像采用双边滤波进行降噪处理,通过MSRCR算法进一步解决色彩失衡问题。由于处理后的图像对比度较低,存在一定色偏,利用伽马校正和基于图像分析的偏色检测及颜色校正方法进行处理得到最终结果。对大量沙尘降质图像进行仿真实验,结果表明,该算法能够有效处理不同偏色程度的沙尘图像,不仅提高了图像的对比度,而且有效避免了图像颜色偏移现象,相比GCANet、MSRCR等算法,平均时间效率提升了46.2%~94.7%。
  • 王旖旎, 高永彬, 万卫兵, 杨淑群, 郭茹燕
    计算机工程. 2022, 48(9): 230-238. https://doi.org/10.19678/j.issn.1000-3428.0062268
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为在场景图生成网络中获得重要的上下文信息,同时减少数据集偏差对场景图生成性能的影响,构建一种基于外部知识库与适应性推理的场景图生成模型。利用结合外部知识库的目标检测模块引入语言先验知识,提高实体对关系类别检测的准确性。设计基于Transformer架构的上下文信息提取模块,采用两个Transformer编码层对候选框和实体对关系类别进行处理,并利用自注意力机制分阶段实现上下文信息合并,获取重要的全局上下文信息。构建特征特殊融合的适应性推理模块,通过软化分布并根据实体对的视觉外观进行适应性推理关系分类,缓解实体对关系频率的长尾分布问题,提升模型推理能力。在VG数据集上的实验结果表明,与MOTIFS模型相比,该模型在谓词分类、场景图分类和场景图生成子任务上的Top-100召回率分别提升了1.4、4.3、7.1个百分点,对于多数关系类别具有更好的场景图生成效果。
  • 刘腾, 刘宏哲, 李学伟, 徐成
    计算机工程. 2022, 48(9): 239-247,253. https://doi.org/10.19678/j.issn.1000-3428.0062846
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在无人驾驶应用场景中,现有无锚框实例分割方法存在大目标特征覆盖小目标特征、缺少两阶段检测器中的感兴趣区域对齐操作、忽略类别分支对掩膜分支提供的位置和空间信息等问题,导致特征提取不充分且无法准确获取目标区域。提出一种改进的无锚框实例分割方法。结合可变形卷积,设计编码-解码特征提取网络提取高分辨率特征,以增强对小目标特征的提取能力,并采用空洞卷积和合并连接的方式,在不增加计算量的前提下有效融合多种分辨率的特征。在此基础上,将注意力机制引入到类别分支中,同时设计结合空间信息和通道信息的信息增强模块,以提高目标检测能力。实验结果表明,该方法在COCO 2017和Cityscapes数据集上平均精度和平均交并比分别为41.1%和83.3%,相比Mask R-CNN、SOLO、Yolact等方法,能够有效改进实例分割效果并具有较优的鲁棒性。
  • 茹妞妞, 于晋伟, 杨卫华, 卞玮
    计算机工程. 2022, 48(9): 248-253. https://doi.org/10.19678/j.issn.1000-3428.0062586
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    视频插值是利用视频相邻帧的图像信息合成中间帧,可直接应用于慢动作视频回放、高频视频合成、动画制作等领域。现有基于深度体素流的视频插值模型存在合成精度低、参数量大的问题,限制其在移动端的部署应用。提出一种压缩驱动的精化深度体素流插值模型。通过预训练深度体素流模型提高视频的插值质量并确定高精度参数,利用稀疏压缩技术裁剪卷积通道数,以减少参数量并得到粗体素流,同时将输入视频帧、粗体素流和粗中间帧作为精体素流网络的输入,获得精体素流。在此基础上,通过三线性插值方法计算得到精中间帧,以增强模型对边缘信息的捕获能力,从而提高中间帧质量。在Vimeo 90K和UCF101数据集上的实验结果表明,相比DVF、SepConv、CDFI等模型,该模型的峰值信噪比和结构相似性分别平均提高1.59 dB和0.015,在保证参数量增幅较小的前提下,能够有效优化视频合成效果。
  • 开发研究与工程应用
  • 陈先来, 贾一珍, 安莹, 唐红英
    计算机工程. 2022, 48(9): 254-261. https://doi.org/10.19678/j.issn.1000-3428.0062650
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    胃癌的早期发现对于降低死亡率、提高患者生存质量具有重要意义。现有预测模型通过单一的结构化电子健康记录数据预测患者的癌症患病风险,但是无法有效地整合不同类型的临床数据且不能满足实际的临床需求。提出一种基于多类型异构数据融合的胃癌风险预测模型。利用预训练语言模型提取电子健康记录数据中的入院记录文本信息,采用降噪自动编码器提取实验室检验数据的特征,同时对低维度的结构化数据向量表示的维度进行扩增,以避免低维度的实验检验特征表示被高维度特征淹没。在此基础上,将扩增后的结构化数据向量与高维度的文本表示向量在相同的尺度上进行融合,从而预测患者的患病风险。实验结果表明,该模型的准确率可达到0.949 337,相比支持向量机、逻辑回归、朴素贝叶斯等模型,具有较优的预测性能。
  • 李海林, 夏燕燕, 邹金串
    计算机工程. 2022, 48(9): 262-268. https://doi.org/10.19678/j.issn.1000-3428.0062522
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    心肺运动试验(CPET)能将人体的呼吸系统、心血管系统等综合为一体,不仅能够体现受试者的有氧运动能力,评估受试者的心肺耐力,而且能以整体整合医学的视角来研究受试者对运动的应激反应。为对CPET数据进行凝聚层次聚类分析,提出一种基于时间序列形态特征的算法。选取15名业余中长跑运动员的CPET数据作为聚类对象,聚类指标选取了表征有氧能力和心肺耐量的耗氧量、二氧化碳、心率、分钟通气当量、代谢当量、生理死腔与潮气量比值、呼吸商及每搏输出量等8类指标,体现运动员摄取、利用氧的效率、肺循环以及心功能等综合状况。通过聚类分析发现受试者个体差异较大,未出现明显的“群居分布”特征,根据轮廓系数评估可剔除心肺耐量较差的测试者。实验结果表明,该算法在确保聚类准确率的同时能够降低数据压缩率,且对形态特征显著的数据集进行聚类效果更佳。
  • 曾雷鸣, 侯进, 陈子锐, 周浩然
    计算机工程. 2022, 48(9): 269-276,285. https://doi.org/10.19678/j.issn.1000-3428.0062671
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现有网络在检测高分辨率交通标志图片时速度过慢、精确度较低等问题,提出一种轻量化交通标志检测网络。在MobileNetv3-Large基础上对YOLOv4网络的骨干部分进行优化,针对数据集的特点舍弃部分耗时层,更改第8层和第14层的输出通道数,并改进基础模块中通道域注意力网络的注意力机制,使输出的权重数值能更准确地表征特征的重要程度。在检测头前加入基于弱语义分割的动态增强附件,利用其输出作为空间权重分布来矫正激活区域,以避免提取能力下降导致误检、漏检问题,最终构成YOLOv4-SLite网络。采用滑窗剪裁的方法对高分辨率图片进行训练和预测,从而减少训练时间及增加样本的多样性。在TT100K交通标志数据集上的实验结果表明,相较于YOLOv4基准网络,YOLOv4-SLite网络的mAP@0.5仅下降了0.2%,但模型大小减少了96.5%,响应速度提升了227%,精确度与速度的平衡效果达到了预期。
  • 赵国川, 王姮, 张华, 庞杰, 周建
    计算机工程. 2022, 48(9): 277-285. https://doi.org/10.19678/j.issn.1000-3428.0062577
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    水电枢纽在长期运行过程中容易受水流侵蚀、应力变化等因素影响,导致形成裂缝、渗漏、脱落、露筋等缺陷,造成重大安全隐患。目前,水电枢纽缺陷识别主要依靠人工巡检,存在效率低、风险高等问题。提出一种水电枢纽缺陷识别方法,基于完全自注意力机制构建缺陷识别网络,以提高网络捕捉长距离全局信息的能力和缺陷识别精度。设计2个同尺寸的自注意力编码器分支,通过双分支结构完成不同尺度自注意力计算,从而提取多尺度缺陷特征,增强全局语义表达能力。构建一个基于类别向量的自注意力混合融合模块,并对2条分支的多尺度特征进行融合,以有效应对水电枢纽缺陷图像尺度变化大、形态多样等问题。在四川某水电站枢纽缺陷数据集上的实验结果表明,该方法宏查准率可达98.87%,缺陷识别效果优于SVM、ResNet-50、MobileNet v3等方法。
  • 廖雪超, 伍杰平, 陈才圣
    计算机工程. 2022, 48(9): 286-297,304. https://doi.org/10.19678/j.issn.1000-3428.0062059
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    风力发电预测在电力系统的运行中发挥着重要作用。现有风电功率的短期预测模型因风速的复杂性和随机性,难以确定风速与风电功率的非线性映射关系,导致预测精度降低。提出一种结合变分模态分解、双阶段注意力机制、误差修正模块与深度学习算法的短期风电功率预测模型。通过对原始数据进行互信息特征选择,获得与风电功率相关性较强的特征,并对其进行信号预处理,利用变分模态分解对多维特征序列进行分解,得到具有一定中心频率的模态分量,以降低各个特征序列的复杂性和非平稳性。采用基于双阶段注意力机制与编解码架构的长短时记忆(LSTM)神经网络对模态分量进行训练与预测,得到初始预测误差。在此基础上,利用误差修正模块对初始预测误差进行变分模态分解和修正,从而提高模型的预测精度。实验结果表明,与自回归移动平均模型、标准编解码结构的LSTM模型相比,该预测模型的平均绝对误差最高可降低约87%,具有较优的预测性能。
  • 吴仍裕, 周强, 于海龙, 王亚沙
    计算机工程. 2022, 48(9): 298-304. https://doi.org/10.19678/j.issn.1000-3428.0061931
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在院前急救领域中,急救反应时间是指患者拨打急救电话后,急救车到达现场的时间。传统急救车调度算法未全面考虑急救环境的动态性和复杂性因素,导致模型优化的急救反应时间与实际情况存在偏差。将急救车调度问题建模成马尔科夫决策过程,构建基于深度强化学习的急救车调度算法。以多层感知机作为评分网络结构,通过将急救站的动态信息映射为各个急救站的得分,确定急救车被调往各急救站的概率。同时,结合急救车调度的动态决策特点,利用强化学习中演员-评论家框架下的近端策略优化算法改进评分网络参数。在深圳市急救中心真实急救数据集上的实验结果表明,相比Fixed、DSM、MEXCLP等算法,该算法在每个急救事件中的急救反应时间平均缩短约80 s,并且在10 min内急救车的平均到达比例为36.5%,能够实时地将急救车调度到合适的急救站。
  • 周海赟, 项学智, 王馨遥, 任文凯
    计算机工程. 2022, 48(9): 305-313. https://doi.org/10.19678/j.issn.1000-3428.0062296
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    目标检测、特征提取与数据关联作为多目标跟踪网络中重要的组件,独立或部分联合地发挥作用,这种组件分离的方法虽取得了良好的跟踪效果,但增加了跟踪网络的复杂性,影响了跟踪速度。为提升行人多目标跟踪速度及维持跟踪精度,提出一种端到端链式行人多目标跟踪网络。将目标检测、特征提取与数据关联集成到一个统一的框架中,将连续2帧图片组成一个节点作为输入,直接回归出节点之间相同目标的成对边界框,利用相邻节点之间公共帧的强相似性,仅使用交并比匹配进行数据关联,以提高跟踪速度。使用多特征融合的双向特征金字塔,并在金字塔网络中引用改进可变形卷积,提高模型对目标形变的适应性。为解决正负样本不平衡及梯度贡献的差异,将focal loss与BalancedL1 Loss组成多任务学习损失函数以促进网络的均衡学习。在MOT17数据集上的实验结果表明,与DeepSORT、TubeTK、CenterTrack等网络相比,该网络可有效实现跟踪速度与精度的平衡,多目标跟踪精度为69.6,跟踪速度保持为21.6 frame/s。
  • 黄奕秋, 胡晓, 杨佳信, 欧嘉敏
    计算机工程. 2022, 48(9): 314-320. https://doi.org/10.19678/j.issn.1000-3428.0062606
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对图像背景噪声、透视畸变等影响人群计数网络计数精度的问题,提出一种基于背景抑制与上下文感知的新网络。利用VGG-16网络提取图像特征,并分别将特征输入密度图生成模块和背景噪声抑制(BNS)模块中进行处理,生成密度特征图和空间注意力图。使用BNS模块优化密度特征图并生成初级密度图,以抑制图像中背景噪声干扰,提高人群区域的特征权重。为减少透视畸变对人群密度估计的影响,使用上下文感知增强网络优化初级密度图,并生成预测密度图。在ShanghaiTech、UCF-CC-50及UCF-QNRF 3个公开数据集上的实验结果表明,该网络相较于MCNN、SwitchCNN、CSRNet等网络的计算准确度较高,尤其在UCF-QNRF数据集上其平均绝对误差和均方误差分别为85.8、146.0,相较于其他网络最高分别下降69.0%和67.2%,能充分抑制图像背景噪声并有效减小透视畸变引起的误差,具有良好的泛化能力和较强的鲁棒性。