计算机工程

Select

热点与综述

基于深度学习的自然场景文本检测综述

连哲, 殷雁君, 云飞, 智敏

计算机工程. 2024, 50(3): 16-27. https://doi.org/10.19678/j.issn.1000-3428.0067427

摘要 (372) PDF全文 (499) HTML (48)

可视化

基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向，不仅具有广泛的应用前景，而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先，介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着，分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类，阐述4类经典和主流方法的基本思路和主要算法流程，归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置，明确不同方法之间的关联关系。然后，介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后，指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。

Select

网络空间安全

非独立同分布场景下的联邦学习优化方法

宋华伟, 李升起, 万方杰, 卫玉萍

计算机工程. 2024, 50(3): 166-172. https://doi.org/10.19678/j.issn.1000-3428.0067791

摘要 (318) PDF全文 (312) HTML (22)

可视化

联邦学习能够在不泄露数据隐私的情况下合作训练全局模型，但这种协作式的训练方式在现实环境下面临参与方数据非独立同分布（Non-IID）的挑战：模型收敛慢、精度降低的问题。许多现有的联邦学习方法仅从全局模型聚合和本地客户端更新中的一个角度进行改进，难免会引发另一角度带来的影响，降低全局模型的质量。提出一种分层持续学习的联邦学习优化方法（FedMas）。FedMas基于分层融合的思想，首先，采用客户端分层策略，利用DBSCAN算法将相似数据分布的客户端划分到不同的层中，每次仅挑选某个层的部分客户端进行训练，避免服务器端全局模型聚合时因数据分布不同产生的权重分歧现象；进一步，由于每个层的数据分布不同，客户端在局部更新时结合持续学习灾难性遗忘的解决方案，有效地融合不同层客户端数据间的差异性，从而保证全局模型的性能。在MNIST和CIFAR-10标准数据集上的实验结果表明，FedMas与FedProx、Scaffold和FedCurv联邦学习算法相比，全局模型测试准确率平均提高0.3~2.2个百分点。

Select

图形图像处理

面向拥挤行人检测的改进YOLOv7算法

徐芳芯, 樊嵘, 马小陆

计算机工程. 2024, 50(3): 250-258. https://doi.org/10.19678/j.issn.1000-3428.0067741

摘要 (201) PDF全文 (309) HTML (24)

可视化

针对拥挤行人检测场景下检测算法容易产生漏检与误检的问题，提出一种改进的YOLOv7拥挤行人检测算法。在骨干网络中引入BiFormer视觉变换器和改进的高效层聚合网络(RC-ELAN)模块，通过自注意力机制与注意力模块使骨干网络更多聚焦于被遮挡行人的重要特征，有效缓解了目标特征缺失对检测造成的负面影响。采用基于双向特征金字塔网络思想的改进颈部网络，通过转置卷积和改进的Rep-ELAN-W模块使模型可以高效利用中低维特征图中的小目标特征信息，有效提升了模型的小目标行人检测性能。引入高效的完全交并比损失函数，使模型可以进一步收敛至更高精度。在含有大量小目标遮挡行人的WiderPerson数据集上的实验结果表明，与YOLOv7、YOLOv5、YOLOX算法相比，改进的YOLOv7算法的交并比阈值分别取0.5和0.5~0.95时的平均精准度提升了2.5和2.8、9.9和7.1、12.3和10.7个百分点，可较好地应用于拥挤行人检测场景。

Select

图形图像处理

基于深度估计置信度的聚焦形貌恢复

史艳琼, 查昭, 张文亮, 戴尔愉, 陈中

计算机工程. 2024, 50(3): 233-241. https://doi.org/10.19678/j.issn.1000-3428.0067143

摘要 (132) PDF全文 (221) HTML (9)

可视化

聚焦形貌恢复是非接触式三维重建领域中的重要技术手段。由于环境的影响和相机本身的限制，图像采集过程中会不可避免地产生噪声信息，影响重建精度。针对该问题，提出一种高精度、抗噪声的聚焦形貌恢复算法。使用聚焦评价函数对离焦序列图像进行评价，得到聚焦评价序列图像，并使用高斯拟合峰值法定位像素聚焦位置获得初始深度图。在此基础上，通过像素的聚焦评价曲线与灰度曲线之间的相似度衡量深度估计置信度，生成初始深度图的置信图，并将置信图作为引导图对初始深度图进行引导滤波，得到优化后的深度图。使用多组仿真离焦序列图像与真实显微离焦序列图像对所提方法进行性能验证, 实验结果表明：所提方法在仿真与真实离焦序列中均能表现出优良的三维重建效果，在真实数据实验中，所提方法的所有指标均优于基于深度图优化的方法，与传统方法相比均方根误差分别降低64.8%和47.3%以上，相关系数分别提高2.18%和6.35%以上，具有更高的精度和更强的抗噪性，能有效提高聚焦形貌恢复精度。

Select

开发研究与工程应用

基于注意力机制的人体关键点隐式建模网络

赵佳圆, 张玉茹, 苏晓东, 徐红岩, 李世洲, 张玉荣

计算机工程. 2024, 50(3): 317-325. https://doi.org/10.19678/j.issn.1000-3428.0067134

摘要 (134) PDF全文 (222) HTML (10)

可视化

人体姿态估计任务需要利用视觉线索和关节间的解剖关系来定位关键点，但基于卷积神经网络的方法难以关注远程上下文线索和建模远距离关节之间的依赖关系。为此，提出一种基于注意力机制的隐式建模方法，通过多阶段迭代计算关节之间的特征相关性来隐式建模关键点间的约束关系，消除卷积神经网络的局部操作，扩大网络的感受野，建模远距离关节之间的依赖关系。为了解决网络在训练过程中可能弱化不可见关键点的问题，采用焦点损失函数，使网络更关注于复杂的关键点。使用目前精度最高的特征提取高分辨率网络（HRNet）和经典特征提取残差网络（ResNet）作为主干网络进行实验，结果表明，在同等实验条件下，隐式建模方法可以提高人体姿态估计网络的性能，在MPII和MSCOCO人体姿态估计基准数据集上，以HRNet网络为主干网络的算法相较于原网络，精度分别提升了1.7%和2.6%。

Select

热点与综述

基于改进Informer的云计算资源负载预测

李浩阳, 贺小伟, 王宾, 吴昊, 尤琪

计算机工程. 2024, 50(2): 43-50. https://doi.org/10.19678/j.issn.1000-3428.0066399

摘要 (377) PDF全文 (342) HTML (18)

可视化

负载预测是云计算资源管理中的重要组成部分，准确预测云资源的使用情况可提高云平台性能及防止资源浪费，然而云计算资源使用的动态性和不确定性使得负载预测较为困难，尽管Informer在时序预测领域取得了较好的效果，但未对时间的因果依赖关系加以限制造成未来信息泄露，也未考虑网络深度的增加导致模型性能下降的问题。为解决上述问题，提出一种基于改进Informer的多步负载预测模型(Informer-DCR)。将编码器中各注意力块之间的正则卷积替换为扩张因果卷积，使深层网络中的高层能够接收更大范围的输入信息来提高模型预测精度，并保证时序预测过程的因果性。在编码器中添加残差连接，使网络中低层的输入信息直接传到后续的高层，解决了深层网络退化问题。实验结果表明，Informer-DCR模型在不同预测步长下的平均绝对误差比Informer、时间卷积网络等主流预测模型降低了8.4%~40.0%，并且在训练过程中表现出比Informer更好的收敛性。

Select

热点与综述

基于AVX512的格密码高速并行实现

雷斗威, 何德彪, 罗敏, 彭聪

计算机工程. 2024, 50(2): 15-24. https://doi.org/10.19678/j.issn.1000-3428.0067167

摘要 (135) PDF全文 (293) HTML (11)

可视化

量子计算的迅速发展可能对当前广泛使用的公钥密码算法造成严重威胁。格密码因优秀的抗量子安全性和高效的计算效率在后量子密码中占据重要地位。美国国家标准技术研究院于2022年5月公布4个后量子密码标准，其中3个是格密码算法，Kyber算法便是其中之一。随着后量子密码标准的确定，Kyber算法高效实现的需求日益增加。基于512位高级向量扩展（AVX512），对Kyber算法进行优化与高速并行实现。使用惰性模约减、优化的蒙哥马利模约减及优化的快速数论变化等技术，充分利用计算机的存储空间，减少大量不必要的模约减操作，提高多项式计算的效率与并行性。采用冗余比特技术，增强多项式抽样过程中比特的并行处理能力。通过AVX512的512 bit位宽和8路并行实现哈希运算，并对其产生的伪随机比特串进行合理调度，充分发挥并行性能。基于AVX512指令集高速并行实现Kyber上的多项式计算和抽样，并进一步实现整个Kyber公钥加密方案。性能测试结果表明，与C语言实现相比，基于AVX512实现的密钥生成和加密算法获得了10~16倍的加速，解密算法获得了约56倍的加速。

Select

热点与综述

Kubeflow异构算力调度策略研究

孙毅, 王会梅, 鲜明, 向航

计算机工程. 2024, 50(2): 25-32. https://doi.org/10.19678/j.issn.1000-3428.0067396

摘要 (159) PDF全文 (276) HTML (7)

可视化

Kubeflow将机器学习和云计算技术两个技术领域相结合，集成了大量的机器学习工具，为生产级的机器学习平台落地提供了可行方案。机器学习通常依托图形处理器（GPU）等专用处理器来提高训练和推理速度，随着云计算集群规模的动态调整，不同计算架构的云计算节点可以灵活地加入/退出集群，传统的轮询调度策略已无法满足动态调整下的异构算力资源调度。为解决Kubeflow平台异构算力的分配优化问题，提高平台资源利用率，实现负载均衡，提出一种基于云的图形处理器-中央处理器（CPU-GPU）异构算力调度策略，采用量化后的负载均衡度和优先级两个判断指标，细颗粒度化显存分配，将计算资源挂载给对应的Pod以实现算力资源的细颗粒度调度。根据集群各节点算力资源设计资源权重矩阵，利用改进的遗传算法获取Pod的最优部署方案，保证多个任务的执行。实验结果表明，该调度策略对并行任务支持效果较好，且在资源请求溢出的情况下，能够按照优先级调度执行并实现最优的负载，与平台原生策略相比，资源细化程度提升了一个数量级，集群负载均衡也有较为显著的提升。

Select

热点与综述

面向安全传输的低能耗无人机轨迹优化算法

吴嘉鑫, 孙一飞, 吴亚兰, 武继刚

计算机工程. 2024, 50(2): 59-67. https://doi.org/10.19678/j.issn.1000-3428.0066761

摘要 (128) PDF全文 (292) HTML (9)

可视化

无人机凭借其灵活的机动性以及高数据传输速率，被广泛应用于大范围离散节点的数据采集工作，其机载能量的有限性也使得无人机能耗优化成为当前研究热点。然而，当环境中存在窃听节点时，如何在保障多个离散数据节点数据安全传输前提下优化无人机的能量消耗具有一定的挑战性。基于此，引入中继节点和安全容量，提出面向安全传输的低能耗无人机轨迹优化算法，力求从物理层面保障数据的安全传输。对无人机与地面节点的信道模型、无人机与数据节点之间的安全容量以及无人机飞行通信能耗进行建模。将问题形式化描述为以最小化无人机能耗为目标、数据节点与无人机之间的数据安全传输为主要约束的非确定性多项式难解优化问题。为解决该问题，对问题进行子问题分解，采用自组织映射方法以及定制的粒子群算法分别对无人机访问数据节点的最优次序以及在数据节点周边悬停的最佳位置进行求解，并根据现有工作提出3种基准方案进行性能对比。仿真实验结果表明，当中继节点的能量收集电路最大输出功率变化时，所提的优化算法在降低无人机总能耗方面相比BASE_D、BASE_M、BASE_R 3种基准方案分别平均提高7.25%、8.59%、11.57%。此外，在安全容量实现率方面，所提算法的性能均优于对比方案，例如，当安全容量阈值从0.001~0.500变化时，所提算法相比基准方案BASE_M平均提高23.45%。

Select

网络空间安全

基于Transformer和GAN的对抗样本生成算法

刘帅威, 李智, 王国美, 张丽

计算机工程. 2024, 50(2): 180-187. https://doi.org/10.19678/j.issn.1000-3428.0067077

摘要 (509) PDF全文 (439) HTML (22)

可视化

对抗攻击与防御是计算机安全领域的一个热门研究方向。针对现有基于梯度的对抗样本生成方法可视质量差、基于优化的方法生成效率低的问题，提出基于Transformer和生成对抗网络（GAN）的对抗样本生成算法Trans-GAN。首先利用Transformer强大的视觉表征能力，将其作为重构网络，用于接收干净图像并生成攻击噪声；其次将Transformer重构网络作为生成器，与基于深度卷积网络的鉴别器相结合组成GAN网络架构，提高生成图像的真实性并保证训练的稳定性，同时提出改进的注意力机制Targeted Self-Attention，在训练网络时引入目标标签作为先验知识，指导网络模型学习生成具有特定攻击目标的对抗扰动；最后利用跳转连接将对抗噪声施加在干净样本上，形成对抗样本，攻击目标分类网络。实验结果表明：Trans-GAN算法针对MNIST数据集中2种模型的攻击成功率都达到99.9%以上，针对CIFAR10数据集中2种模型的攻击成功率分别达到96.36%和98.47%，优于目前先进的基于生成式的对抗样本生成方法；相比快速梯度符号法和投影梯度下降法，Trans-GAN算法生成的对抗噪声扰动量更小，形成的对抗样本更加自然，满足人类视觉不易分辨的要求。

Select

图形图像处理

基于感知增强Swin Transformer的遥感图像检测

祝冰艳, 陈志华, 盛斌

计算机工程. 2024, 50(1): 216-223. https://doi.org/10.19678/j.issn.1000-3428.0066941

摘要 (594) PDF全文 (734) HTML (47)

可视化

随着遥感技术的快速发展，遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点，如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本不平衡、目标尺度小等问题，提出一种基于感知增强Swin Transformer的遥感图像检测网络，以提升遥感图像检测性能。在主干网络设计过程中，利用Swin Transformer分层设计和移动窗口的优点有效减小计算复杂度，同时插入空间局部感知块，加强网络对局部相关性和结构信息的提取能力。设计区域分布回归损失为小目标分配更大的权重，解决了正负样本不平衡的问题，同时结合改进的IoU-aware分类损失消除不同分支之间的差距，降低分类和回归损失。在公共遥感数据集DOTA上的多组实验结果表明，该网络获得了78.47%的平均精度均值和10.8帧/s的检测速度，检测性能优于经典的目标检测网络Faster R-CNN、Mask R-CNN以及现有优秀的遥感图像检测网络，并且在各类不同尺度的目标上均具有较好的性能表现。

Select

人工智能与模式识别

基于多模态融合的图神经网络推荐算法

吴志强, 解庆, 李琳, 刘永坚

计算机工程. 2024, 50(1): 91-100. https://doi.org/10.19678/j.issn.1000-3428.0066929

摘要 (762) PDF全文 (830) HTML (64)

可视化

已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练，学习用户-项目节点的高阶联系去丰富节点表示，但忽略了用户对不同模态信息的偏好，没有利用项目的图片、文本等模态信息，或对于不同模态特征的融合简单相加，不能区分用户对不同模态信息的偏好。针对上述问题，提出多模态融合的GNN推荐模型。首先针对单个模态，结合用户-项目交互二部图构建单模态图网络，在单模态图中学习用户对此模态信息的偏好；然后利用GAT聚合邻居信息，丰富本节点表示，同时根据门控循环单元决定是否聚合邻居信息，达到去噪效果；最后将各个模态图学习到的用户、项目表示通过注意力机制融合得到最终表示并送入预测模块。在MovieLens-20M、H&M两个数据集上的实验结果表明：多模态信息、注意力融合机制能有效提升推荐的准确度，算法模型在Precision@K、Recall@K和NDCG@K 3个指标上相较于基线最优算法均有显著提升；当评估指标K值选取10时，Precision@10、Recall@10和NDCG@10在两个数据集上分别提升了4.67%、2.42%、2.03%和2.49%、5.24%、2.05%。

Select

热点与综述

基于Fabric的海量交易数据上链预处理机制

刘颖, 马玉鹏, 赵凡, 王轶, 蒋同海

计算机工程. 2024, 50(1): 39-49. https://doi.org/10.19678/j.issn.1000-3428.0067004

摘要 (217) PDF全文 (292) HTML (14)

可视化

Hyperledger Fabric是一种国内外广泛使用的联盟链框架，在基于Fabric技术的一些业务中具有协同组织众多、交易操作频繁、事务冲突增加等特点。Fabric采用的多版本并发控制技术能够在一定程度上解决部分交易冲突，提升系统并发性，但其机制不完善，会出现部分交易数据无法正常上链存储的问题。为了实现海量交易数据完整、高效、可信的上链存储，提出一种基于Fabric预言机的数据上链预处理机制。设计海量数据冲突预处理(MCPP)方法，通过检测、监听、延时提交、事务加锁、重排序缓存等方式实现主键冲突交易数据的完整上链。引入数据传输保障措施，在传输过程中利用非对称加密技术防止恶意节点伪造认证信息，确保交易数据链外处理前后的一致性。通过理论分析和实验结果表明，该机制可有效解决联盟链平台中海量交易数据上链时的并发冲突问题，当交易数据规模达到1 000和10 000时，MCPP的时效性比LMLS提高了38%和21.4%，且成功率接近100%，具有高效性和安全性，同时在无并发冲突情况下不影响Fabric系统性能。

Select

图形图像处理

大田环境下的农业害虫图像小目标检测算法

蒋心璐, 陈天恩, 王聪, 赵春江

计算机工程. 2024, 50(1): 232-241. https://doi.org/10.19678/j.issn.1000-3428.0067030

摘要 (360) PDF全文 (602) HTML (25)

可视化

智能化害虫检测是目标检测技术在农业领域的重要应用，可以有效提高害虫测报工作效率和可靠性，保障农作物产量和质量。在诱虫灯、粘虫板等固定式诱捕装置下，图像背景简单、光照条件稳定、害虫特征显著易于提取，害虫检测可以达到较高的准确率，但其应用场景固定，检测范围局限于设备周围，无法适应复杂的田间环境。针对田间环境下图像背景复杂和害虫尺寸小带来的难检和漏检问题，提出一种改进YOLOv5的小目标害虫检测算法Pest-YOLOv5，以提高害虫测报的灵活性。在特征提取网络中增加坐标注意力机制，通过结合空间和通道信息，增强对小目标害虫特征的提取能力，在颈部连接部分使用双向特征金字塔网络结构，通过融合多尺度特征，缓解多次卷积带来的小目标信息丢失问题。在此基础上，使用SIoU和变焦损失函数计算损失值，同时通过实验得到最优分类损失权重系数，使模型更关注分类困难的目标样本。在公开数据集AgriPest上的实验结果表明，Pest-YOLOv5模型mAP_0.5和召回率分别为70.4%和67.8%，优于原YOLOv5s模型、SSD和Faster R-CNN等经典目标检测模型。与YOLOv5s模型相比，Pest-YOLOv5模型将mAP_0.5、mAP_0.50:0.95和召回率分别提高8.1%、7.9%和12.8%，改善了难检和漏检情况。

Select

热点与综述

健壮且自适应的学习型近似查询处理方法研究

乔艺萌, 荆一楠, 张寒冰

计算机工程. 2024, 50(1): 30-38. https://doi.org/10.19678/j.issn.1000-3428.0066743

摘要 (166) PDF全文 (325) HTML (13)

可视化

由于在大规模数据集上执行精确查询耗时较长，因此近似查询处理（AQP）技术常被用于在线分析处理，目的是以较短的交互延迟返回查询结果，并尽可能地降低查询误差。现有的学习型AQP方法与底层数据解耦，将I/O密集型计算转化为CPU密集型计算，但是由于计算资源的限制，该类方法通常基于随机的数据样本进行模型训练，此类训练数据会引起稀有群组缺失问题，导致模型预测准确性不高。针对上述问题，提出一种基于分层样本学习的混合型和积网络模型，并基于该模型设计一种AQP框架。分层样本能够有效避免稀有群组缺失现象，基于该样本训练的模型预测准确性大幅提升。此外，针对数据动态更新的情况，提出一种模型自适应更新策略，使得模型能够及时检测数据偏移现象并自适应地执行更新。实验结果表明，与基于抽样和基于机器学习的AQP方法相比，该模型在真实数据集和合成数据集上的平均相对误差分别约降低18.3%和2.2%，在数据动态更新的场景下，其准确性和查询时延均呈现出良好的稳定性。

Select

计算机系统前沿技术

面向E级超算系统的众核片上存储层次研究

方燕飞, 刘齐, 董恩铭, 李雁冰, 过锋, 王谛, 何王全, 漆锋滨

计算机工程. 2023, 49(12): 10-24. https://doi.org/10.19678/j.issn.1000-3428.0066548

摘要 (309) PDF全文 (567) HTML (49)

可视化

当前众核已成为构建高性能计算（HPC）超级计算机的主流微处理器架构，为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加，众多核心对存储资源竞争愈加激烈，“访存墙”问题越来越突出。众核片上存储层次是缓解“访存墙”问题并帮助HPC应用更好地发挥众核处理器的计算优势以提升实际应用性能的重要结构。众核片上存储层次的设计对众核片上系统性能、功耗和面积具有重要影响，是众核结构设计中的重要环节，也是业界的研究热点。由于众核芯片发展历史和片上微体系结构设计技术的不同，以及所面向的应用领域需求不同等原因，目前的HPC主流众核片上存储层次结构并不单一，但从横向比较和各处理器自身纵向发展趋势，以及从HPC与数据科学、机器学习不断融合发展带来的应用需求变化来看，SPM+Cache的混合结构最可能成为今后HPC E级超算系统众核处理器片上存储层次设计的主流选择。在面向E级计算的软件和算法层面，开展针对众核存储层次特点的设计与优化，可以帮助HPC应用更好地发挥众核处理器的计算优势，从而有效提升实际应用性能，因此面向众核片上存储层次特点的软件及算法设计与优化技术也是业界的研究热点之一。首先按照不同的组织方式将片上存储层次分为多级Cache结构、SPM结构和SPM+Cache混合结构，并总结分析3种结构的优缺点。然后分析国际主流GPU、同构众核、国产众核等面向主流E级超算系统的众核处理器片上存储层次设计现状与发展趋势。最后从众核LLC管理与缓存一致性协议、SPM空间管理与数据移动优化、SPM+Cache混合结构的全局视角优化等角度综述国际上的存储层次设计与优化相关软硬件技术的研究现状。在此基础上，从软硬件及算法设计等不同角度展望了片上存储层次的未来研究方向。

Select

人工智能与模式识别

基于改进DQN算法的机器人路径规划

李奇儒, 耿霞

计算机工程. 2023, 49(12): 111-120. https://doi.org/10.19678/j.issn.1000-3428.0066348

摘要 (632) PDF全文 (704) HTML (45)

可视化

传统深度Q网络（DQN）算法通过融合深度神经网络和强化学习方法，解决了Q-learning算法在应对复杂环境时出现的维数灾难问题，被广泛应用于移动机器人的路径规划，但传统DQN算法的网络收敛速度较慢，路径规划效果较差，难以在较少的训练回合内获取最优路径。为了解决上述问题，提出一种改进的ERDQN算法。通过记录重复状态出现的频率，利用该频率重新计算Q值，使得在网络训练的过程中一种状态重复出现的次数越多，下一次出现该状态的概率越低，从而提高机器人对环境的探索能力，在一定程度上降低了网络收敛于局部最优的风险，减少了网络收敛的训练回合。根据机器人移动方向和机器人与目标点的距离，重新设计奖励函数。机器人在靠近目标点时能够获得正奖励，远离目标点时能够获得负奖励，并通过当前机器人的移动方向和机器人与目标点的距离调整奖励的绝对值，从而使机器人能够在避开障碍物的前提下规划出更优路径。实验结果表明，与DQN算法相比，ERDQN算法的平均得分提高了18.9%，规划出的路径长度和回合数减少了约20.1%和500。上述结果证明了ERDQN算法能够有效提高网络收敛速度及路径规划性能。

Select

计算机系统前沿技术

基于FPGA的Izhikevich神经元定制计算方法

叶钧超, 徐聪, 黄尧, 柴志雷

计算机工程. 2023, 49(12): 35-45. https://doi.org/10.19678/j.issn.1000-3428.0066260

摘要 (200) PDF全文 (437) HTML (18)

可视化

脉冲神经网络作为第三代神经网络，其工作机理与生物大脑更接近，层内连接与反向连接的复杂拓扑结构具有解决复杂问题的潜力。神经元和突触是脉冲神经网络中最基本的计算单元，相比于带泄露积分触发神经元模型，Izhikevich神经元模型能通过模拟出更多的生物脉冲现象来支持更广泛的类脑仿真计算，但Izhikevich神经元模型的计算复杂度更高，基于其搭建的脉冲神经网络存在低性能、高功耗的问题。提出一种基于FPGA的Izhikevich神经元定制计算方法。首先，通过研究脉冲神经网络中Izhikevich神经元各参数的取值范围以及平衡膜电位的相对误差与资源消耗，设计一套混合精度的定点化方案；其次，针对单个神经元，通过平衡神经元更新计算方程的数据路径实现最小化流水；再次，针对整体脉冲神经网络，设计并行度可扩展的计算架构以适应不同规模的FPGA平台；最后，把该定制计算方法用于经典的NEST仿真器加速。实验结果表明，相比于i7-10700 CPU，经典的丘脑外侧膝状核网络模型和液体状态机模型在ZCU102上的性能平均提升2.26和3.02倍，能效比平均提升8.06和10.8倍。

Select

计算机系统前沿技术

混合精度频域卷积神经网络FPGA加速器设计

陈逸, 刘博生, 徐永祺, 武继刚

计算机工程. 2023, 49(12): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0066701

摘要 (200) PDF全文 (384) HTML (49)

可视化

深度卷积神经网络具有模型大、计算复杂度高的特点，难以部署到硬件资源有限的现场可编程门阵列（FPGA）中。混合精度卷积神经网络可在模型大小和准确率之间做出权衡，从而为降低模型内存占用提供有效方案。快速傅里叶变换作为一种快速算法，可将传统空间域卷积神经网络变换至频域，从而有效降低模型计算复杂度。提出一个基于FPGA的8 bit和16 bit混合精度频域卷积神经网络加速器设计。该加速器支持8 bit和16 bit频域卷积的动态配置，并可将8 bit频域乘法运算打包以复用DSP，用来提升计算性能。首先设计一个基于DSP的频域计算单元，支持8 bit和16 bit频域卷积运算，通过打包一对8 bit频域乘法以复用DSP，从而提升吞吐率。然后提出一个映射数据流，该数据流支持8 bit和16 bit计算两种形式，通过数据重用方式最大化减少冗余数据处理和数据搬运操作。最后使用ImageNet数据集，基于ResNet-18与VGG16模型对所设计的加速器进行评估。实验结果表明，该加速器的能效比（GOP与能耗的比值）在ResNet-18和VGG16模型上分别达到29.74和56.73，较频域FPGA加速器提升1.2~6.0倍。

Select

图形图像处理

基于CGS-Ghost YOLO的交通标志检测研究

赵宏, 冯宇博

计算机工程. 2023, 49(12): 194-204. https://doi.org/10.19678/j.issn.1000-3428.0066520

摘要 (245) PDF全文 (386) HTML (19)

可视化

在交通标志检测任务中，YOLOv5检测算法在复杂的环境和路况下存在漏检、错检及模型参数量过大等问题。为此，提出一种改进的CGS-Ghost YOLO检测模型。YOLOv5在图片输入后使用Focus模块进行下采样，增加较多参数，CGS-Ghost YOLO模型使用StemBlock模块替换Focus模块进行采样，能够在维持精度的同时减少参数，并通过引入坐标注意力机制，强化特征中的语义信息和位置信息，提高模型的特征提取能力。设计SMU激活函数与组归一化相结合的CGS卷积模块，避免训练过程中Batch Size大小对模型所造成的影响，在使用GhostConv减少模型参数的同时，提升模型的检测精度。在此基础上，通过$ \alpha $-CIoU Loss+VFocal Loss损失函数，改善交通标志检测任务中正负样本不平衡的问题，提升模型整体性能，Neck部分使用Bi-FPN双向特征金字塔网络，实现检测目标多尺度特征的有效融合。实验结果表明，改进的CGS-Ghost YOLO模型在交通标志检测数据集TT100K中的平均精度均值达到93.1%，相较于原始模型提高了11.3个百分点，模型参数量相较于原始模型降低了21.2个百分点。此外，该网络模型优化了卷积层及下采样部分，在大幅减少模型参数的同时提高了模型检测精度。

Select

热点与综述

基于面部多特征融合的疲劳驾驶检测综述

王畅, 李雷孝, 杨艳艳

计算机工程. 2023, 49(11): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0066661

摘要 (487) PDF全文 (870) HTML (95)

可视化

基于计算机视觉的疲劳驾驶检测方法具有非侵入性等优点，不会对驾驶行为产生影响，在实际场景中便于应用。随着计算机技术的发展，越来越多的学者研究基于计算机视觉的疲劳驾驶检测方法。疲劳驾驶行为主要体现在面部和肢体上，在计算机视觉领域，面部行为较肢体行为更易获取，因此，基于面部特征的疲劳驾驶检测方法成为疲劳驾驶检测领域的重要研究方向。综合分析多种基于驾驶员面部多特征的疲劳驾驶检测方法，对国内外最新研究成果进行总结。介绍驾驶员面部不同特征在疲劳状态下的具体行为体现，阐述基于面部多特征的疲劳驾驶检测流程。根据面部不同特征对国内外的研究成果进行分类，并整理不同的特征提取方法和状态判别方法。通过不同特征在疲劳状态下产生的各种行为归纳不同方法判别驾驶员疲劳状态时使用的参数。同时，总结当前研究成果中使用面部多特征综合判别疲劳驾驶的方法，分析不同方法间的相同点和差异性。在此基础上，讨论当前基于面部多特征融合的疲劳驾驶检测领域存在的不足，并对该领域的未来研究方向进行展望。

Select

热点与综述

基于地基气辉图像的大气重力波目标识别

陈锦生, 马文臻, 方少峰, 邹自明

计算机工程. 2023, 49(11): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0066521

摘要 (275) PDF全文 (628) HTML (53)

可视化

子午工程全天空气辉成像仪观测网的逐步完善，积累了海量的气辉图像原始观测数据，但是基于地基气辉观测的大气重力波研究极度依赖人工识别，十分耗时且识别质量难以得到保证，亟需发展一种快速有效的自动识别方法。针对大气重力波标注样本稀缺的问题，在改进Cycle GAN模型的基础上提出一种大气重力波气辉观测数据集扩充算法，仅需标注少量样本即可大幅提升检测算法对大气重力波的识别精度；进一步，利用地基气辉图像识别目标与背景低信噪比的特点，通过对深度学习模型YOLOv5s骨干网络以及边界框预测加以改进，提出一种新的大气重力波智能识别算法。实验结果表明，使用扩增的数据集以及改进的YOLOv5s目标检测算法，在交并比阈值为0.5的情况下平均识别精度达到75.8%，较原始模型提升9.7个百分点，检测速度和平均识别精度均优于对比的主流目标检测算法。

Select

人工智能与模式识别

基于双拉普拉斯正则化与因果推断的多标签学习

罗俊, 高清维, 檀怡, 赵大卫, 卢一相, 孙冬

计算机工程. 2023, 49(11): 49-60. https://doi.org/10.19678/j.issn.1000-3428.0065787

摘要 (178) PDF全文 (484) HTML (11)

可视化

标签特定特征是多标签学习的研究热点，利用标签特征提取解决单个例子存在多个类标签的问题。现有多标签分类研究通常只是简单考虑标签之间的相关性，忽略原始数据之间的局部流形结构，可能会造成分类精度下降。此外，在标签相关性中，特征和标签的结构关系以及标签之间的内在因果关系也往往被忽视。提出一种基于双拉普拉斯正则化与因果推断的多标签学习算法。利用线性回归模型建立多标签分类的基本框架，结合因果学习探索标签之间的内在因果关系，以达到挖掘标签之间本质联系的目的。在此基础上，为充分利用特征与标签之间的结构关系，加入双拉普拉斯正则化以挖掘局部标签关联信息以及有效保持原始数据的局部流形结构。在公共多标签数据集上验证该算法的有效性，实验结果表明，相比LLSF、ML-KNN、LIFT等算法，该算法的汉明损失、平均精度、1次错误率、排序损失、覆盖率、AUC平均提升8.82%、4.98%、9.43%、16.27%、12.19%、3.35%。

Select

热点与综述

基于混合特征网络的学生评教文本情感分析模型

吴奇林, 党亚固, 熊山威, 吉旭, 毕可鑫

计算机工程. 2023, 49(11): 24-29, 39. https://doi.org/10.19678/j.issn.1000-3428.0066181

摘要 (209) PDF全文 (386) HTML (33)

可视化

以学生评教文本情感分析任务作为切入点，针对传统基础深度学习模型特征提取能力不足、循环神经网络训练效率较低以及词向量语义表示不准确等问题，提出基于混合特征网络的学生评教文本情感分类算法。采用轻量级ALBERT预训练模型提取符合当前上下文语境的每个词的动态向量表示，解决传统词向量模型存在的一词多义问题，增强向量语义表示的准确性；混合特征网络通过结合简单循环单元和多尺度局部卷积学习模块以及自注意力层，全面捕捉评教文本全局上下文序列特征和不同尺度下的局部语义信息，提升模型的深层次特征表示能力，自注意力机制通过计算每个分类特征对分类结果的重要程度，识别出对情感识别结果影响较大的关键特征，避免无关特征对结果造成干扰，影响分类性能，将分类向量拼接后由线性层输出评教文本情感分类结果。在真实学生评教文本数据集上的实验结果表明，该模型F1值达到97.8%，高于对比的BERT-BiLSTM、BERT-GRU-ATT等深度学习模型。此外，消融实验结果也证明了各模块的有效性。

Select

热点与综述

基于双重注意力机制的云计算负载预测模型

王恩旭, 王晓红, 张坤, 张冬雯

计算机工程. 2023, 49(11): 40-48, 69. https://doi.org/10.19678/j.issn.1000-3428.0066255

摘要 (205) PDF全文 (345) HTML (23)

可视化

针对目前负载预测模型不容易捕获数据时序信息和特征信息的问题，提出一种双重注意力机制的负载预测模型。该模型融合特征注意力机制和时序注意力机制，自适应地挖掘服务器负载的特征信息和时序信息，有效增强网络对特征数据和时序数据的关键信息表达。基于CRITIC方法对服务器各项特征进行加权，计算服务器负载值，从而更加全面和准确地评估服务器下一时刻的负载状态。双重注意力机制网络在长短期记忆网络（LSTM）的基础上引入特征注意力机制和时序注意力机制，以负载值的历史数据为输入对未来时刻服务器的负载值进行预测，有效提高网络对单步预测和多步预测的准确性。在阿里巴巴Cluster-trace-v2018公开数据集上的实验结果表明，双重注意力机制网络相对于LSTM基础的负载预测网络，平均绝对误差和均方误差分别下降了9.2%和16.8%，具有较好的稳定性和准确性。

Select

开发研究与工程应用

基于知识蒸馏的多模态融合行为识别方法

詹健浩, 甘利鹏, 毕永辉, 曾鹏, 李晓潮

计算机工程. 2023, 49(10): 280-288, 297. https://doi.org/10.19678/j.issn.1000-3428.0065152

摘要 (610) PDF全文 (768) HTML (64)

可视化

有效利用多模态数据的不同特征能够提高行为识别性能, 其核心问题在于多模态融合, 主要包括在数据层面、特征层面和预测分数层面融合不同模态数据的特征信息。研究在特征和预测分数2个层面通过多教师知识蒸馏的多模态融合方法, 将多模态数据的互补特征迁移到RGB网络, 以及采用不同知识蒸馏损失函数和模态组合的行为识别效果。提出一种基于知识蒸馏的多模态行为识别方法, 通过在特征上采用MSE损失函数、在预测分数上采用KL散度进行知识蒸馏, 并采用原始的骨骼模态和光流模态的教师网络的组合进行多模态融合, 使RGB学生网络同时学习到光流和骨骼教师网络的特征语义信息和预测分布信息, 从而提高识别准确率。实验结果表明, 该方法在常用的多模态数据集NTU RGB+D 60、UTD-MHAD和N-UCLA以及单模态数据集HMDB51上分别达到90.09%、95.12%、97.82%和81.26%的准确率, 在UTD-MHAD数据集上的识别准确率相比于单模态RGB数据分别提升3.49、2.54、3.21和7.34个百分点。

Select

图形图像处理

改进特征匹配的ORB-SLAM稠密建图算法

刘洋, 陈俊, 胡诗佳, 赖佳华

计算机工程. 2023, 49(10): 247-254. https://doi.org/10.19678/j.issn.1000-3428.0065825

摘要 (1198) PDF全文 (811) HTML (55)

可视化

对于同步定位与建图（SLAM）中主流的特征点法，特征匹配是估计相机运动的关键，然而在特征匹配过程中存在图像特征的局部特性、误匹配等问题，成为视觉SLAM的瓶颈。此外，特征点法生成的稀疏地图只能用于定位，无法满足更高层次的需求。针对ORB-SLAM3中ORB特征点匹配效率低且未能生成稠密地图的问题，提出一种改进的ORB-GMS匹配策略并在ORB-SLAM3系统中加入稠密点云构建线程来实现稠密建图。将运动平滑性约束作为特征点运动统计的方法，通过比较特征点邻域内的匹配数量和阈值快速判断当前匹配是否正确，将图片网格化并快速计算网格内特征点的匹配数量，进行相机的位姿估计。根据关键帧与相应位姿构建稠密点云地图，采用外点去除滤波和体素网格滤波减小点云规模。在TUM的RGB-D数据集上的实验结果表明，与ORB-SLAM3相比，该算法可以减少约50%的匹配耗时，同时在匹配数量上平均提升60%，定位平均误差降低32%。此外，与稀疏地图相比，该方法生成易于2次加工的稠密点云地图，扩大算法的应用场景。

Select

热点与综述

基于超邻接图的异质信息网络表征学习

杨彬, 王轶彤

计算机工程. 2023, 49(10): 13-21. https://doi.org/10.19678/j.issn.1000-3428.0065807

摘要 (226) PDF全文 (363) HTML (34)

可视化

异质信息网络往往包含不同类型的节点和关系，丰富的语义信息和复杂的关系对目前异质信息网络的表征学习提出了巨大的挑战。现有多数方法通常使用预定义的元路径来捕获异质的语义信息和结构信息，但成本高、覆盖率低，且不能准确有效地捕获和学习有影响力的高阶邻居节点。提出HIN-HG模型来解决以上问题。HIN-HG通过生成异质信息网络的超邻接图来准确有效地捕获对目标节点有影响力的邻居节点，并使用带有多通道机制的卷积神经网络聚合在不同关系下的不同类型的邻居节点。HIN-HG可以自动地学习不同邻居节点和元路径的权重而无须进行手动指定，同时可以捕获全图范围内和目标节点相似的节点作为高阶邻居，并通过信息传播有效地更新目标节点的表征。在DBLP、ACM和IMDB真实数据集上的实验结果表明，在节点分类任务中，HIN-HG较HAN、GTN、HGSL等前沿的异质信息网络表征学习方法性能更优，Macro-F1和Micro-F1多分类评估指标平均提高5.6和5.7个百分点，提高了节点分类的准确性和有效性。

Select

热点与综述

基于深度学习的道路小目标检测综述

曹健, 陈怡梅, 李海生, 蔡强

计算机工程. 2023, 49(10): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0065984

摘要 (355) PDF全文 (651) HTML (71)

可视化

复杂道路场景下的小目标检测能够提高车辆对于周边环境的感知能力，是计算机视觉和智慧交通领域的重要研究方向。随着深度学习技术的发展，将深度学习方法与道路小目标检测相结合能够有效提高检测精度，使车辆快速对周边环境做出反应。从经典及最新的道路小目标检测的研究成果出发，给出小目标的两种定义方式，分析造成道路小目标检测困难的原因，阐述数据增强、多尺度策略、生成超分辨率细节信息、加强上下文信息联系、改进损失函数等5类基于深度学习的提高道路小目标检测精度的优化方法，总结归纳各类方法的核心思想及目前国内外最新的研究进展。介绍常用于道路小目标检测的大型和公共数据集，提供相应的用于评估小目标检测性能的指标，对比分析各类方法在不同数据集上的性能检测结果，指出道路小目标检测研究目前仍存在的问题，并结合这些问题从多个角度对其未来研究方向进行展望。

Select

热点与综述

基于区块链与属性密码体制的匿名数据共享访问控制

王静怡, 刘百祥, 方宁, 彭凌祺

计算机工程. 2023, 49(10): 41-52. https://doi.org/10.19678/j.issn.1000-3428.0065202

摘要 (159) PDF全文 (225) HTML (27)

可视化

信息安全和隐私保护是大数据时代的重要需求。基于身份的公钥密码体制解决了传统公钥基础设施体制的密钥管理问题，但会泄漏签名者的身份信息。传统基于属性的访问控制方案实现了主体的动态扩展和对客体的细粒度访问，但存在中心化的授权机构。为了解决上述问题，提出一种基于区块链与去中心化属性密码体制的匿名数据共享访问控制方案。利用属性签名的匿名性，在存储数据前无须已知用户身份信息即可验证数据来源的可靠性，通过属性加密实现细粒度的访问控制。采用分布式属性密码体制，使用户合作构建属性授权机构，当且仅当超过指定阈值的机构用户同意时才可进行机构创建和密钥分发。实验结果表明，该方案能抵抗合谋和重放攻击，在并发请求数为1 000~5 000和属性数为10~30的条件下，系统总响应时间不超过120 ms，最大吞吐量可达62 T/s，满足实际应用需求。

Select

热点与综述

空间方向关系表达与推理模型研究综述

董星星, 高继勋, 王晓桐, 李松

计算机工程. 2023, 49(9): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0064822

摘要 (281) PDF全文 (513) HTML (66)

可视化

空间方向关系作为空间关系不可缺少的组成部分，广泛应用于城市智能交通管控、环境资源检测、防灾减灾等诸多任务，日益成为地理信息系统、空间数据库、人工智能、模式识别等领域研究的热点。综合分析和梳理现有空间方向关系表达与推理模型，针对二维空间对象，从单目标对象、群组目标对象等方面详细介绍目前二维空间方向关系表达与推理模型的研究进展，依据描述对象的不同进行分类，对每类模型的特性及适用范围进行定性分析比较。针对三维空间对象，从点到区域依次分析当前三维空间方向关系表达与推理模型的特点、优势和不足。针对不确定性对象，从确定性空间方向关系模型的扩展模型、基于不确定性集合理论模型2个方面阐述不确定性方向关系模型的研究现状，并对每类模型的优缺点、适用范围等进行分析总结。最后阐明当前工作存在的不足，并从自动推理技术、空间关系的联合表达以及群组目标对象等方面对空间方向关系的未来研究方向进行展望。

Select

图形图像处理

基于多分辨率特征融合的任意尺度图像超分辨率重建

范文卓, 吴涛, 许俊平, 李庆庆, 张建林, 李美惠, 魏宇星

计算机工程. 2023, 49(9): 217-225. https://doi.org/10.19678/j.issn.1000-3428.0065689

摘要 (467) PDF全文 (790) HTML (43)

可视化

传统深度学习的图像超分辨率重建网络仅在固定分辨率上提取特征，存在无法综合高级语义信息、只能以特定尺度因子重建图像、泛化能力较弱、网络参数量较大等问题。提出一种基于多分辨率特征融合的任意尺度图像超分辨率重建算法MFSR。在多分辨率特征融合编码阶段设计多分辨率特征提取模块以提取不同分辨率特征, 通过构建双重注意力模块增强网络特征提取能力，使不同分辨率特征之间进行充分交互, 以获取信息丰富的融合特征图。在图像重建阶段利用多层感知机对融合特征图进行解码，实现任意尺度的图像超分辨率重建。实验结果表明，在Set5数据集上分别以尺度因子2、3、4、6、8进行测试，所提算法的峰值信噪比分别为38.62、34.70、32.41、28.96、26.62 dB，模型参数量为0.72×10⁶，在大幅减少参数量的同时能保持重建质量，可以实现任意尺度的图像超分辨率重建，性能优于SRCNN、VDSR、EDSR等主流算法。

Select

图形图像处理

基于Transformer和多尺度CNN的图像去模糊

李现国, 李滨

计算机工程. 2023, 49(9): 226-233, 245. https://doi.org/10.19678/j.issn.1000-3428.0065513

摘要 (230) PDF全文 (371) HTML (35)

可视化

卷积神经网络(CNN)单独应用于图像去模糊时感受野受限，Transformer能有效缓解这一问题但计算复杂度随输入图像空间分辨率的增加呈2次方增长。为此，提出一种基于Transformer和多尺度CNN的图像去模糊网络(T-MIMO-UNet)。利用多尺度CNN提取空间特征，并嵌入Transformer全局特性捕获远程像素信息。设计局部增强Transformer模块、局部多头自注意力计算网络和增强前馈网络，采用窗口的方式进行局部逐块多头自注意力计算，通过增加深度可分离卷积层，加强不同窗口之间的信息交互。在GoPro测试数据集上的实验结果表明，T-MIMO-UNet的峰值信噪比相比于MIMO-UNet、DeepDeblur、DeblurGAN、SRN网络分别提升了0.39 dB、2.89 dB、3.42 dB、1.86 dB，参数量相比于MPRNet减少了1/2，能有效解决动态场景下的图像模糊问题。

Select

图形图像处理

基于改进YOLOv5的遥感小目标检测网络

李嘉新, 侯进, 盛博莹, 周宇航

计算机工程. 2023, 49(9): 256-264. https://doi.org/10.19678/j.issn.1000-3428.0065935

摘要 (885) PDF全文 (822) HTML (75)

可视化

受遥感图像背景复杂、分辨率高、有效信息量少等因素影响，现有目标检测算法在检测小目标过程中存在错检、漏检等问题。提出基于YOLOv5的遥感小目标检测算法YOLOv5-RS。为有效减少图像中复杂背景和负样本的干扰，构建并行混合注意力模块，采用卷积替换全连接层和移除池化层的操作来优化注意力模块生成权重特征图的过程。为获取和传递更丰富且更具判别性的小目标特征，调整下采样倍数并在模型训练过程中增加小目标信息丰富的浅层特征，同时设计卷积与多头自注意力相结合的特征提取模块，通过对局部和全局信息进行联合表征以突破普通卷积提取的局限性，从而获得更大的感受野。采用EIoU损失函数优化预测框与检测框的回归过程，增强小目标的定位能力。在遥感小目标数据集上进行实验以验证该算法的有效性。实验结果表明，与YOLOv5s相比，该算法在参数量减少20%的情况下平均检测精度提升1.5个百分点，其中，小车类目标的平均检测精度提升3.2个百分点；与EfficientDet、YOLOx、YOLOv7相比，该算法能有效兼顾检测精度和实时性。

Select

热点与综述

基于改进非全连接神经网络的站点客流预测模型

高御尧, 石明全, 秦渝, 陈建平, 周喜, 张鹏

计算机工程. 2023, 49(9): 43-51. https://doi.org/10.19678/j.issn.1000-3428.0066234

摘要 (152) PDF全文 (334) HTML (14)

可视化

在地面公交运输中，站点客流量数据是公交线网规划最重要的基础数据之一。站点周边兴趣点（POI）的类型、数量以及距离会导致站点客流量出现不同的趋势。神经网络是研究客流预测的常用方案，然而由于POI对客流的影响存在相互独立性，这一重要特征并未在传统全连接神经网络的结构中得以体现，易使预测效果不尽人意。基于POI与客流量关系的特殊性，改进全连接神经网络的基本结构，构建一种特定的非全连接神经网络，利用所有公交站点客流量的历史数据及各类POI分布，实现对站点各时间段的客流量的模拟及预测。模型设定一种连接矩阵实现特定的连接方式，并根据客流量的性质额外赋予部分隐藏层实际意义，构造组合误差传递函数，增强神经网络的可解释性。该模型可以快速收敛至全局最优解，改进传统全连接神经网络的收敛速度慢、拟合效果差、易陷入局部最优解等问题。实验结果表明，该模型单位时间内的客流量预测偏差在50人以内的概率达到88%以上，对比其他常见预测模型均有优质表现，并且能准确模拟每日客流的变化趋势。

Select

图形图像处理

基于抗混叠残差注意力网络的人脸表情识别

丰芳宇, 罗晓曙, 蒙志明, 王广宇

计算机工程. 2023, 49(8): 190-198. https://doi.org/10.19678/j.issn.1000-3428.0065224

摘要 (297) PDF全文 (566) HTML (70)

可视化

针对人脸表情识别中难以提取有效特征，以及类别之间相似性高、易混淆导致人脸表情识别准确率下降的问题，提出一种基于抗混叠残差注意力网络的人脸表情识别方法。针对传统降采样方法易造成表情判别性特征丢失的不足，构建抗混叠残差网络来改善对表情图像的特征提取能力，加强表情特征的表征，从而提取更加有效的人脸表情全局信息。同时，利用改进的通道注意力机制和标签平滑的正则化策略来加强对人脸局部关键表情区域的关注，其中改进的通道注意力专注于区分性较高的表情特征，抑制非表情区域的权重，从而在网络提取的全局信息中定位更加细节的局部表情区域，标签平滑技术则通过增加决策表情类别的信息量对预测概率进行修正，避免过于绝对的预测结果，从而减少相似表情之间的误判。实验结果表明，该方法在人脸表情数据集RAF-DB和FERPlus上的识别准确率分别达到88.14%和89.31%，与DACL、VTFF等其他先进方法相比识别性能更优，相较于原始残差网络有效提升了人脸表情识别准确率和鲁棒性。

Select

图形图像处理

基于目标检测和语义分割的视觉SLAM算法

徐春波, 闫娟, 杨慧斌, 王博, 吴晗

计算机工程. 2023, 49(8): 199-206, 214. https://doi.org/10.19678/j.issn.1000-3428.0065522

摘要 (555) PDF全文 (645) HTML (73)

可视化

目前多数视觉同步定位与建图（VSLAM）算法基于静态场景设计且未考虑场景中的动态物体，然而现实场景中存在的动态物体会造成视觉里程计的特征点误匹配，影响VSLAM系统定位与建图精度，降低其在实际应用中鲁棒性。针对室内动态环境，提出一种基于ORB-SLAM3主体框架的VSLAM算法(RDTS-SLAM)。利用改进的YOLOv5目标检测与语义分割网络对环境中的物体进行精准快速分割，同时将目标检测结果与局部光流法相结合准确识别动态物体，并对动态物体区域内的特征点进行剔除，仅使用静态特征点进行特征点匹配以及后续的定位与建图。在TUM RGB数据集和真实环境数据上的实验结果表明，相较于ORB-SLAM3和RDS-SLAM算法，RDTS-SLAM算法对于walking_rpy序列的轨迹估计均方根误差分别降低了95.38%和86.20%，可以显著提高VSLAM系统在动态环境中的鲁棒性和准确性。

Select

图形图像处理

基于空洞卷积与注意力模块的立体匹配算法

刘志浩, 孟凡云, 王金鹤, 张楠

计算机工程. 2023, 49(8): 223-231. https://doi.org/10.19678/j.issn.1000-3428.0065628

摘要 (141) PDF全文 (121) HTML (12)

可视化

基于卷积神经网络的立体匹配算法大多需要较大的感受野，但多数算法在扩大感受野的同时参数量也容易剧增，导致算法对训练数据的规模要求较高。提出一种基于空洞卷积和注意力模块的立体匹配算法，采用空洞卷积模块，将残差结构和空洞卷积相结合，以在较少参数量的情况下扩大网络的感受野。使用注意力模块，通过不同层次的卷积整合多层次的信息，增加所提取信息的完整性。采用空间金字塔池化模块，通过帯权的金字塔池化扩大模型的感受野，并赋予不同层次信息不同的重要性程度。实验结果表明，在相同数据集和训练次数的情况下，所提算法相对于DispNetC等其他算法具有较快的收敛速度，且结构简单，参数量较少，适用于小样本数据。

Select

热点与综述

区块链数据形成与隐私威胁

王群, 李馥娟, 倪雪莉, 夏玲玲, 梁广俊

计算机工程. 2023, 49(8): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0065926

摘要 (187) PDF全文 (147) HTML (35)

可视化

区块链借助于密码学、共识算法、激励机制、点对点网络、分布式账本、智能合约等关键技术，在没有第三方权威机构参与的互不信任网络环境中，实现了对事务记录的分布式一致性、不可篡改性、可溯源性等功能特性，构成了一种崭新的可信、安全、可编程的网络生态。与此同时，支撑区块链自身功能实现的相关技术及机制也带来了隐私安全问题。将隐私作为个人数据的一个子集进行研究，从而将区块链数据划分为事务数据和区块数据等2种类型，并通过对区块链数据的解构以及对所得信息的关联，分析隐藏在数据中的隐私信息。从数据传输方式和数据结构方面介绍区块链数据构成；在分析区块链数据特点的基础上，综合对隐私的理解、度量、泄露途径等因素，给出区块链隐私的定义，并从身份隐私、数据隐私、网络隐私等方面进行分析；通过对网络安全、密码学安全、跨链操作、共识算法等方面带来的隐私泄露风险的分析，指出区块链隐私威胁存在的挑战和未来研究方向。

Select

热点与综述

基于长尾分类算法的网络不良信息分类

刘金硕, 王代辰, 邓娟, 王丽娜

计算机工程. 2023, 49(8): 13-19, 28. https://doi.org/10.19678/j.issn.1000-3428.0067003

摘要 (237) PDF全文 (156) HTML (37)

可视化

目前已有的网络不良信息分类方法大多忽略了数据不平衡、数据存在长尾分布的情况，使得模型在分类时偏向于数据量多的样本，无法很好地识别数据量少的样本，从而导致整体识别精度下降。针对该问题，提出一种用于长尾不良信息数据集的分类方法LTIC。将小样本学习与知识转移策略相结合，使用BERT模型学习头部类的权重，通过专门为小样本学习而提出的Prototyper网络得到头部类的原型，将头尾数据分开处理，从而避免一起训练而导致的数据不平衡问题。学习从原型到权重的映射关系，利用学到的知识将尾部类的原型转换为权重，然后连接头部类权重和尾部类权重得到最终的分类结果。实验结果表明：LTIC方法在Twitter和THUCNews数据集上分别达到82.7%和83.5%的分类准确率，且F1值相较非长尾模型有显著提升，有效提高了模型分类精度；与目前较新的长尾数据集分类方法BNN、OLTR等相比，该方法具有更好的分类效果，平均准确率提升了3%；当新的不良信息类别出现时，LTIC方法只需少量计算就可对其进行预测，准确率达到70%，具有良好的扩展性。

Select

热点与综述

基于舆情新闻的中文关键词抽取综述

杨文忠, 丁甜甜, 康鹏, 卜文秀

计算机工程. 2023, 49(3): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0064374

摘要 (755) PDF全文 (594) HTML (97)

可视化

基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一，其目的是在不同的舆情事件中抽取出人们关注的核心词汇，从而快速了解新闻内容。随着深度学习的发展，传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助，重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法，并归纳现有方法的优缺点与发展趋势。此外，深度学习虽然在关键词抽取领域发挥了重要的作用，但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷，需要在未来发展中进行解决。为确保分析过程的真实性，利用6个舆情新闻数据集和2个小型数据集进行实验复现，实验结果与文中理论分析一致。在此基础上，对关键词抽取技术及其所面临的困难和挑战进行梳理和分析，并针对现存问题对该领域的发展前景加以展望。

Select

热点与综述

区块链隐私保护机制研究

王群, 李馥娟, 倪雪莉, 夏玲玲, 梁广俊

计算机工程. 2023, 49(4): 1-13. https://doi.org/10.19678/j.issn.1000-3428.0065927

摘要 (579) PDF全文 (493) HTML (104)

可视化

区块链作为一类由多节点共同维护的分布式账本，综合运用P2P网络、共识算法、智能合约、密码学等技术，在开放网络环境中构建高效率、低成本的去中心化信任机制，实现防篡改、防伪造等安全功能，但同时面临严重的数据隐私泄露风险。基于对区块链隐私的理解和对隐私数据形成过程的分析，重点从身份隐私、数据隐私、网络隐私等3个方面分析目前区块链隐私保护的具体技术、工作机制和实现协议。针对身份隐私保护研究，在讨论混币技术的基础上，对比分析中心化混币技术和去中心化混币技术的实现原理和应用特点；针对数据隐私保护研究，介绍零知识证明和环签名技术在区块链隐私保护中的应用；针对网络隐私保护研究，讨论网络数据隐藏技术和通道隔离技术。从隐私内容、隐私威胁、隐私保护机制等3个方面对身份隐私、数据隐私和网络隐私进行对比分析，并结合当前区块链应用，在系统梳理隐私保护研究新进展的基础上，展望区块链隐私保护机制的未来发展趋势。

Select

热点与综述

RegLang监管合约规则冲突检测方法

高健博, 张家硕, 李青山, 陈钟

计算机工程. 2023, 49(5): 12-21,28. https://doi.org/10.19678/j.issn.1000-3428.0065584

摘要 (362) PDF全文 (267) HTML (53)

可视化

RegLang是一种面向监管规则设计的智能合约编程语言，旨在支撑监管规则数字化与合约化，已在金融等领域取得初步应用。然而，在实际应用中，金融监管领域的“适用冲突”“多轨规制”等规则冲突问题可能对区块链金融应用造成严重影响，在增加从业机构合规成本的同时，对监管合约的有效性带来挑战。针对上述问题，提出监管合约变量类型依赖分析方法与基于依赖图的变量类型传播分析方法，推断监管合约中所有变量的可能类型，并根据可满足性模理论求解器支持的符号类型实现监管合约中变量、语句和规则的符号化。基于符号分析的规则冲突检测方法，将监管规则冲突问题转换为可满足性问题，从而检测监管合约中规则的自冲突、完全冲突和局部冲突，并针对多个监管规则间完全冲突检测中的状态空间爆炸问题提出子集划分算法进行优化。实验结果表明，RegLang监管合约规则冲突检测方法可以有效检测各类监管规则冲突，在对代码行数为300行的监管规则进行冲突检测时，自冲突、完全冲突和局部冲突的平均检测耗时分别为1 234.9 ms、1 977.8 ms和2 364.5 ms，在实际应用中是可接受的，能够为实现监管规则数字化提供有效保障。

Select

热点与综述

自动驾驶场景下的轨迹预测技术综述

李雪松, 张锲石, 宋呈群, 康宇航, 程俊

计算机工程. 2023, 49(5): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0065627

摘要 (1343) PDF全文 (785) HTML (127)

可视化

轨迹预测是自动驾驶和智能交通领域的关键技术，对于车辆和移动行人轨迹的准确预测可提升自动驾驶系统对周围环境变化的感知能力，保障自动驾驶系统的安全性。数据驱动轨迹预测方法可捕捉智能体之间的交互特征，对场景内智能体历史运动和静态环境信息进行分析，准确预测智能体的未来轨迹。介绍轨迹预测的数学模型并将其分为传统轨迹预测方法和数据驱动轨迹预测方法2类，阐述主流数据驱动轨迹预测方法所面临的智能体交互建模、运动行为意图预测、轨迹多样性预测、场景内静态环境信息融合等4个主要挑战，从轨迹预测数据集使用、性能评价指标、模型特点等方面出发对典型数据驱动轨迹预测方法进行分析与对比，总结归纳这些典型数据驱动轨迹预测方法针对上述挑战的解决思路和应用场景，并对自动驾驶场景下轨迹预测技术的未来发展方向进行展望。

Select

体系结构与软件技术

一种加速访存地址计算的编译优化

高秀武, 姜军, 白书敬, 黄亮明

计算机工程. 2023, 49(1): 173-180. https://doi.org/10.19678/j.issn.1000-3428.0062878

摘要 (301) PDF全文 (758) HTML (221)

可视化

在国产申威高性能多核服务器系统中，基础编译系统对应用程序中访存操作进行代码生成时，没有考虑国产处理器指令特征，导致编译器生成的访存地址计算代码效率较低，影响国产高性能处理器的性能。为充分发挥国产处理器高性能计算能力，提出一种加速访存地址计算的编译优化方法。加速访存地址计算编译优化基于处理器支持带扩展因子的运算指令，在编译器后端内存地址表达式合法性检查中，添加针对乘加模式的地址计算表达式合法性检查算法，自动识别地址表达式中存在的乘加运算并进行合法性检验，对符合条件的地址表达式在代码生成阶段匹配生成带扩展因子的运算指令来快速计算访存地址，从而加快访存指令的发射与执行以及应用程序中的访存地址生成，提升访存效率。使用行业标准性能测试集SPEC CPU2006对优化效果进行评测，结果表明，相比优化前SPECspeed Integer与SPECspeed Float Point两个子集，该优化方法平均性能分别提高了2.53%与1.50%。

Select

热点与综述

人脸微表情分析方法综述

于明, 钟元想, 王岩

计算机工程. 2023, 49(2): 1-14. https://doi.org/10.19678/j.issn.1000-3428.0065790

摘要 (510) PDF全文 (402) HTML (73)

可视化

微表情分析在医学、公共安全、商业谈判等领域得到广泛应用并备受关注。微表情运动幅度小、变化快，导致人工分析难度较大，开发一个可靠的自动化微表情分析系统非常有必要。随着计算机视觉技术的发展，研究人员能够结合相关算法捕捉微表情运动变化特征以用于微表情分析。阐述微表情分析的发展历程和现状，从多个角度对微表情分析的两大分支，即微表情检测方法和微表情识别方法进行总结。整理现有微表情数据集以及微表情分析流程中常用的面部图像预处理方法。根据特征提取方式的不同，从基于时间特征、基于特征变化和基于深度特征这3个方面对微表情检测方法进行阐述。将微表情识别方法归纳为基于纹理特征和基于光流特征的传统机器学习方法以及深度学习方法，其中，基于深度学习的微表情识别包括基于运动单元、基于关键帧和基于迁移学习的方法。通过不同实验指标对以上方法进行分析和比较，在此基础上，探讨当前微表情分析中存在的问题和挑战并展望该领域未来的发展方向。

Select

热点与综述

基于改进YOLOv7的小目标检测

戚玲珑, 高建瓴

计算机工程. 2023, 49(1): 41-48. https://doi.org/10.19678/j.issn.1000-3428.0065942

摘要 (3149) PDF全文 (879) HTML (130)

可视化

目前的目标检测技术已趋于成熟，但小目标检测仍是研究的难点。针对目标检测过程中小目标检测更容易出现漏检等问题，提出一种改进的YOLOv7目标检测模型。结合特征分离合并思想，对YOLOv7网络模型中的MPConv模块进行改进，以减少网络特征处理过程造成的特征损失，并通过实验确定放置改进MPConv模块的最佳位置。由于小目标检测过程中容易出现漏检的现象，利用ACmix注意力模块提高网络对小尺度目标的敏感度，降低噪声所带来的影响。在此基础上，使用SIoU替换原YOLOv7网络模型中的CIoU来优化损失函数，减少损失函数自由度，提高网络鲁棒性。在Okahublot公开的FloW-Img子数据集上进行实验，结果表明，对于数据集中的密集、小目标和超小目标三种情况的图片，改进后的YOLOv7网络模型相比原网络，漏检情况得到明显改善，且mAP达到71.1%，相比基线YOLOv7网络模型提升了4个百分点，检测效果优于原网络模型与传统经典目标检测网络模型。

Select

先进计算技术

应用透明的超算多层存储加速技术研究

何晓斌, 高洁, 肖伟, 陈起, 刘鑫, 陈左宁

计算机工程. 2022, 48(12): 1-8. https://doi.org/10.19678/j.issn.1000-3428.0065928

摘要 (341) PDF全文 (269) HTML (58)

可视化

在E级计算时代，超算系统一般使用多层存储架构以满足应用数据访问的容量和性能需求，这种架构中不同层次的存储介质差异较大，难以实现统一名字空间管理，往往需要应用修改数据访问流程才能最大程度利用到多层存储的性能和容量优势。针对多层存储统一名字空间的问题，提出针对非易失性双列存储模块（NVDIMM）的块级缓存和针对突发缓冲存储（BB）的文件级缓存技术。基于NVDIMM的块级缓存技术对缓存窗口灵活控制，以支持数据块粒度的异步读写，实现NVDIMM与BB层统一名字空间管理；基于BB的文件级缓存技术将数据缓存在BB层中，并动态迁移和管理文件副本，实现BB层与传统磁盘文件系统统一名字空间管理。在神威E级原型验证系统中的测试结果表明，所提出的两种技术较好地解决了多层存储的透明加速难题，NVDIMM块级缓存与BB相比，在缓存窗口16 MB时128 KB顺序读写带宽分别提升27%和36%，8 KB随机读写带宽分别提升20%和37%；基于BB的文件缓存技术利用BB的高带宽支撑数据访问，与全局文件系统相比，128 KB顺序读写带宽分别提升55%和141%，8 KB随机读写带宽分别提升163%和209%。此外，实际应用的测试也表明以上两种缓存技术具有透明的存储加速效果。

Select

热点与综述

基于改进PCFG算法的口令猜测方法

李静雯, 赵奎

计算机工程. 2023, 49(5): 38-47. https://doi.org/10.19678/j.issn.1000-3428.0064678

摘要 (295) PDF全文 (163) HTML (18)

可视化

近年来口令泄露事件频出，有效的口令猜测方法是保障口令安全的重要手段，其中基于概率上下文无关文法(PCFG)的口令猜测方法效果尤为显著，然而仍存在无法生成新的口令字符子段、对生成口令的概率估计不准确等问题。以基于PCFG的口令猜测方法为研究对象，对其在口令构造过程中关键阶段的命中率进行分析，提出基于Backoff-RNN与概率平衡的改进PCFG口令猜测方法。在口令结构划分阶段，通过分析用户在构造口令时的行为与偏好，将口令从汉语拼音和英文单词两方面进行更细粒度的结构划分，提取口令更深层次的结构信息。在口令填充阶段，将Backoff思想应用于字符级RNN模型，生成子结构中长序列字符子段，提高模型准确性和泛化能力。在口令概率计算阶段，改进口令生成概率的计算方法，解决了使用传统计算规则时因口令结构长度不一致造成的概率不平衡问题。实验结果表明：在中英文两种语言环境交叉数据集上，该方法的漫步口令猜测攻击命中率相较于基于PCFG的口令猜测方法分别提升了20.6%和22.4%；在中文语言环境数据集上，定向口令攻击命中率相较于TarGuess-I模型提升了2.8%。

Select

热点与综述

基于超级账本的集群联邦优化模型

李尤慧子, 俞海涛, 殷昱煜, 高洪皓

计算机工程. 2023, 49(1): 22-30. https://doi.org/10.19678/j.issn.1000-3428.0064301

摘要 (219) PDF全文 (139) HTML (23)

可视化

联邦学习作为分布式机器学习框架，在数据不离开本地的情况下，通过共享模型参数达到协作训练的目标，一定程度上解决了隐私保护问题，但其存在中心参数服务器无法应对单点故障、潜在恶意客户端梯度攻击、客户端数据偏态分布导致训练性能低下等问题。将去中心化的区块链技术与联邦学习相结合，提出基于超级账本的集群联邦优化模型。以超级账本作为分布式训练的架构基础，客户端初始化后在本地训练向超级账本传输模型参数及分布信息，通过聚类优化联邦学习模型在客户端数据非独立同分布下的训练表现。在此基础上，随机选举客户端成为领导者，由领导者代替中央服务器的功能，领导者根据分布相似度和余弦相似度聚类并下载模型参数聚合，最后客户端获取聚合模型继续迭代训练。以EMNIST数据集为例，数据非独立同分布情况下该模型平均准确率为79.26%，较FedAvg提高17.26%，在保证准确率的前提下，较集群联邦学习训练至收敛的通信轮次减少36.3%。

热点文章

选择文件类型/文献管理软件名称

选择包含的内容

模态框（Modal）标题

热点文章

选择文件类型/文献管理软件名称

选择包含的内容