作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2022年, 第48卷, 第4期 刊出日期:2022-04-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2022, 48(4): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 王振华, 李静, 张鑫月, 郑宗生, 卢鹏, 栾奎峰
    计算机工程. 2022, 48(4): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0062227
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    目标识别是计算机视觉领域的一大挑战,随着深度学习的发展,目标识别算法被广泛应用于视频数据中目标的识别和监测。对现有目标识别算法进行归纳,根据是否采用锚点机制将主流算法分为Anchor-Based和Anchor-Free两大类。针对R-CNN、SPP-Net、SSD、YOLOv2等Anchor-Based类目标识别算法,从候选框创建、特征提取和结果生成角度分析基于区域和基于回归的目标识别算法的区别和各自优势。针对CornerNet、ExtremeNet、CenterNet、FCOS等Anchor-Free类目标识别算法,从特征提取、关键点选择/层次结构和结果生成角度分析基于关键点和基于特征金字塔的目标识别算法的区别和各自优势。在此基础上,以识别效率和识别精度为评价指标,对Faster R-CNN、Mask R-CNN、SSD等8种代表性目标识别算法进行对比总结。最后,针对目标识别算法中的数据预处理耗时长、多尺度特征同步识别精度低、结构繁杂等问题,对当前研究的不足和未来研究方向进行分析和展望。
  • 金雨澄, 王清钦, 高剑, 苗仲辰, 林越峰, 项雅丽, 熊贇
    计算机工程. 2022, 48(4): 16-21. https://doi.org/10.19678/j.issn.1000-3428.0061221
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    金融文本多标签分类算法可以根据用户需求在海量金融资讯中实现信息检索。为进一步提升金融文本标签识别能力,建模金融文本多标签分类中标签之间的相关性,提出基于图深度学习的金融文本多标签分类算法。图深度学习通过深度网络学习局部和全局的图结构特征,可以刻画节点之间的复杂关系。通过建模标签关联实现标签之间的知识迁移,是构造具有强泛化能力算法的关键。所提算法结合标签之间的关联信息,采用基于双向门控循环网络和标签注意力机制得到的新闻文本对应不同标签的特征表示,通过图神经网络学习标签之间的复杂依赖关系。在真实数据集上的实验结果表明,显式建模标签之间的相关性能够极大地增强模型的泛化能力,在尾部标签上的性能提升尤其显著,相比CAML、BIGRU-LWAN和ZACNN算法,该算法在所有标签和尾部标签的宏观F1值上最高提升3.1%和6.9%。
  • 宁小娟, 巩亮, 张金磊
    计算机工程. 2022, 48(4): 22-29. https://doi.org/10.19678/j.issn.1000-3428.0061717
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    以车载激光雷达获取的点云数据为研究对象,针对无人车道路环境感知的关键技术展开研究。为解决无人驾驶中道路可通行区域检测存在的地面不平整、缓坡、障碍物单一等问题,提出基于激光点云数据的道路可通行区域检测方法。通过基于分段校准的RANSAC算法进行地面分割,解决地面不平整导致的欠分割问题。使用多特征复合判据,利用基于体素化的DBSCAN聚类算法和基于结构特征的障碍物识别方法完成障碍物的分割与识别。结合道路结构以及数据高程突变特征,提取道路边界候选点并拟合得到完整的道路边界线。将道路区域栅格化,根据道路边界悬空障碍物判断并更新可通行区域,实现可通行区域的准确检测。实验结果表明,该方法在复杂道路场景中的边界检测准确率高于95%,可有效检测出障碍物及道路的可通行区域,具有良好的实时性与鲁棒性。
  • 张青青, 汤红波, 游伟, 普黎明
    计算机工程. 2022, 48(4): 30-38,49. https://doi.org/10.19678/j.issn.1000-3428.0061282
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    构建网络功能虚拟化(NFV)拟态防御架构能够打破防御滞后于攻击的攻防不对等格局,其中动态调度策略是关键实现技术。然而,现有拟态防御架构中的动态调度策略大多根据执行体自身固有的特点进行调度,没有进一步利用裁决机制对异常执行体的定位感知能力做优化调整。通过引入演化博弈理论,设计一种新的NFV拟态防御架构动态调度策略。在NFV拟态防御架构中增加一个分析器,用于对历史裁决信息进行分析研究。根据分析器中得到的反馈信息,从攻防双方的有限理性出发构建多状态动态调度演化博弈模型,并采用复制动态方程求解该博弈模型的演化均衡策略,利用李雅普诺夫间接法对均衡策略进行稳定性分析,提出基于演化博弈的动态调度策略选取算法。仿真结果表明,该策略能够利用裁决机制对异常执行体的定位感知能力,通过深入分析研究和不断调整优化选择具有适应性和针对性的调度策略,有效提升系统的安全收益和防御效能。
  • 彭成, 张乔虹, 唐朝晖, 桂卫华
    计算机工程. 2022, 48(4): 39-49. https://doi.org/10.19678/j.issn.1000-3428.0061502
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    人脸口罩佩戴检测是公共场所疫情防控中极为重要的措施,智能、高效地检测口罩佩戴情况对实现疫情防控的自动化和数字化具有重要意义。使用卷积类深度神经网络实现端到端的人脸口罩佩戴检测具有可行性,但卷积类神经网络具有结构复杂、参数量和浮点计算量庞大的特点,从而产生较高的计算开销和内存需求,极大地限制了其在资源有限的终端设备上的应用。为了使人脸口罩佩戴监督功能更易获取,并实现多尺度条件下的模型压缩和加速检测,提出一种基于改进YOLOv5的轻量化增强网络模型。设计参数量和计算量更小的GhostBottleneckCSP和ShuffleConv模块并替换原YOLOv5网络中的C3及部分Conv模块,以降低特征通道融合过程中的计算量并增强特征表达能力。实验结果表明,该模型的识别精度达95%以上,模型在精度近乎无损失的前提下,参数量和计算量分别仅为原YOLOv5网络的34.24%和33.54%,且在GPU和CPU上的运行速度分别提升13.64%和28.25%,降低了模型对内存存储及计算能力的要求,更适用于在资源有限的移动端部署。
  • 陈儒玉, 戴欢, 高玉建, 付保川, 陈洁
    计算机工程. 2022, 48(4): 50-60,80. https://doi.org/10.19678/j.issn.1000-3428.0061193
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着高校毕业生规模的不断扩大,学位信息安全和共享方法都面临新的挑战。提出一种用户可控、多部门协同的电子学位证照数据保护及共享方法。基于权威证明共识算法,给出一种权威身份评估机制,实现权威用户身份的动态调整与更新,使得系统具有自适应的信誉调节能力,保证节点的可信性与学位信息的真实性。构建面向学位管理的智能合约架构,允许不同功能的合约相互调用,建立符合学位授予流程的访问控制方案,并提出一种批量电子学位证照的共享与审核方法,在加密环境下实现数据可信共享。利用哈希加密、数字签名等密码学技术结合智能合约实现高度自动化的学位授予、审核与验证功能,并基于以太坊的gas机制设计一种智能合约复杂度分析方法,有效衡量并分析学位授予各环节的功能复杂度,为实现各部门间的数据互通,提高学位证书的隐私性、安全性和可信性提供解决方案。实验结果表明,该方法具有一定的鲁棒性与高效性,提出的权威身份评估机制能够有效避免隐藏性恶意行为的发生。
  • 人工智能与模式识别
  • 王芙银, 张德生, 肖燕婷
    计算机工程. 2022, 48(4): 61-69. https://doi.org/10.19678/j.issn.1000-3428.0060648
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    密度峰值聚类(DPC)算法在对密度分布差异较大的数据进行聚类时效果不佳,聚类结果受局部密度及其相对距离影响,且需要手动选取聚类中心,从而降低了算法的准确性与稳定性。为此,提出一种基于加权共享近邻与累加序列的密度峰值算法DPC-WSNN。基于加权共享近邻重新定义局部密度的计算方式,以避免截断距离选取不当对聚类效果的影响,同时有效处理不同类簇数据集分布不均的问题。在原有DPC算法决策值的基础上,生成一组累加序列,将累加序列的均值作为聚类中心和非聚类中心的临界点从而实现聚类中心的自动选取。利用人工合成数据集与UCI上的真实数据集测试与评估DPC-WSNN算法,并将其与FKNN-DPC、DPC、DBSCAN等算法进行比较,结果表明,DPC-WSNN算法具有更好的聚类表现,聚类准确率较高,鲁棒性较强。
  • 鲁统伟, 徐子昕, 闵锋
    计算机工程. 2022, 48(4): 70-80. https://doi.org/10.19678/j.issn.1000-3428.0060395
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在图像分类和工业视觉检测过程中,缺陷样本量少导致神经网络分类器训练效率低及检测精度差,直接采用原始的离散标签又无法使网络分类器学习到不同类别间的相似度信息。针对上述问题,在区域丢弃算法的基础上,提出一种基于生成对抗网络的知识蒸馏数据增强算法。使用补丁对丢弃区域进行填补,减少区域丢弃产生的非信息噪声。在补丁生成网络中,保留生成对抗网络的编码器-解码器结构,利用编码器卷积层提取特征,通过解码器对特征图上采样生成补丁。在样本标签生成过程中,采用知识蒸馏算法中的教师-学生训练模式,按照交叉检验方式训练教师模型,根据教师模型生成的软标签对学生模型的训练进行指导,提高学生模型对特征的学习能力。实验结果表明,与区域丢弃算法相比,该算法在CIFAR-100、CIFAR-10数据集图像分类任务上的Top-1 Err、Top-5 Err分别降低3.1、0.8、0.5、0.6个百分点,在汽车转向器轴承数据集语义分割任务上的平均交并比和识别准确率分别提高2.8、2.3个百分点。
  • 梁小慧, 郭晟楠, 万怀宇
    计算机工程. 2022, 48(4): 81-88,98. https://doi.org/10.19678/j.issn.1000-3428.0061110
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    时间序列分类即通过构建分类模型建模时间序列中的特征来实现对该时间序列的归类,是时间序列挖掘的重要研究分支。现有的时间序列分类方法多数从时域的角度对时间序列进行建模,忽视了时间序列中隐含的频域信息,而时间序列往往同时蕴含着多种不同变化速率的变化模式,这些变化模式在时域上相互叠加,使得时间序列的变化规律变得比较复杂,因此仅从时域的角度进行建模,难以有效地从复杂的规律中捕获其蕴含的多种相对简单的规律。提出一种基于自适应多级小波分解的神经网络方法AMWDNet,使用自适应小波分解建模时间序列中的多级时频信息,自适应小波分解模块能够同时从时域和频域的角度出发,对时间序列中蕴含的多种变化模式进行有效分解,通过使用长短期时间模式提取模块分别建模时间序列中的长期和短期时间模式。选取时间序列分类任务中8个主流的方法作为基准方法,在UCR数据集仓库中的8个数据集上进行对比实验,结果表明,AMWDNet在其中的7个数据集上取得了最高的分类准确率,相比于次优的基准方法提升了0.1~2.2个百分点,整体分类性能优于MLP和FCN等基准方法。
  • 胡璇, 邢凯, 李亚鸣, 王志勇, 邓洪武
    计算机工程. 2022, 48(4): 89-98. https://doi.org/10.19678/j.issn.1000-3428.0061188
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于卷积神经网络(CNN)的深度模型在图像识别与分类领域应用广泛,但在全局特征控制、概念层次特征不变性提取和变量之间的因果关系确定方面仍存在不足,使得深度模型缺乏灵活性、适应性及泛化性。基于因果干预和不变性,提出一种基于CNN深度模型的定向修剪和网络结构优化方法。通过对模型输入进行基于不变性的干预调制,根据生成的调制图片序列分析预训练网络卷积子结构的输出分布,筛选和定向修剪噪声敏感子结构。构建基于类间区分度的目标函数,借助经济学领域中的资本资产定价模型构建网络的层间连接,生成在单分类任务下能增大类间区分度的网络拓扑结构,逐层优化构建概念层次的稳定特征。在ImageNet-2012数据集上的实验结果表明,优化后的深度模型相比于ResNet50基线预训练模型的分类准确率约提升了5个百分点,并大幅降低了训练集规模。
  • 王萌铎, 续欣莹, 阎高伟, 史丽娟, 郭磊
    计算机工程. 2022, 48(4): 99-105,112. https://doi.org/10.19678/j.issn.1000-3428.0061001
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    宽度学习系统(BLS)是一种浅层的神经网络结构,具有快速训练、增量学习等特征,在处理类别不平衡数据时提取到的少数类别特征较少,导致识别结果不理想。提出一种基于AdaBoost集成加权宽度学习系统(AdaBoost-WBLS)的不平衡数据分类方法,通过迭代实现权重的动态更新,获得更符合数据特征的权重,提升集成模型对少数类的识别能力。基于KKT条件,对加权宽度学习系统的加权优化过程进行推导,验证了对角权重对BLS模型误差的抑制作用。在AdaBoost-WBLS模型集成初始化时,采用基于类别信息的初始化权值策略,使模型具有更高的集成训练效率。在集成权重更新时,不同数据类别采用不同的正则化更新方式,保留数据的类内特征并增加类间区分度。在实验过程中,对AdaBoost-WBLS模型的不同参数进行寻优,得到相关参数在有限范围内的最优取值。实验结果表明,AdaBoost-WBLS模型相比AdaBoost和BLS类相关模型能有效改善少数类别特征的提取能力,并且在Satimage数据集上相比加权过采样的深度自编码器模型的G-mean高出4.36个百分点,明显提升了不平衡数据的识别能力。
  • 刘雅丽, 史久根
    计算机工程. 2022, 48(4): 106-112. https://doi.org/10.19678/j.issn.1000-3428.0061217
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    网络功能虚拟化(NFV)通过将虚拟网络功能(VNF)部署在虚拟设备中,提高了网络管理的灵活性,但随着服务需求的扩大,网络供应商消耗的运营支出(OPEX)也不断增加。由于VNF改变流大小的特性、VNF间的依赖性以及组成和部署方式的复杂性,面向OPEX的VNF组成和部署问题充满挑战。提出一种面向成本的虚拟网络链组成和部署联合优化策略,将节点映射成本、链路映射成本、激活成本和能耗成本公式化为OPEX,构建混合整数非线性规划模型。为分析影响成本的不同因素,同时提高特殊依赖情况下的处理效率,根据不同依赖关系将VNF请求集分为完全无序、部分有序和完全有序VNF集合进行分析,并设计3种相应优化算法。实验结果表明,在完全无序、部分有序情况下,算法性能优于首次适应算法、随机拟合算法等同类算法,对于完全有序算法,当节点资源配比在50%以上时,可获得小规模网络下近似线性规划模型精确解的方案。
  • 张会云, 黄鹤鸣
    计算机工程. 2022, 48(4): 113-118. https://doi.org/10.19678/j.issn.1000-3428.0061076
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    提取能表征语音情感的特征并构建具有较强鲁棒性和泛化性的声学模型是语音情感识别系统的核心。面向语音情感识别构建基于注意力机制的异构并行卷积神经网络模型AHPCL,采用长短时记忆网络提取语音情感的时间序列特征,使用卷积操作提取语音空间谱特征,通过将时间信息和空间信息相结合共同表征语音情感,提高预测结果的准确率。利用注意力机制,根据不同时间序列特征对语音情感的贡献程度分配权重,实现从大量特征信息中选择出更能表征语音情感的时间序列。在CASIA、EMODB、SAVEE等3个语音情感数据库上提取音高、过零率、梅尔频率倒谱系数等低级描述符特征,并计算这些低级描述符特征的高级统计函数共得到219维的特征作为输入进行实验验证。结果表明,AHPCL模型在3个语音情感数据库上分别取得了86.02%、84.03%、64.06%的未加权平均召回率,相比LeNet、DNN-ELM和TSFFCNN基线模型具有更强的鲁棒性和泛化性。
  • 孙盼, 王琪, 万怀宇
    计算机工程. 2022, 48(4): 119-125. https://doi.org/10.19678/j.issn.1000-3428.0060781
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有脚本事件预测模型在事件表示时未充分考虑各个元素之间的相关性,且不能同时利用事件链和事理图谱中的信息进行事件预测。针对事件表示不全面和信息融合不充分的问题,提出一种结合事件链和事理图谱的脚本事件预测模型ECGNet。将每个事件的各个元素构造成一个短句,使用Transformer编码器捕获元素之间的序列信息,从而获得更准确的事件表示。在此基础上,构建一个长程时序模块(LRTO)学习事件链中的时序信息,同时构建一个全局事件演化模块(GEEP)捕获隐藏在事理图谱中的演化模式,通过门控注意力机制动态融合时序信息和演化模式进行脚本事件预测。基于纽约时报和新浪新闻两个数据集的实验结果表明,ECGNet能够有效融合事件链和事理图谱的信息进行脚本事件预测,与PMI、Bigram、SAM-Net、SGNN等模型相比,其准确率较最优值取得了3%以上的提升。
  • 网络空间安全
  • 王杰昌, 张平, 高远, 刘玉岭
    计算机工程. 2022, 48(4): 126-132. https://doi.org/10.19678/j.issn.1000-3428.0062010
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    电子投票与传统投票方式相比更具经济性,但存在安全性论证不够严谨、运行时间长、计算消耗较大等问题。提出融合可链接环签密的智能合约电子投票协议,分别设计投票、秘密份额上传、计票等阶段的算法,在投票阶段基于椭圆曲线离散对数问题生成选票的可链接环签密,并在一个逻辑步骤内实现加密和签名,以确保投票的公正性、机密性和可验证性,避免重复投票情况的发生,从总体上降低协议运行时间和计算消耗的gas。此外,详细分析协议的安全性,基于椭圆曲线上的离散对数问题证明选票环签密的不可伪造性。使用truffle框架将智能合约部署到本地以太坊私有网络上,并通过挖矿以确认交易完成。实验结果表明,与Lyu协议相比,该协议节省了约107 Gwei的计算消耗以及450 ms左右的运行时间。
  • 李贝贝, 彭力, 戴菲菲
    计算机工程. 2022, 48(4): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0060949
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    当前网络流量数据规模较大且分布不均衡,传统网络流量异常检测方法检测准确率较低。提出一种结合马氏距离和自编码器的检测方法,使用马氏距离倒数及判别阈值快速检测部分正常数据以减少训练数据量,同时,在自编码器代价函数中添加马氏距离度量项以增强自编码器的特征提取能力。在此基础上,将自编码器与分类器相结合以解决网络参数初始化问题,并通过调整自编码神经网络交叉熵损失函数中各项的权重,提高自编码神经网络对数据分布不均衡数据集的训练效果。实验结果表明,该方法在CICIDS2017数据集、NSL-KDD数据集上的异常检测准确率分别高达97.60%、99.84%,在CICIDS2017数据集上的F1值为0.941 3,高于DNN、LSTM、C-LSTM等方法。
  • 谷青竹, 董红斌
    计算机工程. 2022, 48(4): 143-147. https://doi.org/10.19678/j.issn.1000-3428.0061707
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    隐私保护数据挖掘(PPDM)利用匿名化等方法使数据所有者在不泄露隐私信息的前提下,安全发布在数据挖掘中有效可用的数据集。k-匿名算法作为PPDM研究使用最广泛的算法之一,具有计算开销低、数据形变小、能抵御链接攻击等优点,但是在一些k-匿名算法研究中使用的数据可用性评估模型的权重设置不合理,导致算法选择的最优匿名数据集在后续的分类问题中分类准确率较低。提出一种使用互信息计算权重的互信息损失(MI Loss)评估模型。互信息反映变量间的关联关系,MI Loss评估模型根据准标识符和标签之间的互信息计算权重,并通过Loss公式得到各个准标识符的信息损失,将加权后的准标识符信息损失的和作为数据集的信息损失,以弥补评估模型的缺陷。实验结果证明,运用MI Loss评估模型指导k-匿名算法能够明显降低匿名数据集在后续分类中的可用性丢失,相较于Loss模型和Entropy Loss模型,该模型分类准确率提升了0.73%~3.00%。
  • 李小剑, 谢晓尧, 徐洋, 张思聪
    计算机工程. 2022, 48(4): 148-157,164. https://doi.org/10.19678/j.issn.1000-3428.0061003
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统浅层机器学习方法在识别恶意TLS流量时依赖专家经验且流量表征不足,而现有的深度神经网络检测模型因层次结构复杂导致训练时间过长。提出一种基于CNN-SIndRNN端到端的轻量级恶意加密流量识别方法,使用多层一维卷积神经网络提取流量字节序列局部模式特征,并利用全局最大池化降维以减少计算参数。为增强流量表征,设计一种改进的循环神经网络用于捕获流量字节长距离依赖关系。在此基础上,采用独立循环神经网络IndRNN单元代替传统RNN循环单元,使用切片并行计算结构代替传统RNN的串行计算结构,并将两种类型深度神经网络所提取的特征拼接作为恶意TLS流量表征。在CTU-Maluware-Capure公开数据集上的实验结果表明,该方法在二分类实验上F1值高达0.965 7,在多分类实验上整体准确率为0.848 9,相比BotCatcher模型训练时间与检测时间分别节省了98.47%和98.28%。
  • 杨文雪, 吴非, 郭桐, 肖利民
    计算机工程. 2022, 48(4): 158-164. https://doi.org/10.19678/j.issn.1000-3428.0061470
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    深度神经网络在发展过程中暴露出的对抗攻击等安全问题逐渐引起了人们的关注和重视。然而,自对抗样本的概念提出后,针对深度神经网络的对抗攻击算法大量涌现,而深度神经网络自身的复杂性和不可解释性增大了防御攻击的难度。为了保证防御方法的普适性,以预处理方法为基本思路,同时结合对抗样本自身的特异性,提出一种新的对抗样本防御方法。考虑对抗攻击的隐蔽性和脆弱性,利用深度学习模型的鲁棒性,通过噪声溶解过程降低对抗扰动的攻击性和滤波容忍度。在滤波过程中,以对抗噪声贡献为依据自适应调整滤波范围及强度,有针对性地滤除对抗噪声,该方法不需要对现有深度学习模型进行修改和调整,且易于部署。实验结果表明,在ImageNet数据集下,该方法对经典对抗攻击方法L-BFGS、FGSM、Deepfool、JSMA及C&W的防御成功率均保持在80%以上,与JPEG图像压缩、APE-GAN以及图像分块去噪经典预处理防御方法相比,防御成功率分别提高9.25、14.86及14.32个百分点以上,具有较好的防御效果,且普适性强。
  • 图形图像处理
  • 何涛, 俞舒曼, 徐鹤
    计算机工程. 2022, 48(4): 165-172. https://doi.org/10.19678/j.issn.1000-3428.0060818
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    生成对抗网络广泛应用于图像去雾领域,但通常需要较大的计算量和存储空间,从而限制了其在移动设备上的应用。针对该问题,提出一种基于条件生成对抗网络与知识蒸馏的去雾方法KD-GAN。将频率信息作为去雾的附加约束条件,通过傅里叶变换、拉普拉斯算子、高斯滤波器分别滤除原始图像的高频或低频信息,生成对应的高频和低频图像,并将融合得到的图像作为判别器的输入,以改进雾天图像的去雾效果。在此基础上,将原重型教师网络的知识迁移到具有较少权值参数的轻量型学生网络生成器中,并对轻量型学生网络进行训练,使其以更快的收敛速度达到与教师网络相近的去雾性能。在OTS和HSTS数据集上的实验结果验证了该方法的有效性,在学生网络的参数规模仅为教师网络1/2的条件下,学生网络在迭代第3×104次时,生成器输出图像的峰值信噪比和结构相似性已接近于教师网络迭代第5×104次时的数值,训练速度加快了约1.67倍。
  • 朱旭东, 熊贇
    计算机工程. 2022, 48(4): 173-178,190. https://doi.org/10.19678/j.issn.1000-3428.0061072
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    图像多标签分类作为计算机视觉领域的重要研究方向,在图像识别、检测等场景下得到广泛应用。现有图像多标签分类方法无法有效利用标签相关性信息以及标签语义与图像特征的对应关系,导致分类能力较差。提出一种图像多标签分类的新算法,通过利用标签共现信息和标签先验知识构建图模型,使用多尺度注意力学习图像特征中目标,并利用标签引导注意力融合标签语义特征和图像特征信息,从而将标签相关性和标签语义信息融入到模型学习中。在此基础上,基于图注意力机制构建动态图模型,并对标签信息图模型进行动态更新学习,以充分融合图像信息和标签信息。在图像多标签分类任务上的实验结果表明,相比于现有最优算法MLGCN,该算法在VOC-2007数据集及COCO-2012数据集上的mAP值分别提高了0.6、1.2个百分点,性能有明显提升。
  • 林泓, 陈壮源, 任硕, 李琳, 李玉强
    计算机工程. 2022, 48(4): 179-190. https://doi.org/10.19678/j.issn.1000-3428.0060631
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在基于生成对抗网络的人脸属性迁移过程中,存在图像域表达形式单一、图像域迁移细节失真的问题。提出一种结合选择性传输单元与铰链对抗损失的多图像域人脸属性迁移方法。在生成器中,利用自适应实例归一化融合图像的内容信息与图像域控制器生成的样式信息,增加图像域表达方式的多样性,同时通过选择性传输单元将下采样提取的内容特征根据相对属性标签选择性地传输到上采样,形成融合特征以增强图像的细节信息。在判别器中,通过增加双尺度判别,协同鉴定人脸图像的真伪及类别,从而提高判定的准确度。在此基础上,设计融合相对鉴别和铰链损失的对抗损失函数,增强真伪图像域之间的联系。在CelebA数据集上的实验结果表明,与StarGAN、STGAN等主流的多图像域人脸属性迁移方法相比,该方法能够建立更准确的多图像域映射关系,提高迁移图像的质量同时增加迁移图像表达的多样性。
  • 周博超, 韩雨男, 桂志国, 李郁峰, 张权
    计算机工程. 2022, 48(4): 191-196,205. https://doi.org/10.19678/j.issn.1000-3428.0060582
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    低剂量计算机断层扫描(LDCT)能够有效降低X射线辐射对人体健康造成的危害,已广泛应用于医学临床诊断。针对LDCT图像中存在大量的斑点噪声和条形伪影的问题,提出一种结合改进的VGG网络和深层字典的图像去噪算法,以弥补深层字典去噪能力的不足。在深层字典学习到第一层字典原子和稀疏矩阵后,通过改进的VGG网络将字典原子区分为信息原子和噪声原子,同时将稀疏矩阵中噪声原子所对应的元素设置为零,降低噪声原子对图像去噪效果的影响。实验结果表明,与K-SVD算法、正则化K-SVD算法和深层字典学习算法相比,该算法的峰值信噪比和结构相似性指数平均提高了1.4 dB和0.03,能够有效抑制LDCT图像噪声和伪影,且保留较多的边缘和细节信息。
  • 陈璐瑶, 刘奇龙, 许云霞, 陈震
    计算机工程. 2022, 48(4): 197-205. https://doi.org/10.19678/j.issn.1000-3428.0060601
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对非负张量分解应用于图像聚类时忽略了高维数据内部几何结构的问题,在经典的张量非负Tucker分解的基础上,添加超图正则项以尽可能多地保留原始数据的内在几何结构信息,提出一种基于超图正则化非负Tucker分解模型HGNTD。通过构造超图刻画数据内部样本间的高阶关系,提高几何结构描述的准确性,针对超图正则化非负张量分解模型,基于交替非负最小二乘法,设计快速有效的超图正则化非负Tucker分解算法求解所给模型,证明算法在非负的条件下是收敛的,最终将算法应用于图像聚类。在Yale和COIL两个常用公开数据集上的实验结果表明,相对于k-means、非负矩阵分解、图正则化非负矩阵分解、非负Tucker分解和图正则化非负Tucker分解等算法,超图正则化非负Tucker分解算法聚类准确度提升了8.6%~11.4%,归一化互信息提升了2.0%~7.5%,具有更好的聚类效果。
  • 张云帆, 易尧华, 汤梓伟, 王新宇
    计算机工程. 2022, 48(4): 206-212,222. https://doi.org/10.19678/j.issn.1000-3428.0062998
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对文本生成图像任务中生成图像细节缺失及低分辨率阶段生成图像存在结构性错误的问题,基于动态注意力机制生成对抗网络(DMGAN),引入内容感知上采样模块和通道注意力卷积模块,提出一种新的文本生成图像方法ECAGAN。在低分辨率图像生成阶段的特征图上采样过程中采用基于内容感知的上采样方法,通过输入特征图计算得到重组卷积核,使用重组卷积核和特征图进行卷积操作,确保上采样后的特征图和文本条件的语义一致性,使生成的低分辨率图像更加准确,利用通道注意力卷积模块学习特征图各个特征通道的重要程度,突出重要的特征通道,抑制无效信息,使生成图像的细节更丰富。此外在训练过程中结合条件增强和感知损失函数辅助训练,增强训练过程的鲁棒性,提高生成图像质量。在CUB-200-2011数据集上的实验结果表明,ECAGAN模型初始分数达到了4.83,R值达到了75.62,与DMGAN方法相比,分别提高了1.6%和4.6%,并且可改善生成图像结构错乱的问题,同时能够生成清晰的图像细节,语义一致性更高,更加接近真实图像。
  • 路东生, 张玉金, 党良慧
    计算机工程. 2022, 48(4): 213-222. https://doi.org/10.19678/j.issn.1000-3428.0061039
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着图像篡改工具的智能化发展,图像篡改不再局限于拼接、移除等某一具体的类型,往往包含多种篡改类型及其组合操作,使得图像篡改取证工作更具挑战性。提出一种端到端的多特征融合U形深度网络,利用编解码网络提取篡改区域与真实区域之间的对比度差异、边缘差异等篡改痕迹,并使用富隐写模型卷积层获取伪造图像的噪声分布不规律信息,从而在无预处理的情况下实现可疑区域的检测并分割出高置信度的篡改区域。在此基础上,使用特征提取模块获取融合的篡改特征,在融合定位模块中利用分级监督策略融合不同分辨率提取的篡改特征,以准确定位篡改区域,实现篡改区域检测与像素级的分割。实验结果表明,基于所提网络的图像篡改取证方法在NIST16和CASIA数据库上的F1值分别为0.841和0.605,与基于MFCN、RGB-N、MANTRA-net等网络的图像篡改取证方法相比,有较优的检测性能和较高的实时性,且对JPEG压缩、缩放等处理具有更强的鲁棒性。
  • 赵秀锋, 魏伟一, 陈金寿, 陈帼
    计算机工程. 2022, 48(4): 223-230,239. https://doi.org/10.19678/j.issn.1000-3428.0060758
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    图像拼接将来源不同的图像合并成一幅图,由此引起图像中光照方向、噪声等特性出现不一致的情况。目前多数方法根据拼接图像中噪声的不一致性来检测伪造区域,但是普遍对不同大小图像块的噪声估计准确性不高,导致真阳性率较低,且当噪声差异较小时会检测失败。针对该问题,提出一种基于自适应四元数奇异值分解(QSVD)的噪声估计方法。对图像进行超像素分割,利用自适应QSVD估计超像素的噪声,结合图像亮度并利用多项式拟合建立图像噪声-亮度函数,得到各超像素到该函数曲线的最小距离测度。为提高检测精确率,利用色温估计算法提取超像素的色温特征,将距离测度与色温特征相融合作为最终的特征向量,利用FCM模糊聚类定位拼接区域。在Columbia IPDED拼接图像数据集上进行实验,结果表明,该方法在未经后处理图像集上的检测TPR值较对比方法至少提升8.21个百分点,且对高斯模糊、JPEG压缩和伽马校正表现出较好的鲁棒性。
  • 王红霞, 何国昌, 李玉强, 陈德山
    计算机工程. 2022, 48(4): 231-239. https://doi.org/10.19678/j.issn.1000-3428.0060988
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    文本图像二值化是光学字符识别的关键步骤,但低质量文本图像背景噪声复杂,且图像全局上下文信息以及深层抽象信息难以获取,使得最终的二值化结果中文字区域分割不精确、文字的形状和轮廓等特征表达不足,从而导致二值化效果不佳。为此,提出一种基于改进U-Net网络的低质量文本图像二值化方法。采用适合小数据集的分割网络U-Net作为骨干模型,选择预训练的VGG16作为U-Net的编码器以提升模型的特征提取能力。通过融合轻量级全局上下文块的U-Net瓶颈层实现特征图的全局上下文建模。在U-Net解码器的各上采样块中融合残差跳跃连接,以提升模型的特征还原能力。从上述编码器、瓶颈层和解码器3个方面分别对U-Net进行改进,从而实现更精确的文本图像二值化。在DIBCO 2016—2018数据集上的实验结果表明,相较Otsu、Sauvola等方法,该方法能够实现更好的去噪效果,其二值化结果中保留了更多的细节特征,文字的形状和轮廓更精确、清晰。
  • 胡宗承, 周亚同, 史宝军, 何昊
    计算机工程. 2022, 48(4): 240-246. https://doi.org/10.19678/j.issn.1000-3428.0060912
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    卷积神经网络在手势识别领域应用广泛,但现有的卷积神经网络存在特征表征不足的问题,导致手势识别精度较低。提出一种轻量级静态手势识别算法r-mobilenetv2,通过串联通道注意力与空间注意力,将两者输出的特征图以跳跃连接的形式线性相加,得到一种全新的注意力机制。使用一维卷积调整低层特征的通道维度,将低级特征与经过上采样的高层特征进行空间维度匹配及通道维度匹配,并进行线性相加,其结果经卷积操作后与高层特征按通道维度连接,从而实现特征融合。在此基础上,将所提注意力机制与特征融合相结合,并用于改进后的轻量级网络MobileNetV2中,得到r-mobilenetv2算法。实验结果表明,与MobileNetV2算法相比,r-mobilenetv2算法的参数量降低了27%,错误率下降了1.82个百分点。
  • 开发研究与工程应用
  • 梁智滨, 赵文义, 李灵巧, 杨辉华
    计算机工程. 2022, 48(4): 247-254,261. https://doi.org/10.19678/j.issn.1000-3428.0060856
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    准确检测并去除刀具边缘粘连的附着物是刀具显微图像豁口检测领域的一个难题,目前仍存在刀具边缘恢复不完整、附着物去除失败等问题。提出一种附着物去除的ARNet网络,采用二值掩膜引导模块区分目标与背景特征,利用去除过程的学习模块提取递归过程中的时序信息,并通过自注意力精准分离模块中的编解码结构和自注意力机制,建立附着物特征在全局特征中的依赖关系,以精准去除附着物,从而整合特征并输出无附着物图像。从实际采集的刀具刃口显微图像中裁剪含附着物区域的图像并构成数据集,在此数据集上的实验结果表明,与PReNet网络相比,该网络的峰值信噪比提高了1.016 dB,交并比IOU提升了3.48%,参数量和计算量分别减少了86.5%、90.9%,能够精确聚焦附着物区域,完整地还原刀具的真实边缘,提高了豁口检测准确率,且增强了刀具豁口高精度检测系统的稳定性和可靠性。
  • 候瑞环, 杨喜旺, 王智超, 高佳鑫
    计算机工程. 2022, 48(4): 255-261. https://doi.org/10.19678/j.issn.1000-3428.0060563
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现有基于深度学习的林业昆虫图像检测方法存在检测精度低和检测速度慢的问题,提出一种结合改进PANet结构与三分支注意力机制的目标检测方法YOLOv4-TIA。通过对样本数量较少的昆虫类别进行数据增强,实现样本均衡分布。利用三分支注意力机制改进YOLOv4中的CSPDarkNet53骨干网络,同时通过旋转操作和残差变换建立维度间的依存关系,以提高有效的特征通道权重,在PANet结构上增加将跳跃连接与跨尺度连接相结合的特征融合方式,从而获取更丰富的语义信息和位置信息。在此基础上,采用Focal loss函数优化分类损失,解决正负样本不均衡的问题。实验结果表明,该方法的精确率和召回率分别达到85.9%和91.2%,相比SSD、Faster R-CNN、YOLOv4方法,其在保证检测速度的同时,能够有效提高检测精度,且实现对林业害虫的实时精确监测。
  • 倪童, 桑庆兵
    计算机工程. 2022, 48(4): 262-268. https://doi.org/10.19678/j.issn.1000-3428.0061107
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    课堂教学是整个教育任务中的重要环节,教育信息化的发展为提升教学管理水平提供了更多方案。为加强教学情况正反馈,提高课堂抬头率检测的准确性,提出一种结合注意力机制和特征融合的新型检测算法。将原图及视觉特征RGB difference作为网络输入,令其经过特征提取网络后得到信息更丰富的深层特征。在此基础上,提出一种改进的注意力模型(ICBAM)并加载至特征提取网络上,ICBAM使用通道注意力模块和空间注意力模块并行的双流结构,提升网络的特征提取能力。在通道注意力和空间注意力中加入空洞卷积以过滤输入特征中的冗余特征,减少网络对背景等无用特征的关注。此外,设计精炼模块优化预测结果,并在所提算法的基础上实现课堂行为分析软件的开发与应用。实验结果表明,该算法在抬头率检测数据集RDS上的平均抬头率误差为15.648%,相比于SolvePnP等主流检测算法具有更低的误差率。
  • 唐佳敏, 韩华, 黄丽
    计算机工程. 2022, 48(4): 269-275,283. https://doi.org/10.19678/j.issn.1000-3428.0060811
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    行人再识别研究中存在特征判别信息不够丰富的情况,并且遮挡、光照等因素会干扰有效特征的准确提取,对后续相似性度量、度量结果排序等工作都有较大影响。此外,监督学习需要使用标签信息,在面对大型数据集时工作量很大。通过引入无监督学习框架,提出一种粗细粒度判别性特征提取方法。构建基于细粒度和粗粒度特征学习的模型框架,其中包含局部和全局2个分支。在局部分支中,对图像学习到的特征映射提取补丁块,并在未标记数据集上学习不同位置的细粒度补丁特征;在全局分支中,使用无标注数据集的相似度和多样性作为信息来学习粗粒度特征。在此基础上,利用相吸和相斥2个损失函数分别增加类别内相似度和类别间多样性,并结合最小距离准则计算特征之间的相似度,进行无监督的聚类合并。在Market-1501和DukeMTMC-reID数据集上的实验结果表明,该方法对于完成行人再识别任务具有较好的判别性能和鲁棒性,相比所有对比方法的最优结果,其Rank-1指标分别提高5.76%和5.07%,平均精度均值分别提高3.2%和5.6%。
  • 李忠智, 尹航, 左剑凯, 孙一凡
    计算机工程. 2022, 48(4): 276-283. https://doi.org/10.19678/j.issn.1000-3428.0058696
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    船舶检测与识别技术的发展对海上监视及服务工作起重要作用,目前卫星遥感图像船舶目标检测存在背景复杂、船舶尺度变化大等问题,妨碍了海上威胁事件的预测及海上工作效率的提高。提出一种融合多尺度特征信息的目标检测模型,采用UNet++网络进行目标检测提取卫星图像特征,并将全局信息和细粒度信息相融合生成具有高空间精度的中间特征图。在此基础上,使用MSOF策略融合不同语义层次的特征信息,生成最终的检测特征图,以提高船舶目标检测与识别的精度,并通过将二元交叉熵损失函数与Dice系数损失函数结合使用,降低数据集中样本不均衡对模型准确度的影响。基于空客船舶数据集的实验结果表明,该模型能够对遥感图像中的船舶目标进行精准的检测识别,其Dice系数、IOU系数评估值分别为97.3%、96.8%,优于ResNet-34、UNet++等模型。
  • 张磊, 王小龙, 刘畅
    计算机工程. 2022, 48(4): 284-291,298. https://doi.org/10.19678/j.issn.1000-3428.0063218
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对经典马尔可夫随机场(MRF)在进行高分辨率SAR图像分割时存在容易受到斑点噪声干扰等问题,提出一种基于建筑物指数相似度距离及MRF模型(BISD-MRF)的高分辨率SAR建筑物分割算法。基于较复杂SAR场景下建筑物目标可能呈现多种形态结构的问题,设计一种多尺度显著性建筑物指数(MSBI)方案来提取建筑物目标的显著性特征,并通过强度信息重构、纹理显著性提取、频谱显著性信息统计来分别提取不同类型区域的显著性信息,构建适用于SAR建筑物目标的显著性模型。在此基础上,将MSBI值引入到改进的基于改进余弦函数的势函数模型中,利用余弦函数对邻域像素MSBI值进行相似性度量,同时利用特征空间语义信息对像素及其邻域像素标签信息进行有效约束,以提升势函数模型对高分辨率SAR建筑物目标的表征能力。不同平台下的建筑物分割实验结果表明,与MRF、MBI、FRFCM等算法相比,本文算法分割性能平均提升了4.3~10.7个百分点,更适用于较复杂场景下高分辨率SAR建筑物的分割任务。
  • 刘晓蓉, 李小霞, 秦昌辉
    计算机工程. 2022, 48(4): 292-298. https://doi.org/10.19678/j.issn.1000-3428.0061508
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    行人重识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。受行人姿态、遮挡、光照变化等因素的影响,传统的行人重识别方法中特征的表达能力有限,导致准确率降低,提出一种融合不同尺度对比池化特征的行人重识别方法。利用残差网络ResNet50提取行人图像的多尺度特征,在网络的不同层次上,通过对输入的特征进行全局平均池化和最大平均池化,将每组平均池化特征和最大池化特征相减,对相减得到的差异特征与最大池化特征进行相加,获得具有强判别性的对比池化特征。在此基础上,利用三元组损失和交叉熵损失联合优化模型,提高模型的泛化能力,同时采用重排序技术优化网络性能。实验结果表明,该方法在Market1501和DukeMTMC-reID数据集上的首位命中率分别达到96.41%和91.43%,平均精度均值为94.52%和89.30%,相比SVDNet、GLAD和PCB等方法,其行人重识别的准确率较高。
  • 宋玮, 赵会奋, 蔡文钦, 周万强
    计算机工程. 2022, 48(4): 299-306. https://doi.org/10.19678/j.issn.1000-3428.0060237
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在V2V环境下的虚拟交通灯可以通过车辆间直接交换的信息协商路权分配,且在设备获取相关信息时,车辆能够有策略地提供信息以获得优先路权。为适用于非可测量因素影响路权的场景,提出一种具有组策略防护特性的虚拟交通灯。通过将车辆提供的真实信息抽象为成本分摊与合作博弈,并设计组策略防护拍卖机制,利用Shapley值计算出每辆车的成本分摊作为车辆的支付。在此基础上,根据拍卖结果中真实的评价值建立绿灯信号,通过信号合并算法整合多次拍卖产生的绿灯信号,由此产生合理的路权分配。实验结果表明,该虚拟交通灯具有组策略防护特性,能够避免车辆形成虚报信息的联盟来获取利益,也能避免车辆通过虚报私有信息来获得路权优先权,与具有固定绿灯通行数量阈值的虚拟交通灯相比,组策略防护的虚拟交通灯在整体平均行驶时间以及高评价值车辆的平均行驶时间上均有一定改善。
  • 王志江, 秦品乐, 柴锐, 武峰, 程一彤, 史玥
    计算机工程. 2022, 48(4): 307-313. https://doi.org/10.19678/j.issn.1000-3428.0061934
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    食物嵌塞是口腔常见病征,容易引发局部牙龈红肿、溢脓、龋齿等口腔问题,给患者带来极大的痛苦和不便。目前临床上难以自动筛查嵌塞牙齿,且传统的锥形束CT重建方法的准确度及精度均有待提高。提出一种牙齿嵌塞自动化判断的方法,对牙齿模型进行单个牙体的精准分割,在U-Net网络的基础上使用KPConv卷积核代替二维卷积核来构建分割网络,并使用图割方法优化分割结果。同时,采用平面拟合的方法将分割后的牙齿模型投影到水平和竖直平面上,在平面上求出牙齿嵌塞特征,并利用支持向量机根据所求特征对牙齿的嵌塞情况进行判断。通过充分利用样本模型的几何结构信息,设计简化牙齿模型的几何采样及包含牙齿几何结构约束的图割方法提高网络模型的运算时间及精度。实验结果表明,该方法对牙齿模型的分割准确率为92%,对牙齿嵌塞的判断正确率为81%,能够为医生提供辅助诊断。
  • 王强, 林友芳, 万怀宇
    计算机工程. 2022, 48(4): 314-320. https://doi.org/10.19678/j.issn.1000-3428.0061098
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    快件送货时间预测(即在任何时间预测包裹送达的到达时间)是物流领域中最重要的服务之一。准确地预测快件送达时间可以为用户提供更准时的服务,缓解客户的等待焦虑,提升用户体验,且有利于快递员的路径规划,从而提高派送效率。然而在快递派送场景下,多因素、动态性及多目的地等特征给快件投递准确预测送达时间带来巨大挑战。提出一种基于多任务学习的模型MTDTN,从快递员的大量历史时空轨迹中预测快件送达时间。MTDTN建模多种影响送达时间的外部因素,利用地理信息编码、卷积操作以及双向长短时记忆网络来捕获派送行为的时空关系,并运用多任务学习框架,引入顺序预测的辅助任务与送达时间预测的主任务,提高模型预测性能。在真实数据集上的实验结果表明,与基准方法中最优的DeepETA模型相比,该模型的平均绝对误差与平均绝对百分比误差分别降低了16.11%和12.88%,模型效果明显提升。