作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2022年, 第48卷, 第10期 刊出日期:2022-10-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2022, 48(10): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 尹晨阳, 职恒辉, 李慧斌
    计算机工程. 2022, 48(10): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0064294
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    双目立体匹配是计算机视觉领域的经典问题,在自动驾驶、遥感、机器人感知等诸多任务中得到广泛应用。双目立体匹配的主要目标是寻找双目图像对中同名点的对应关系,并利用三角测量原理恢复图像深度信息。近年来,基于深度学习的立体匹配方法在匹配精度和匹配效率上均取得了远超传统方法的性能表现。将现有基于深度学习的立体匹配方法分为非端到端方法和端到端方法。基于深度学习的非端到端方法利用深度神经网络取代传统立体匹配方法中的某一步骤,根据被取代步骤的不同,该类方法被分为基于代价计算网络、基于代价聚合网络和基于视差优化网络的3类方法。基于深度学习的端到端方法根据代价体维度的不同可分为基于3D代价体和基于4D代价体的方法。从匹配精度、时间复杂度、应用场景等多个角度对非端到端和端到端方法中的代表性成果进行分析,并归纳各类方法的优点以及存在的局限性。在此基础上,总结基于深度学习的立体匹配方法当前面临的主要挑战并展望该领域未来的研究方向。
  • 刘新, 胡翔瑜, 徐刚, 陈秀波
    计算机工程. 2022, 48(10): 13-20. https://doi.org/10.19678/j.issn.1000-3428.0063861
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在区块链数据存储与查询过程中,由于区块链的透明性和公开性,全网所有用户均有可能获取查询者的数据信息,存在泄漏查询者隐私数据的风险。采用区块链链上-链下存储思想,设计区块链数据存储模型,引入代理重加密机制,将存储者加密后的数据分布式存储在链下,将存储者发送的索引信息和Merkle树根哈希值存储在链上,确保了数据的完整性、可靠性和可验证性,并减少了区块链数据对存储资源的占用。利用椭圆曲线加密算法设计区块链数据保密查询的不经意传输协议,使得全网所有用户均无法获取查询者的数据信息,保护了区块链数据传输过程中查询者的隐私。分析结果表明,该协议中查询者完成一次区块链上的不经意传输仅需2n+2k+2次椭圆曲线乘法运算,相比于现有不经意传输协议具有存储空间小、计算复杂度低等优势,并且在相同长度的密钥下具有更高的安全性。
  • 黄胜, 向思皓, 胡峰, 马婷, 卢冰
    计算机工程. 2022, 48(10): 21-27,36. https://doi.org/10.19678/j.issn.1000-3428.0063208
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为缓解无线胶囊内镜图像在电子设备以及服务器中的存储压力,提出一种自适应不规则纹理的无损压缩算法。在图像块内,利用扩展角度预测模式寻找与待预测像素最邻近的5个参考像素,并给其中3个参考像素分配不同权重,同时根据邻近像素值梯度变化规律,扩大待预测像素在不规则纹理方向上的预测值选择范围,基于图像块的最小信息熵选择最优的预测值,将真实值与预测值作差获得预测残差,以适应不规则纹理图像。利用跨分量预测模式选择最优的预测系数,构建符合图像块内预测残差分布规律的线性关系,从而消除当前编码像素中3个分量的冗余数据。结合Deflate算法对经多角度预测模式与跨分量预测模式预测后的剩余残差进行熵编码。实验结果表明,该算法在Kvasir-Capsule数据集上的无损压缩比平均为5.81,相比WebP、SAP、MDIP等算法,具有较优的压缩性能,能够有效提高图像的冗余消除率,其中相较WebP算法的冗余消除率提高约1.9%。
  • 郭克友, 贺成博, 王凯迪, 王苏东, 李雪, 张沫
    计算机工程. 2022, 48(10): 28-36. https://doi.org/10.19678/j.issn.1000-3428.0063344
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为保持行人在新型冠状病毒肺炎(COVID-19)疫情下的安全社交距离,有效控制和预防疫情传播,构建一种基于YOLOv4的安全社交距离风险评估模型。利用微调后的YOLOv4算法对行人进行目标提取,获取行人关键点,并将行人连续运动视为质点的连续运动,结合DeepSort算法实现对行人的跟踪处理。在此基础上,建立视觉坐标系,在鸟瞰视角下提出运动矢量分析算法计算和判断行人运动方向并评估行人的安全社交距离。在牛津城市中心的数据集上评估模型有效性,实验结果表明,微调后YOLOv4算法在行人检测中平均精度均值达到90.33%,行人社交距离风险评估准确率达到88.23%,性能优于Fast R-CNN、Faster R-CNN、YOLOv3和YOLOv4算法,表明所提模型能够有效提升安全社交距离的检测准确性。
  • 王丽娟, 张霖, 尹明, 郝志峰, 蔡瑞初, 温雯
    计算机工程. 2022, 48(10): 37-44,54. https://doi.org/10.19678/j.issn.1000-3428.0063091
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    挖掘多视图一致性是提升多视图聚类性能的关键,为更好地从多视图数据中学习一致性表示,提出一种新的多视图聚类算法OMTSC。OMTSC算法同时学习每个视图的聚类分配矩阵和特征嵌入,并将聚类分配矩阵分解为共享正交基矩阵和聚类编码矩阵。正交基矩阵可捕获并储存多视图一致性信息形成潜在聚类中心,经过加权融合的多视图聚类编码矩阵可更好地平衡不同视图的质量差异。引入基于二部图的协同聚类,实现正交基、聚类编码和特征嵌入3个矩阵的知识相互迁移,以提升多视图数据一致性和多样性,并利用特征嵌入的多样性最大化多视图一致性学习最优的潜在聚类中心,从而提高多视图聚类的性能。此外,基于群稀疏约束的特征嵌入可有效消除多视图数据中的噪声,提升算法的鲁棒性。在WikipediaArticles、COIL20和ORL数据集上的实验结果表明,与SC-Best、Co-Reg等先进的多视图聚类算法相比,OMTSC算法在ACC、NMI、ARI 3个评价指标上整体取得最优值,其中在COIL20和ORL数据集中的NMI评价指标均高于0.9。
  • 赵宏, 郭岚, 陈志文, 郑厚泽
    计算机工程. 2022, 48(10): 45-54. https://doi.org/10.19678/j.issn.1000-3428.0063294
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现有视频内容文本表述模型存在生成的文本表述单一、准确率不高等问题,提出一种融合帧级图像及音频信息的视频内容文本表述模型。基于自注意力机制设计单模态嵌入层网络结构,并将其嵌入单模态特征中学习单模态特征参数。采用联合表示、协作表示两种方法对单模态嵌入层输出的高维特征向量进行双模态特征融合,使模型能关注视频中不同目标间的交互关系,从而生成更加丰富、准确的视频文本表述。使用大规模数据集对模型进行预训练,并提取视频帧、视频所携带的音频等表征信息,将其送入编解码器实现视频内容的文本表述。在MSR-VTT和LSMDC数据集上的实验结果表明,所提模型的BLEU4、METEOR、ROUGEL和CIDEr指标分别为0.386、0.250、0.609和0.463,相较于MSR-VTT挑战赛中IIT DeIhi发布的模型,分别提升了0.082、0.037、0.115和0.257,能有效提升视频内容文本表述的准确率。
  • 人工智能与模式识别
  • 赵丹枫, 姚贤标, 包晓光, 黄冬梅, 郭伟其
    计算机工程. 2022, 48(10): 55-66. https://doi.org/10.19678/j.issn.1000-3428.0062639
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    k核查询是一种社团查询,由于其可以在线性时间内被有效计算,因此在社团检测中具有较广泛的应用。图中边的权值在很多场景下具有较强的语义关系,但现有研究较少考虑图中边的权值。为提升k核查询的效率,在k核的基础上定义加权图中的紧密k核子图查询(CRKSQ)问题,并使用归约方法证明该问题是NP-难的。基于贪婪策略设计启发式算法CRK-G,通过迭代删除节点为CRKSQ问题找到一个近似解。在此基础上,从降低图规模和减少迭代次数两方面研究CRK-G算法的优化策略,分别提出使用图压缩策略的算法CRK-C及使用单次多节点删除策略的算法CRK-F。在Bio-GRID、Email-Enron、DBLP 3个数据集上的实验结果表明,相对于CRK-G算法,CRK-C、CRK-F算法在查询速度上有较大的提升,且平均误差均在8%以内。
  • 刘高军, 李亚欣, 段建勇
    计算机工程. 2022, 48(10): 67-72,80. https://doi.org/10.19678/j.issn.1000-3428.0062206
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    预训练语言模型在机器阅读理解领域具有较好表现,但相比于英文机器阅读理解,基于预训练语言模型的阅读理解模型在处理中文文本时表现较差,只能学习文本的浅层语义匹配信息。为了提高模型对中文文本的理解能力,提出一种基于混合注意力机制的阅读理解模型。该模型在编码层使用预训练模型得到序列表示,并经过BiLSTM处理进一步加深上下文交互,再通过由两种变体自注意力组成的混合注意力层处理,旨在学习深层语义表示,以加深对文本语义信息的理解,而融合层结合多重融合机制获取多层次的表示,使得输出的序列携带更加丰富的信息,最终使用双层BiLSTM处理输入输出层得到答案位置。在CMRC2018数据集上的实验结果表明,与复现的基线模型相比,该模型的EM值和F1值分别提升了2.05和0.465个百分点,能够学习到文本的深层语义信息,有效改进预训练语言模型。
  • 史占堂, 马玉鹏, 赵凡, 马博
    计算机工程. 2022, 48(10): 73-80. https://doi.org/10.19678/j.issn.1000-3428.0062525
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于多头自注意力机制的Transformer作为主流特征提取器在多种自然语言处理任务中取得了优异表现,但应用于命名实体识别任务时存在一字多词、增加额外存储与词典匹配时间等问题。提出一种CNN-Head Transformer编码器(CHTE)模型,在未使用外部词典和分词工具的基础上,通过自注意力机制捕获全局语义信息,利用不同窗口大小的CNN获取Transformer中6个注意力头的Value向量,使CHTE模型在保留全局语义信息的同时增强局部特征和潜在词信息表示,并且应用自适应的门控残差连接融合当前层和子层特征,提升了Transformer在命名实体识别领域的性能表现。在Weibo和Resume数据集上的实验结果表明,CHTE模型的F1值相比于融合词典信息的Lattice LSTM和FLAT模型分别提升了3.77、2.24和1.30、0.31个百分点,具有更高的中文命名实体识别准确性。
  • 方义秋, 刘飞, 葛君伟
    计算机工程. 2022, 48(10): 81-87,94. https://doi.org/10.19678/j.issn.1000-3428.0063198
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    对文本中的上下文信息进行充分利用能够提高关系抽取性能,但当前多数基于深度学习的关系抽取方法仅捕获文本序列中的浅层特征信息,在长序列文本中易丢失上下文信息。针对传统LSTM中输入和隐藏状态之间相互独立且缺少信息交互的问题,建立一种基于Mogrifier LSTM的序列标注关系抽取模型。将由词嵌入、字符嵌入和位置嵌入构成的嵌入层结果输入Mogrifier LSTM层,该层通过在传统LSTM计算之前交替地让当前输入与之前隐藏状态进行多轮运算,以增强上下文交互能力。使用自注意力机制提高模型对重要特征的关注度,同时采用基于关系的注意力机制获取特定关系下的句子表示,从而解决实体关系重叠问题。在关系分类模块,利用Bi-LSTM进行序列标注,将句子中的每个词汇映射为相应的标签。实验结果表明,在NYT数据集上该模型的F1值达到0.841,优于HRL、OrderRL等模型,在存在SEO重叠类型的关系抽取中,F1值仍能达到0.745,所提模型能够在一定程度上解决关系重叠问题同时有效提升关系抽取性能。
  • 陆怡, 王鹏, 汪卫
    计算机工程. 2022, 48(10): 88-94. https://doi.org/10.19678/j.issn.1000-3428.0062832
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    时间序列是对某个事物或系统进行连续同间隔测量得到的数值序列,挖掘时间序列中潜在的语义信息对于发现系统运行规律或识别系统突发异常至关重要,然而目前多数时间序列语义挖掘算法对于时间序列数据特征有一定的约束条件,难以处理海量且特征各异的时间序列数据。针对该问题,提出一种基于子序列相似性的时间序列语义挖掘算法。通过计算子序列的相似性,将时间序列分割成片段序列进行两级聚类,识别出时间序列中潜在的物理状态。引入基于概率的迭代模式,根据候选分段情况动态调整子序列被选为参考子序列的概率,保证参考子序列涵盖全部物理状态。实验结果表明,该算法在PAMAP、Barbet等5个真实数据集上的识别准确率均超过90%,相比于FLUSS、pHMM、AutoPlait算法具有更高的识别准确率与运行效率以及更强的通用性。
  • 曾茜, 韩华, 马媛媛
    计算机工程. 2022, 48(10): 95-102. https://doi.org/10.19678/j.issn.1000-3428.0062847
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在具有模体特征的食物链网络、社交网络中,局部朴素贝叶斯(LNB)的链路预测方法通过准确区分每个共邻节点的贡献以提高链路预测的精确度,但忽略了每个共邻节点对所在路径的贡献不同以及网络模体结构对链接形成的作用。针对LNB链路预测方法存在的局限性问题,结合路径模体特征与朴素贝叶斯理论,提出基于模体的朴素贝叶斯链路预测方法。定义模体密度以量化路径结构上模体的聚集程度。考虑路径结构上模体密度对链接形成的影响,构建每条路径的角色贡献函数,以量化每条路径结构的模体特征对节点相似性的影响。在此基础上,根据朴素贝叶斯理论与角色贡献函数推导节点相似性指标。在Football、USAir、C.elegans、FWMW、FWEW和FWFW 6个真实网络上进行实验,结果表明,该方法能有效提高预测性能且具有较优的鲁棒性,其中在具有显著模体特征的FWMW、FWEW、FWFW网络上,相比现有相似性指标中较优的Katz指标,所提相似性指标的AUC值提升了2%~7%。
  • 柏财通, 崔翛龙, 李爱
    计算机工程. 2022, 48(10): 103-109. https://doi.org/10.19678/j.issn.1000-3428.0062812
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    当联邦学习(FL)算法应用于鲁棒语音识别任务时,为解决训练数据非独立同分布(Non-IID)与客户端模型缺乏个性化问题,提出基于个性化本地蒸馏的联邦学习(PLD-FLD)算法。客户端通过上行链路上传本地Logits并在中心服务器聚合后下传参数,当边缘端模型测试性能优于本地模型时,利用下载链路接收中心服务器参数,确保了本地模型的个性化与泛化性,同时将模型参数与全局Logits通过下行链路下传至客户端,实现本地蒸馏学习,解决了训练数据的Non-IID问题。在AISHELL与PERSONAL数据集上的实验结果表明,PLD-FLD算法能在模型性能与通信成本之间取得较好的平衡,面向军事装备控制任务的语音识别准确率高达91%,相比于分布式训练的FL和FLD算法具有更快的收敛速度和更强的鲁棒性。
  • 江旭, 钱雪忠, 宋威
    计算机工程. 2022, 48(10): 110-115,122. https://doi.org/10.19678/j.issn.1000-3428.0062891
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    实体关系抽取是从非结构化和程序化的海量文本中识别出实体之间的语义关系,为本体构建、智能检索等任务提供数据支持,然而现有远程监督关系抽取方法普遍存在需要大量人工标注语料库、提取特征含有噪声且忽略了实体与句子之间关联关系等问题。提出一种基于残差双向长短时记忆网络(BiLSTM)与句袋内和句袋间注意力机制的关系抽取模型,在将词向量和位置向量作为模型输入的基础上,通过残差BiLSTM网络提取语句与实体词中的长距离文本信息,利用句袋内和句袋间注意力机制对提取到的特征信息进行处理,使模型在远程监督过程中减少实体之间的特征提取噪声,并提高模型识别准确性。在NYT数据集上的实验结果表明,该模型能够充分利用实体与关系特征,平均精确率达到86.2%,相比于将卷积神经网络和分段卷积神经网络作为句子编码器的同类模型具有更好的远程监督关系抽取性能。
  • 孙亚茹, 杨莹, 王永剑
    计算机工程. 2022, 48(10): 116-122. https://doi.org/10.19678/j.issn.1000-3428.0062902
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    解决多源知识对齐和知识冗余问题是在开放数据域自动构建知识图谱的关键。建立一种融合知信学习与深度学习的知识图谱自动构建模型。分析图卷积神经网络(GCN)模型与知信学习之间的理论联系,以先验知识与深度学习相结合的方式构建实体语义联合空间,将先验知识对模型的干预形式化,并利用自动编码器实现一个细粒度的实体对齐和关系抽取模型。同时,采用GCN与多头注意力相结合的方式,缓解因结构数据中多跳推理造成实体依赖信息丢失的影响。在开源数据集SemEval、FB15k和收集整理的MD数据集上的实验结果表明,该模型针对关系抽取、实体对齐和三元组抽取任务的F1值分别达到89.5%、86.6%和84.2%,较BERT-Softmax模型分别提升了0.3、2.4和0.3个百分点,具有更好的信息学习能力。
  • 陈铭杰, 张浩, 彭昱忠, 谢峰, 庞悦
    计算机工程. 2022, 48(10): 123-129. https://doi.org/10.19678/j.issn.1000-3428.0062524
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    因果推断是挖掘事物间联系的一种重要方式,但在高维数据场景下,利用因果推断算法进行条件独立性(CI)测试存在冗余测试多和测试效率低的问题,这限制了因果推断在高维数据集上的应用。提出一种基于偏相关性测试的递归式因果推断算法。采用“分治”的方法对变量集进行递归式因果分割,得到更易于处理的低维子数据集,提高对数据集的处理效率。在每个子数据集上进行局部因果推断,减少每次因果推断的计算量并提升算法的运行速度。在此基础上,通过比较显著性值的合并策略整合所有子结果并得到完整的因果关系,保证总体因果结构的准确性。在“分治”过程中,采用高效的偏相关性测试避免高复杂度的核密度估算,进一步提升算法效率。基于10个经典数据集的实验结果表明,在准确率与经典推断算法CAPA持平的情况下,该算法的运算速度提升了2~10倍,且在样本量越大的数据集中提升效果越明显,证明递归式因果推断算法可以有效处理高维数据集,在保证准确率的同时提高运算效率。
  • 网络空间安全
  • 任方, 杨益萍, 薛斐元
    计算机工程. 2022, 48(10): 130-137. https://doi.org/10.19678/j.issn.1000-3428.0063019
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于像素值排序的可逆数据隐藏算法通过修改图像块中的最大像素和最小像素嵌入数据,但并未充分利用图像块内的每一个像素,从而影响嵌入性能。结合块再分原理,提出基于像素值排序的可逆数据隐藏算法。将原始图像划分为3×3的图像块,计算每一个图像块的局部复杂度。设计12种分块模式将局部复杂度小于阈值的图像块细分为子块A和B。根据子块A和B的不同局部特征分别采用2种不同的扫描顺序读取像素。子块A的像素序列使用次小值预测最小值和次大值预测最大值的方法,获得2个预测误差值,子块B的像素序列利用中值像素连续预测其余4个像素的方法,得到4个预测误差值。在此基础上,利用图像块中预测误差值为0和1的像素嵌入隐藏数据。实验结果表明,该算法在一个图像块中最高可嵌入6 bit的数据,在较低计算复杂度的情况下能够有效提高像素的嵌入性能。
  • 段大高, 白宸宇, 韩忠明, 熊海涛
    计算机工程. 2022, 48(10): 138-145,157. https://doi.org/10.19678/j.issn.1000-3428.0061592
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    社交媒体谣言检测是当前研究的热点问题,现有方法多数通过获取大量用户属性学习用户特征,但不适用于谣言的早期检测,忽略了用户之间的潜在关系对信息传播的影响。提出一种基于多传递影响力的谣言检测方法,根据源微博及其对应转发(评论)之间的关系构建文本信息传播图,并通过图卷积神经网络来捕获、学习文本信息的传播特征。利用文本信息和用户传播过程中的影响力,丰富可用于谣言检测早期的检测信息。将存在转发关系的用户构成用户影响力传播图,构建一种用户节点影响力学习方法,获取用户节点影响力,以增强用户特征信息。在此基础上,将文本特征与用户特征融合以进行谣言检测,从而提升检测效果。在3个真实社交媒体数据集上的实验结果表明,该方法在谣言自动检测以及早期检测的效果都有显著提升,与目前最好的基准方法相比,在微博、Twitter15、Twitter16数据集上的正确率分别提高了2.8%、6.9%和3.4%。
  • 陈虹, 侯宇婷, 郭鹏飞, 周沫, 赵菊芳, 肖成龙
    计算机工程. 2022, 48(10): 146-157. https://doi.org/10.19678/j.issn.1000-3428.0063876
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    签密技术是构建网络信任体系的基础,能够保证数据的机密性、完整性和可验证性,但是当大量用户同时进行签密时,验证耗时较长。聚合签密技术将大量用户的签名进行聚合,并提供批量验证以提高验证效率。针对现有基于双线性映射的聚合签密方案存在聚合验证效率低、不满足可公开验证性的问题,基于计算双线性Diffie-Hellman和计算性Diffie-Hellman困难问题假设,提出可公开验证的无证书聚合签密方案。采用双线性映射运算将发送方与接收方的身份信息分别添加到签名和密文中,以隐藏用户身份信息。在随机预言模型下验证该方案的机密性和不可伪造性,并且在对数据的真实性产生质疑时,通过任何可信第三方对验证等式进行计算,无需用户私有信息,具有可公开验证性。分析结果表明,该方案具有较少的运算开销,在聚合验证阶段,仅使用2次固定的双线性映射运算,能够有效提高运算效率。
  • 张晓东, 陈韬伟, 余益民
    计算机工程. 2022, 48(10): 158-168,175. https://doi.org/10.19678/j.issn.1000-3428.0062803
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为应对量子计算对区块链上基于数论的隐私保护技术所带来的威胁,将区块链技术与格属性基加密算法有效融合,提出一种基于格的后量子CPABE区块链数据共享方案。将容错学习(LWE)作为方案的困难问题假设,构造一种基于格的密文策略属性基加密算法LWE-CPABE,抵御量子计算对公钥密码安全的攻击,实现数据的安全共享。设计算法参数的标准格式化交易结构,以满足LWE-CPABE算法的可追责性。在此基础上,给出交易生成与交易验证智能合约,以实现交易的自动验证与共识。功能性分析与仿真实验结果表明,该方案在算法初始化、加解密以及密钥生成的计算效率方面均优于传统的基于双线性映射理论的CPABE方案,可实现区块链上数据的高效、安全、动态共享与隐私保护,明显提高区块链数据共享安全性。
  • 古平, 邱嘉涛, 罗长江, 张志鹏
    计算机工程. 2022, 48(10): 169-175. https://doi.org/10.19678/j.issn.1000-3428.0063505
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    视频异常检测旨在发现视频中的异常事件,异常事件的主体多为人、车等目标,每个目标都具有丰富的时空上下文信息,而现有检测方法大多只关注时间上下文,较少考虑代表检测目标和周围目标之间关系的空间上下文。提出一种融合目标时空上下文的视频异常检测算法。采用特征金字塔网络提取视频帧中的目标以减少背景干扰,同时计算相邻两帧的光流图,通过时空双流网络分别对目标的RGB帧和光流图进行编码,得到目标的外观特征和运动特征。在此基础上,利用视频帧中的多个目标构建空间上下文,对目标外观和运动特征重新编码,并通过时空双流网络重构上述特征,以重构误差作为异常分数对外观异常和运动异常进行联合检测。实验结果表明,该算法在UCSD-ped2和Avenue数据集上帧级AUC分别达到98.5%和86.3%,在UCSD-ped2数据集上使用时空双流网络相对于只用时间流和空间流网络分别提升5.1和0.3个百分点,采用空间上下文编码后进一步提升1个百分点,验证了融合方法的有效性。
  • 金柯君, 于洪涛, 吴翼腾, 李邵梅, 操晓春
    计算机工程. 2022, 48(10): 176-183. https://doi.org/10.19678/j.issn.1000-3428.0063533
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    图神经网络在面对节点分类、链路预测、社区检测等与图数据处理相关的任务时,容易受到对抗性攻击的安全威胁。基于梯度的攻击方法具有有效性和高效性,被广泛应用于图神经网络对抗性攻击,高效利用攻击梯度信息与求取离散条件下的攻击梯度是攻击离散图数据的关键。提出基于改进投影梯度下降算法的投毒攻击方法。将模型训练参数看作与扰动相关的函数,而非固定的常数,在模型的对抗训练中考虑了扰动矩阵的影响,同时在更新攻击样本时研究模型对抗训练的作用,实现数据投毒与对抗训练两个阶段的结合。采用投影梯度下降算法对变量实施扰动,并将其转化为二进制,以高效利用攻击梯度信息,从而解决贪婪算法中时间开销随扰动比例线性增加的问题。实验结果表明,当扰动比例为5%时,相比Random、DICE、Min-max攻击方法,在Citeseer、Cora、Cora_ml和Polblogs数据集上图卷积网络模型被该方法攻击后的分类准确率分别平均降低3.27%、3.06%、3.54%、9.07%,在时间开销和攻击效果之间实现了最佳平衡。
  • 移动互联与通信技术
  • 陈辉, 高岩
    计算机工程. 2022, 48(10): 184-192. https://doi.org/10.19678/j.issn.1000-3428.0061493
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    无线传感器网络由大量密集部署的传感器节点组成,通过节点间的相互协作才能完成工作,因此传感器节点之间的协作非常重要。针对分簇结构无线传感器网络簇头间能耗不均衡导致的“热区”问题,提出一种基于双簇头的新型路由算法NCDH。通过将网络虚拟分区实现网络不均匀分簇,并依据节点的剩余能量、节点与基站的距离、节点度等因素,在簇内选取主、副双簇头节点负责数据处理和转发。在网络运行阶段,根据主簇头的运行状态确定是否启动副簇头,以保证网络能量均匀消耗。在数据传输阶段综合考虑节点与中转节点的距离以及中转节点的剩余能量,从而选出最佳中转节点。实验结果表明,与DEEC、MRDC、GURCP等算法相比,NCDH算法有效改善了网络的“热区”问题,延长了网络的生存时间。
  • 都繁杰, 李静, 郭志勇, 任颖文, 尹晓宇, 董小菱
    计算机工程. 2022, 48(10): 193-201,211. https://doi.org/10.19678/j.issn.1000-3428.0062472
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    Coflow作为并行计算框架的典型流量模型,降低Coflow的完成时间(CCT)成为云计算领域的研究热点。现有Coflow调度机制未考虑云数据中心内网络瓶颈问题,容易造成网络拥塞,导致CCT增加。针对该问题,构建基于瓶颈感知的Coflow调度机制Bamq。利用Lagrange对偶优化Coflow调度模型,以加快Coflow流速并增大吞吐量,从而降低CCT。通过设计多级反馈队列机制,降低吞吐量对网络拥塞产生的影响,根据已发流的大小、宽度和流速信息,构建瓶颈因子以动态调整多级队列的优先级,实现拥塞感知,提高Coflow调度性能。在Facebook真实数据集上进行实验,结果表明,相比Baraat、Varys、Aalo机制,该机制的CCT平均缩短21.3%,吞吐量平均提高17.9%,能够有效提高链路的利用率。
  • 杨志军, 寇倩兰, 丁洪伟
    计算机工程. 2022, 48(10): 202-211. https://doi.org/10.19678/j.issn.1000-3428.0062279
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    面对海量应用场景及客户需求,传统的轮询系统方案不能满足轮询系统中每个站点所需要的服务质量要求。为降低系统时延,适应更大的网络规模,提出基于5G网络切片的轮询方案。将5G网络切片划分为增强型移动带宽切片、海量机器通信切片和高可靠低时延通信切片,再将这3类切片各自划分出N个更低层子切片,构建3个独立的具有重传机制的完全服务轮询模型。信息分组按照先进先出的规则进入各子切片,由通用服务器进行统一发送。在此基础上,采用概率母函数及马尔可夫链建立非理想信道环境下基于5G网络切片架构的轮询系统数学模型,推导系统平均排队队长和平均等待时间的精确表达式,进行信息分组出错概率和重传阈值与轮询系统性能之间的定量关系分析。基于Matlab的仿真实验结果证明了该模型的正确性,其较重传门限服务时延更少,能够为非理想信道环境下基于5G网络切片架构的轮询系统分析提供一种快速评估机制。
  • 张佳健, 李翠然, 谢健骊
    计算机工程. 2022, 48(10): 212-217. https://doi.org/10.19678/j.issn.1000-3428.0062701
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着我国铁路运输现代化进程的加快,高铁列车对通信信息技术的需求日益提升。越区切换是高铁无线通信移动性管理的重要部分,对提高通信质量和运营效率、确保运营安全具有重要意义。针对高铁列车切换性能差、乒乓切换率高的问题,提出一种位置功率联合判决的越区切换算法。以切换阈值作为约束条件并借助信道模型和测量信息计算得到最佳切换带,利用高铁列车的单向移动特点简化位置信息并优化切换流程,以有效避免乒乓切换现象。考虑到车载多中继节点对切换触发位置的判决误差之间存在相关性,构建代价函数筛选最优的预测参数,采用加权统计线性回归方法预测判决误差并加以纠正,使得切换位置收敛于最佳切换点。仿真结果表明,相对A3算法、距离触发算法,该越区切换优化算法能有效降低乒乓切换率,在列车速度为350 km/h时越区切换成功率达到99.5%以上,其能够提高通信系统的可靠性,推动列车提速并保障行驶安全。
  • 缪祎晟, 赵春江, 吴华瑞
    计算机工程. 2022, 48(10): 218-223. https://doi.org/10.19678/j.issn.1000-3428.0062655
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    农田无线传感器网络(WSN)应用环境复杂,影响网络传输的因素包括环境变化、作物生长等。路由协议作为网络数据采集过程中的重要环节,其能耗优化是近年来农田WSN领域的研究热点。传统的能耗优化路由算法多数只针对静态网络环境,难以适用于动态变化的农田监测场景。为此,提出一种基于改进粒子群(PSO)的路由优化算法RD-PSO。将不同的路由传输路径抽象为粒子,根据农田网络能耗、剩余能量、网络传输跳数、链路质量等关键因子构建适应度函数,以提高路径寻优的环境适应性。同时,针对PSO路由随机初始化时迭代效率低的问题,采用反向探测方法确定网络节点的初始化拓扑位置,缩短初始位置与最优解的距离,从而提高算法的收敛速度。实验结果表明,相较ELMR、EEABR和MR-PSO路由算法,RD-PSO算法具有更快的收敛速度,在网络生命周期、能耗均衡效果以及平均传输跳数等方面性能较优,其能提高路由算法在农田动态场景中的适配性。
  • 图形图像处理
  • 王书朋, 贺瑞, 王瑜婧, 赵瑶
    计算机工程. 2022, 48(10): 224-229. https://doi.org/10.19678/j.issn.1000-3428.0062841
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为解决动态场景下多曝光融合图像出现鬼影的问题,提出一种新的动态多曝光图像融合算法。引入中值图像均衡对输入图像和参考图像的直方图进行处理,将获取的图像对做差分,并对差分图进行阈值分割和形态学优化得到运动权重图。中值直方图均衡可以为一对图像分配相同的直方图,同时保持其灰度动态,因此对多曝光图像对调整其亮度差异,有利于运动区域检测的准确性。通过强度映射函数将参考图像分别映射为各个输入图像的亮度,并将输入图像的运动区域替换为参考图像的一部分,得到具有亮度过渡自然的图像序列。在此基础上,对静态图像序列进行融合得到最终的融合图像。实验结果表明,该算法可有效地避免鬼影现象,且能够获得细节丰富、视觉效果良好的高动态范围图像,经该算法融合后的图像在标准差、边缘强度、相关系数和动态场景结构一致4个指标上与DGF、FMSD等算法相比具有明显的优势。
  • 谢树春, 陈志华, 盛斌
    计算机工程. 2022, 48(10): 230-237,244. https://doi.org/10.19678/j.issn.1000-3428.0063316
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    现有基于深度学习的语义分割方法对于遥感图像的地物边缘分割不准确,小地物分割效果较差,并且RGB图像质量也会严重影响分割效果。提出一种增强细节的RGB-IR多通道特征融合语义分割网络MFFNet。利用细节特征抽取模块获取RGB和红外图像的细节特征并进行融合,生成更具区分性的特征表示并弥补RGB图像相对于红外图像所缺失的信息。在融合细节特征和高层语义特征的同时,利用特征融合注意力模块自适应地为每个特征图生成不同的注意力权重,得到具有准确语义信息和突出细节信息的优化特征图。将细节特征抽取模块和特征融合注意力模块结构在同一层级上设计为相互对应,从而与高层语义特征进行融合时抑制干扰或者无关细节信息的影响,突出重要关键细节特征,并在特征融合注意力模块中嵌入通道注意力模块,进一步加强高低层特征有效融合,产生更具分辨性的特征表示,提升网络的特征表达能力。在公开的Postdam数据集上的实验结果表明,MFFNet的平均交并比为70.54%,较MFNet和RTFNet分别提升3.95和4.85个百分点,并且对于边缘和小地物的分割效果提升显著。
  • 张智豪, 范九伦
    计算机工程. 2022, 48(10): 238-244. https://doi.org/10.19678/j.issn.1000-3428.0062899
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    HSI颜色空间可以用三维空间下的圆锥模型进行解释,基于HSI颜色空间的H分量圆形直方图实现彩色图像分割具有可行性。针对HSI颜色空间的H分量圆形直方图毛刺较多以及相关阈值选取准则分割精度较低的问题,给出S分量指数加权H分量的直方图公式,利用S分量信息对H分量直方图的毛刺进行平滑处理,并通过分析给出指数加权因子的最优取值。在此基础上,提出一种圆形直方图阈值分割法,通过对整个圆形直方图进行整体角均值计算而得出新的阈值选取准则。实验结果表明,该圆形直方图阈值分割法具有有效性,在测试数据集上,与3个圆形最大熵阈值分割法以及2个阈值分割准则相比,所提方法的像素精度值平均提高3.2%,结构相似度值平均提高2.5%。
  • 高伟, 吴顺
    计算机工程. 2022, 48(10): 245-251,261. https://doi.org/10.19678/j.issn.1000-3428.0062765
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    老照片由于长时间的磨损或保存不当,会出现照片的划痕损伤。随着深度学习在图像重建中的应用,基于深度学习方法能够在纹理修复的基础上获取图像的语义信息并预测语义内容,使老照片修复的整体效果更加符合客观事实,但利用深度学习进行老照片划痕修复缺乏学习所需数据集。提出一种基于半监督学习的老照片划痕自动修复的方法,创建划痕合成数据集SynOld用于网络训练,同时搜集真实的划痕老照片用于训练和测试,将合成数据集和真实老照片加入网络学习,两者共享网络参数,并通过鉴别器来区分网络生成图像与真实图像。对于合成数据集有监督的分支采用均方差损失、感知损失和对抗损失约束训练,对于真实老照片无监督的分支采用总变差损失控制训练。实验结果表明,相比于多尺度特征注意力网络的监督学习方法,该方法在合成数据集SynOld和真实老照片上都具有较好的修复效果。
  • 倪萍, 赖惠成, 高古学, 谷腾飞, 贾振红
    计算机工程. 2022, 48(10): 252-261. https://doi.org/10.19678/j.issn.1000-3428.0062874
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    目前的多数图像去雾方法不适用于浓雾场景,存在去雾后图像亮度偏暗及光晕伪影等问题,提出一种利用图像形态学和梯度域导向滤波的去雾算法。通过暗通道先验算法得到初始透射率,并根据图像形态学闭、开运算细化和平滑初始透射率。运用梯度域导向滤波优化透射率图,以平滑透射率图的边缘和消除矩形块状效应。为更好地估计出大气光值,对雾图的最小强度图进行形态学灰度腐蚀,并经过导向滤波处理,以此结果作为暗通道图,选取其最亮的前0.1%像素点对应到原图中,最高的像素值作为大气光值,得到大气光值后利用大气散射模型求出去雾后的图像。将除雾后的RGB图像转换到HSI颜色空间,利用多曝光融合框架对I通道进行无雾图像整体亮度提高,最终转到RGB颜色空间。实验结果表明,该算法能够恢复更多的细节信息,保证图像具有合适亮度,且颜色自然,无光晕伪影,优于暗通道先验和颜色衰减先验等去雾算法。
  • 开发研究与工程应用
  • 谢艺蓉, 马永杰
    计算机工程. 2022, 48(10): 262-269. https://doi.org/10.19678/j.issn.1000-3428.0062885
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    卷积神经网络具有较优的图像特征提取性能,被广泛应用于交通标志识别领域。然而,现有交通标志识别算法通常基于专家经验设计改进的图像特征提取网络,需经历图像预处理和模型调参过程,导致模型的复杂度增大。提出一种基于进化ResNet的交通标志识别算法。将ResNet的构建参数嵌入到进化算法中,在架构搜索空间中以构建块作为基本单位,并将网络深度、卷积层通道数、池化层类型和模块构建顺序作为搜索空间的可变参数,利用交叉、变异等遗传算子执行自适应优化搜索,以确保进化搜索的有效性,同时设计适用于交通标志识别的轻量化网络。在德国交通标志数据集上的实验结果表明,该算法的识别精度达到99.41%,而参数量仅为2.37×106,相比Multi-column DNN、MFC、MFC+ELM等算法,在保证识别精度的同时减少网络参数量。
  • 张永亮, 陆阳, 朱芜强, 卫星, 魏臻
    计算机工程. 2022, 48(10): 270-278,287. https://doi.org/10.19678/j.issn.1000-3428.0062282
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基于卷积神经网络的交通标志检测算法在对现实中复杂的交通场景图像进行交通标志检测时,难以同时解决定位和分类两项任务,并且目标检测领域相关算法所使用的公开数据集提供的图像和交通标志的种类不能满足现实交通场景中复杂的情况。建立一个新的道路交通标志数据集,在YOLOv4算法的基础上针对现实交通场景图像的复杂性和图像中交通标志尺寸差异较大的特点,设计多尺寸特征提取模块和增强特征融合模块,提高算法同时定位和分类交通标志的能力。在此基础上,对算法中不同的模块设置不同的参数进行对照实验,得到一组表现最优的参数,用于检测现实交通场景图片中的交通标志。在道路交通标志数据集上的实验结果表明,该算法相比基于卷积神经网络的同类型任务目标检测算法具有更高的检测精度,平均精度均值达到83.63%。
  • 朱杰, 龚声蓉, 周立凡, 徐少杰, 钟珊
    计算机工程. 2022, 48(10): 279-287. https://doi.org/10.19678/j.issn.1000-3428.0062955
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对语义分割领域中多尺度共享网络训练复杂度高,以及网络在小目标、长条状目标、目标边缘处拟合效果不佳的问题,提出一种新型外接多尺度投票网络。通过投票网络融合各尺度分割结果,降低网络训练复杂度,并将共享网络中的分割网络与各尺度注意力头剥离开,仅训练各尺度注意力头,以便于网络收敛。在投票网络的结构设计中,使用多类别投票方法扩大投票空间,通过融入混合池化模块聚合近程与远程权值,扩大网络感受野,缓解权值图中长条状目标拟合间断与缺失的问题。在此基础上引入类内、类间投票注意力模块获取权值及类间关系,并采用不规则卷积,改善投票权值图的边缘拟合效果。在Cityscapes数据集上的实验结果表明,相比FCN、PSPNet、DeepLabv3+分割网络,该网络的平均交并比分别提升了0.92、0.88、0.80个百分点,与共享网络相比,其训练复杂度更低,精度更高。
  • 代广昭, 孙伟, 徐凡, 张小瑞, 陈旋, 常鹏帅, 汤毅, 胡亚华
    计算机工程. 2022, 48(10): 288-297,305. https://doi.org/10.19678/j.issn.1000-3428.0062867
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    车辆重识别的目的是从大型车辆数据库中找到与查询车辆相同特征的所有车辆图片。目前,由于同一车辆在不同视角下外观差异大或颜色、车型相同的不同车辆在特定视角下外观差异小,导致车辆重识别的准确度和鲁棒性均有待提高。提出一个视角感知局部注意力网络,采用弱监督注意力学习方式代替人工手动的车辆局部部件标注,自适应学习每个视角内所有显著性局部特征。通过局部注意力裁剪操作裁剪并放大该视角领域内部件细节信息,并基于局部注意力擦除操作擦除一些局部区域,以鼓励模型发掘该视角领域内其他更多的显著性局部线索。构建一种共同视角的注意力增强模块,以强化共同视角特征学习,并根据视角的相似度给每个视角分配相应的权重,使同一视角特征学习得到增强,不同视角特征学习受到抑制。实验结果表明,所提网络在VeRi-776数据集下的mAP为81.2%,在VehicleID数据集下的CMC@1、CMC@5分别为85.7%、98.0%,相较于PRN、PVEN、SAVER等重识别网络具有更高的识别精度和更强的泛化能力。
  • 宋旭晖, 于洪涛, 李邵梅
    计算机工程. 2022, 48(10): 298-305. https://doi.org/10.19678/j.issn.1000-3428.0063055
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    命名实体识别指识别文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。在命名实体识别任务中,协同图网络(CGN)模型通过引入多个图注意力网络获得较强的知识整合能力及较高的处理速度,但CGN模型在嵌入层中没有充分利用词边界信息,且采用的传统静态图注意力网络影响了图注意力的表达能力。在对CGN模型的图注意力网络进行改进的基础上,提出一种中文命名实体识别新模型,在嵌入层融入词语的分词信息,以生成包含词边界信息的字向量,从而充分利用词边界信息。通过在编码层使用BiLSTM模型获取文本的上下文信息,采用改进后的图注意力网络提取文本特征,并通过优化传统图注意力网络中相关系数的计算方式,增强模型的特征提取能力。最后,利用条件随机场对文本进行解码,从而实现对实体的标注。实验结果表明,该模型相比CGN模型在MSRA、OntoNotes4.0、Weibo数据集上的F1值分别提升了0.67%、3.16%、0.16%,验证了其在中文命名实体识别任务上的有效性。
  • 陈春辉, 马社祥
    计算机工程. 2022, 48(10): 306-312. https://doi.org/10.19678/j.issn.1000-3428.0063188
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统基于卷积神经网络的交通标志检测网络采用堆叠大量卷积核的方式进行下采样,限制了卷积神经网络的感受野建模,难以灵活地调整内部参数,从而丢失图像的细节信息,导致小目标与遮挡目标的检测精度与定位精度降低。提出基于YOLOv5采样优化的交通标志检测网络。以新型算子作为基础架构,采用自卷积方式灵活提取不同通道的特征,并构建跨阶段注意力机制模块,以增加各通道特征的重要性权值,从而提高小目标的检测能力。通过改进的通道聚合网络实现多尺度语义信息与细节特征的融合与增强,同时利用K-means聚类算法生成更适合交通标志的先验框,在非极大值抑制算法中引入距离交并比函数对预测框进行后处理,避免错误抑制复杂场景下被遮挡的目标,从而提高定位精度。在中国交通标志数据集上的实验结果表明,当交并比阈值为0.5时,该网络的平均精度均值为95.8%,与YOLOv5网络相比模型参数量减少了15.7%,在满足实时性的同时具有较优的小目标检测性能。
  • 王福银, 韩华, 黄丽, 陈益平
    计算机工程. 2022, 48(10): 313-320. https://doi.org/10.19678/j.issn.1000-3428.0062643
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    目前的视频行人重识别方法不能有效提取视频帧之间的时空信息,且需要解决人工标签的问题,提出一种时间特征互补的无监督视频行人重识别方法。利用时间特征擦除网络模块对视频帧与帧之间的时间信息特征及空间信息特征进行擦除提取,挖掘行人不同的特征以减少每帧特征的冗余,进而得到目标行人不同视觉的完整特征。通过约束性无监督层次聚类模块计算每个样本之间的距离得到高质量的不同身份集群,根据集群之间距离进行聚类生成高质量的伪标签,提高不同身份极度相似的样本识别性,并根据PK抽样困难样本三元组损失模块从已经聚类好的结果中抽取样本生成一个新的数据集,以便在每次聚类迭代后进行训练,减少困难样例对模型的影响。在MARS数据集和DukeMTMC-VideoReID数据集上的实验结果表明,该方法的平均精度均值分别达到了46.4%和72.5%,Rank-1分别达到了69.3%和80.5%,性能指标优于传统的RACM和DAL等方法。