作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2023年, 第49卷, 第11期 刊出日期:2023-11-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2023, 49(11): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 王畅, 李雷孝, 杨艳艳
    计算机工程. 2023, 49(11): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0066661
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于计算机视觉的疲劳驾驶检测方法具有非侵入性等优点,不会对驾驶行为产生影响,在实际场景中便于应用。随着计算机技术的发展,越来越多的学者研究基于计算机视觉的疲劳驾驶检测方法。疲劳驾驶行为主要体现在面部和肢体上,在计算机视觉领域,面部行为较肢体行为更易获取,因此,基于面部特征的疲劳驾驶检测方法成为疲劳驾驶检测领域的重要研究方向。综合分析多种基于驾驶员面部多特征的疲劳驾驶检测方法,对国内外最新研究成果进行总结。介绍驾驶员面部不同特征在疲劳状态下的具体行为体现,阐述基于面部多特征的疲劳驾驶检测流程。根据面部不同特征对国内外的研究成果进行分类,并整理不同的特征提取方法和状态判别方法。通过不同特征在疲劳状态下产生的各种行为归纳不同方法判别驾驶员疲劳状态时使用的参数。同时,总结当前研究成果中使用面部多特征综合判别疲劳驾驶的方法,分析不同方法间的相同点和差异性。在此基础上,讨论当前基于面部多特征融合的疲劳驾驶检测领域存在的不足,并对该领域的未来研究方向进行展望。

  • 陈锦生, 马文臻, 方少峰, 邹自明
    计算机工程. 2023, 49(11): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0066521
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    子午工程全天空气辉成像仪观测网的逐步完善,积累了海量的气辉图像原始观测数据,但是基于地基气辉观测的大气重力波研究极度依赖人工识别,十分耗时且识别质量难以得到保证,亟需发展一种快速有效的自动识别方法。针对大气重力波标注样本稀缺的问题,在改进Cycle GAN模型的基础上提出一种大气重力波气辉观测数据集扩充算法,仅需标注少量样本即可大幅提升检测算法对大气重力波的识别精度;进一步,利用地基气辉图像识别目标与背景低信噪比的特点,通过对深度学习模型YOLOv5s骨干网络以及边界框预测加以改进,提出一种新的大气重力波智能识别算法。实验结果表明,使用扩增的数据集以及改进的YOLOv5s目标检测算法,在交并比阈值为0.5的情况下平均识别精度达到75.8%,较原始模型提升9.7个百分点,检测速度和平均识别精度均优于对比的主流目标检测算法。

  • 吴奇林, 党亚固, 熊山威, 吉旭, 毕可鑫
    计算机工程. 2023, 49(11): 24-29, 39. https://doi.org/10.19678/j.issn.1000-3428.0066181
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    以学生评教文本情感分析任务作为切入点,针对传统基础深度学习模型特征提取能力不足、循环神经网络训练效率较低以及词向量语义表示不准确等问题,提出基于混合特征网络的学生评教文本情感分类算法。采用轻量级ALBERT预训练模型提取符合当前上下文语境的每个词的动态向量表示,解决传统词向量模型存在的一词多义问题,增强向量语义表示的准确性;混合特征网络通过结合简单循环单元和多尺度局部卷积学习模块以及自注意力层,全面捕捉评教文本全局上下文序列特征和不同尺度下的局部语义信息,提升模型的深层次特征表示能力,自注意力机制通过计算每个分类特征对分类结果的重要程度,识别出对情感识别结果影响较大的关键特征,避免无关特征对结果造成干扰,影响分类性能,将分类向量拼接后由线性层输出评教文本情感分类结果。在真实学生评教文本数据集上的实验结果表明,该模型F1值达到97.8%,高于对比的BERT-BiLSTM、BERT-GRU-ATT等深度学习模型。此外,消融实验结果也证明了各模块的有效性。

  • 张凌云, 陈玉玲
    计算机工程. 2023, 49(11): 30-39. https://doi.org/10.19678/j.issn.1000-3428.0066556
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    数据共享过程中存在数据泄漏、信任危机等问题,且量子计算机的出现对传统加密算法带来了较大威胁。为此,提出一种基于格上密文策略属性基加密(CP-ABE)的联盟链数据共享方案。利用联盟链的准入机制以及允许存在可信第三方的特性解决在分布式网络中数据共享双方相互不信任的问题。引入基于环上容错学习的CP-ABE技术来抵御量子攻击,同时改进访问树的生成方式,将属性分为高敏感、低敏感两类,实现对数据的分级加密以保证数据的安全性。基于演化博弈论构建数据共享模型,对共享双方在联盟链数据共享体系中的选择策略进行求解和分析,并探究不同参数对演化结果的影响。实验结果表明,当属性数量呈指数级增长时,该方案的启动算法、加密算法以及解密算法的效率比基于合数阶双线群的CP-ABE方案分别提高81.6%、43.8%和56.0%,每增加一个背书节点能够使系统在执行增加用户与查询用户函数时效率分别提高36.8%与6.4%。此外,对演化模型进行模拟,结果表明,当数据固有收益、损失概率与损失收益的乘积都提高时,参与联盟链带来的收益提高,用户更倾向于参与联盟链。

  • 王恩旭, 王晓红, 张坤, 张冬雯
    计算机工程. 2023, 49(11): 40-48, 69. https://doi.org/10.19678/j.issn.1000-3428.0066255
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对目前负载预测模型不容易捕获数据时序信息和特征信息的问题,提出一种双重注意力机制的负载预测模型。该模型融合特征注意力机制和时序注意力机制,自适应地挖掘服务器负载的特征信息和时序信息,有效增强网络对特征数据和时序数据的关键信息表达。基于CRITIC方法对服务器各项特征进行加权,计算服务器负载值,从而更加全面和准确地评估服务器下一时刻的负载状态。双重注意力机制网络在长短期记忆网络(LSTM)的基础上引入特征注意力机制和时序注意力机制,以负载值的历史数据为输入对未来时刻服务器的负载值进行预测,有效提高网络对单步预测和多步预测的准确性。在阿里巴巴Cluster-trace-v2018公开数据集上的实验结果表明,双重注意力机制网络相对于LSTM基础的负载预测网络,平均绝对误差和均方误差分别下降了9.2%和16.8%,具有较好的稳定性和准确性。

  • 人工智能与模式识别
  • 罗俊, 高清维, 檀怡, 赵大卫, 卢一相, 孙冬
    计算机工程. 2023, 49(11): 49-60. https://doi.org/10.19678/j.issn.1000-3428.0065787
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    标签特定特征是多标签学习的研究热点,利用标签特征提取解决单个例子存在多个类标签的问题。现有多标签分类研究通常只是简单考虑标签之间的相关性,忽略原始数据之间的局部流形结构,可能会造成分类精度下降。此外,在标签相关性中,特征和标签的结构关系以及标签之间的内在因果关系也往往被忽视。提出一种基于双拉普拉斯正则化与因果推断的多标签学习算法。利用线性回归模型建立多标签分类的基本框架,结合因果学习探索标签之间的内在因果关系,以达到挖掘标签之间本质联系的目的。在此基础上,为充分利用特征与标签之间的结构关系,加入双拉普拉斯正则化以挖掘局部标签关联信息以及有效保持原始数据的局部流形结构。在公共多标签数据集上验证该算法的有效性,实验结果表明,相比LLSF、ML-KNN、LIFT等算法,该算法的汉明损失、平均精度、1次错误率、排序损失、覆盖率、AUC平均提升8.82%、4.98%、9.43%、16.27%、12.19%、3.35%。

  • 杨海洋, 张兴鹏
    计算机工程. 2023, 49(11): 61-69. https://doi.org/10.19678/j.issn.1000-3428.0066503
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    方面级情感分析是一项细粒度的情感分析任务,旨在对给定文本中多个特定方面进行情感极性分析。大多数基于句法分析的模型严重依赖依存树的单一解析结果,由于这种结构仅揭示2个单词之间的依存关系,因此无法捕捉方面词与上下文之间的联系。此外,大部分研究忽略了依存解析中的关系类型,可能丢失重要特征信息。提出一种基于多通道的图卷积网络(MCGCN)模型,主要包含成分图模块、依存图模块(DepGCN)以及自注意力机制,旨在挖掘句子结构中丰富的句法和语法信息。此外,为减少依存解析错误,在DepGCN中引入依存关系类型和依存概率以获取更精准的语法表示。利用预训练模型进行词嵌入得到文本初始化向量,分别输入到融合不同句法分析的图卷积网络进行不同节点的学习,利用自注意力机制能有效地对方面词进行全局的语义信息关联。最后将3个模块的输出通过仿射交互层进行交互学习,进而提升模型的表征能力。实验结果表明,MCGCN模型在Laptop数据集上的ACC值和F1值分别为78.48%和75.03%,在Twitter数据集上的ACC值和F1值分别为75.92%和74.53%,相较于基准模型均有提升,在3个数据集上的F1值都有1%~3%的提升。

  • 张金鹏, 段湘煜
    计算机工程. 2023, 49(11): 70-76, 84. https://doi.org/10.19678/j.issn.1000-3428.0066031
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    术语干预神经机器翻译模型通常借助人为给定的术语翻译来改变译文,从而改善翻译质量。向量化干预方法为术语干预任务提供了新的范式,但仅考虑将术语与句子信息以向量的形式融合,没有关注术语信息对术语翻译效果的影响。为此,构建一种结合向量化方法与掩码机制的术语干预机器翻译模型,将人为给定的源端术语与目标端术语编码为特征向量,显式地融入机器翻译模型的编码器、解码器以及输出层。在训练阶段,借助掩码机制屏蔽注意力机制中源端术语对应的关键字,增强模型编码器与解码器对术语特征向量的关注。在推理阶段,利用掩码机制优化术语干预输出层的概率分布,进一步提高术语字符的翻译准确率。在WMT2014德英和WMT2021英中数据集上的实验结果表明,相较于基于原始向量化方法的Code-Switching机器翻译模型,所提模型的术语翻译准确率分别提升了9.27和2.95个百分点,并且能大幅度提升长术语的翻译准确率。

  • 邓倩, 陈曙, 叶俊民
    计算机工程. 2023, 49(11): 77-84. https://doi.org/10.19678/j.issn.1000-3428.0066089
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    语法纠错旨在判断自然语言文本中是否包含语法错误并对句子进行纠正。随着预训练语言模型的迅速发展,基于预训练语言模型的方法被广泛应用于中文语法纠错(CGEC)领域,然而现有的预训练语言模型缺乏语法纠错领域的特定语法知识,导致语法纠错效果不佳。针对该问题,提出一种基于语法知识图谱预训练模型的CGEC模型。首先进行结构化知识编码,将语法知识图谱中的结构化知识映射到词语实体嵌入中,然后通过特定的预训练掩码策略联合学习上下文和词语之间的语法知识以预测字符和词语,最后通过设置检错网络和纠错网络对预训练模型进行微调,以完成CGEC任务。通过上述过程充分提取语法知识,以帮助模型更好地捕捉句子中词语之间的语法关系。在NLPCC 2018测试数据集上的实验结果表明,语法知识增强的方法使得模型的F0.5值提升4.83个百分点,所提模型的F0.5值相比NLPCC 2018共享任务中排名第一的模型高8.85个百分点,验证了基于语法知识图谱的预训练模型在CGEC任务中的有效性。

  • 苏丰睿, 穆伟伟, 赵宣茗, 裘智峰
    计算机工程. 2023, 49(11): 85-93. https://doi.org/10.19678/j.issn.1000-3428.0065422
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    划分聚类方法由于结构清晰、时间效率高而得到广泛的应用,但在缺乏先验知识的实际工业过程中难以合理地进行簇数和中心初值选取,导致聚类处理效果大打折扣。针对利用误差平方和方法获得的肘部点不明显的问题,提出考虑比例主偏差的误差平方和方法(PPD-SSE)。在误差平方和的基础上引入主偏差项以加强肘部点附近趋势,同时通过引入比例值避免趋势突变,从而更加准确地进行簇数选择。针对利用k-means++方法选取高维数据初始中心时过于随机的问题,提出轮盘重构的k-means++方法(RWR-kmeans++)。利用与已选中心的距离平方,并结合概率下限的方法来重构概率轮盘,提升相异数据被选中的概率, 降低初值选取的随机性,提升聚类效果并使之更加稳定。在UEA & UCR公开数据集上的实验结果表明,所提PPD-SSE方法能够有效提升肘部偏折角及簇数预测的准确性,RWR-kmeans++方法能够有效提升初值选取的相异性及聚类效果。

  • 王康, 刘聪, 王路, 曾庆田
    计算机工程. 2023, 49(11): 94-105, 114. https://doi.org/10.19678/j.issn.1000-3428.0066258
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    模型挖掘作为流程挖掘的热点领域之一,旨在从事件日志中生成描述业务流程的模型。事件日志包含具有可分解循环依赖关系的活动,此类活动既无法使用过滤非频繁活动的方式将其过滤,也不能当作混沌活动处理,导致流程模型精确度较低。现有方法不能在含有噪声的情况下根据有无循环结构划分事件日志,进而无法在无循环结构子日志上正确识别具有可分解循环依赖关系的活动,且需要依赖活动属性。为克服现有方法的不足,提高挖掘模型质量,提出分离循环结构和可分解循环依赖关系的分解流程模型挖掘框架。首先基于启发式方法将事件日志根据有无循环结构划分为两部分,在无循环结构事件日志中根据活动间可达关系频率和直接跟随关系频率识别具有可分解循环依赖关系的活动,进而将具有可分解循环依赖关系的活动从有循环结构事件日志中过滤,以识别事件日志的循环结构并投影得到子日志集合。然后使用现有流程模型挖掘方法挖掘子模型并基于边界活动分支结构关系合并子模型。实验结果表明,该方法基于ProM平台实现,并基于公开事件日志与直接使用Inductive Miner、基于最大划分框架和基于阶段的业务流程模型挖掘方法相比,精确度提高了0.08~0.42,复杂度降低了3.86~45.92。

  • 蒋慧凯, 李晓戈, 安晓春, 王甜甜, 阮桁
    计算机工程. 2023, 49(11): 106-114. https://doi.org/10.19678/j.issn.1000-3428.0066017
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在现有的属性情感分类研究中,训练模型时大多完全依赖标签数据或需要引入文本级标签数据作为补充,很少关注无标签数据对模型性能的提升。提出一种基于无标签数据增强的位置感知网络(UDE-PAN)。引入交叉可视训练(CVT)的半监督训练算法,使模型能够同时利用无标签数据。CVT算法在标签数据和无标签数据中交替训练模型来提升表征学习能力,使模型在无标签数据中学习到额外知识。此外,基于语义相对距离(SRD)嵌入层和动态特征加权(CDW)层捕获属性词和上下文的关系:SRD嵌入层显式地将位置信息建模成特征向量,使上下文特征包含特定的属性信息;CDW层通过动态设置权重系数来感知上下文中与属性词更密切的部分。在SemEval14的2个公开数据集上的实验结果表明:UDE-PAN的准确率分别达到76.23%、82.47%,Macro-F1值分别达到72.13%、73.97%,优于对比的主流模型,验证了模型的有效性;借助CVT算法,无标签数据的训练对模型的准确率平均提升1%,Macro-F1平均提升2%,验证了无标签数据可以有效增强模型性能。

  • 刘贞国, 朱宇, 王晓英, 黄建强, 曹腾飞
    计算机工程. 2023, 49(11): 115-122. https://doi.org/10.19678/j.issn.1000-3428.0065729
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    与节点之间仅具有成对关系的普通网络不同,超网络的节点之间还存在复杂的元组关系,因而现有的大多数普通网络表示学习方法不能有效地捕获复杂的元组关系。为此,提出一种捕获成对关系和元组关系的基于集合约束的异质超网络表示学习方法。结合团扩展和星型扩展,将抽象为超图的异质超网络转化成抽象为2-截图+关联图的异质网络。基于2-截图+关联图,采用感知节点语义相关性的元路径游走方法获取异质节点序列,并通过基于拓扑派生目标函数的模型训练异质节点序列上的成对关系,采用基于集合约束目标函数的模型,将与节点关联的超边集合融入到超网络表示学习中来训练节点之间的元组关系,从而获得高质量的节点表示向量。实验结果表明,对于链接预测任务,该方法的性能接近于其他最优基线方法;对于超网络重建任务,当超边重建比率大于0.7时,该方法在drug数据集上具有较优的性能,在GPS数据集上的平均性能超过其他最优基线方法16.2%。

  • 富坤, 孙明磊, 郝玉涵, 刘赢华
    计算机工程. 2023, 49(11): 123-130. https://doi.org/10.19678/j.issn.1000-3428.0065936
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    社会网络的节点经常存在标注缺失、标注错误和人工标注成本高的现象,这种现象对监督或半监督的网络表示学习效果产生了不利的影响。提出一个自监督学习的网络表示学习模型——基于对抗训练的伪标签约束自编码器(AT-PLCAE)。设计一个伪标签约束自编码器,通过缩短原始图的伪标签和网络表示的伪标签之间的距离,减少编码过程中产生的信息损失,约束和引导模型有效学习。同时,设计与伪标签约束自编码器相适应的对抗网络,组织表示的潜在空间结构。将潜在表示后验分布与输入的特定先验分布相匹配后,该模型能够缓解过拟合问题并提升模型的泛化能力。在Cora、Citeseer、Wiki和Pubmed这4个公开数据集上进行节点分类实验,结果表明,AT-PLCAE模型在分类准确率方面学习效果优于基准方法,与基准方法的最高分类准确率相比,在Cora数据集上提升0.018,在Citeseer和Pubmed数据集上均提升0.011。同时消融实验结果表明,针对伪标签约束自编码器的对抗训练增强了模型的泛化能力。

  • 古楠楠
    计算机工程. 2023, 49(11): 131-142. https://doi.org/10.19678/j.issn.1000-3428.0067397
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    数据类别标记是一项费时费力的工作,且标记质量会直接影响模型预测性能。基于自步学习机制构建自步半监督降维框架,将由简单到复杂的样本逐步纳入模型训练过程。在此框架下,设计自步半监督降维算法,依据交替优化策略,在更新降维映射函数与计算样本重要度之间交替迭代。一方面,最小化低维标签数据的加权类内分散程度,且考虑再生核希尔伯特空间中的函数复杂度正则化项与数据稀疏结构图上的光滑度正则化项,得到降维映射。另一方面,依据自步学习机制,计算标签数据的低维表示与其所在类的锚点之间的距离,给定下次迭代时样本的重要度。所提框架及算法对标签噪声具有较好的鲁棒性,能自适应给出标签样本的重要度及显性非线性的降维映射,所得的低维表示具有较强的可分性与判别性。在5个实验数据集上,对于标签具有噪声的数据,所提算法获得的低维表示的最近邻分类准确率分别比次优算法最多提高了2.2、5.6、5.0、11.3、2.7个百分点,验证了所提算法的有效性和鲁棒性。

  • 网络空间安全
  • 刘陕南, 张荣华, 刘长征
    计算机工程. 2023, 49(11): 143-149. https://doi.org/10.19678/j.issn.1000-3428.0066247
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对联盟链的实用拜占庭容错(PBFT)共识算法通信复杂度高、主节点选择随机、支持的网络规模有限等问题,提出一种基于分组和信用分级的改进拜占庭容错(CBFT)算法优化大规模联盟链的节点结构。优化一致性过程,将网络节点按照对管理节点的响应速度划分为不同的共识集分别进行共识集内外共识,各共识集的管理节点携带共识集内的共识结果参与共识集外的全局共识,从而减少节点间的通信频率。在此基础上,提出信用分级机制,将节点划分为管理节点、候选节点、普通节点等3种类型,使信用值高的节点成为主节点的概率较高,减少恶意节点对系统的破坏,提高整个网络的效率。搭建基于该改进方案的仿真模拟与性能测试系统.实验结果表明,当网络节点数量为30个(4个分组)时,CBFT算法的吞吐量为PBFT的3.2倍,共识时延降低90.6%,通信开销减少53.2%,能够容忍的最大恶意节点数为PBFT算法的1.9倍,且随着节点数的增加提升更明显,符合大型联盟链的需求。

  • 陈安琪, 陈睿, 邝祝芳, 黄华军
    计算机工程. 2023, 49(11): 150-159. https://doi.org/10.19678/j.issn.1000-3428.0066262
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现阶段图神经网络被广泛应用于欺诈检测,由于欺诈检测中往往存在类不平衡问题,导致基于图神经网络模型性能不佳。针对上述问题,设计一种基于图神经网络的不平衡欺诈检测模型。该模型细化了图结构数据中存在的邻域不平衡和中心不平衡两个不平衡的概念。在邻域不平衡中,通过多层感知机和高斯核函数衡量中心节点与其邻域节点的非欧氏空间距离(相似度),基于马尔可夫决策动态更新采样阈值对邻域节点进行多层自适应欠采样,并在每一层中仅聚合其原始特征和前一层的隐藏嵌入得到中心节点的目标嵌入;在中心不平衡中,引入加权交叉熵损失函数为每个中心节点的损失设置动态权重以达到中心平衡。在Yelp和Amazon两个数据集上的实验结果表明,该模型的曲线下面积(AUC)、召回率(Recall)两个指标相较于最优基准模型均有显著提升,在两个数据集上的AUC和Recall分别提升了5.52%、5.42%和1.57%、4.31%。

  • 刘宇宸, 唐菀, 杨喜敏, 张艳
    计算机工程. 2023, 49(11): 160-168. https://doi.org/10.19678/j.issn.1000-3428.0065661
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为使软件定义网络(SDN)能满足复杂多样的应用层网络需求,SDN控制层采用多控制器结构,然而新制定的路由策略与已有路由策略间存在路由一致性问题,可能会导致数据层流表项存储冗余和网络流量的转发环路。提出一种基于区块链的SDN路由策略一致性检测方案RCDB-SDN,利用区块链不可篡改特性存储SDN流表项特征属性等网络信息,采用基于投票的实用拜占庭容错共识机制在控制层实现对流表项集的一致性验证,并降低路由策略一致性问题给网络带来的不良影响。通过验证输出端流表项的一致性,比较新制定的路由策略与已有策略的转发效果,检测造成存储冗余的重叠路径。根据有向图的环路检测算法及转发路径关键节点上的流表项,检测引起网络流量转发环路的环路路径。基于Multichain平台针对导致路径重叠和路径环路的流表项进行仿真实验,结果表明RCDB-SDN方案的检测精确率高于WedgeTail方案,达到95%以上,并且能在一定程度上减少控制层与数据层间的消息传递次数。

  • 侯占伟, 杨鑫, 申自浩, 王辉, 刘沛骞
    计算机工程. 2023, 49(11): 169-177, 186. https://doi.org/10.19678/j.issn.1000-3428.0066082
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    传统利用假位置生成技术构建匿名集的隐私保护方案未进行综合因素的考量,致使最终生成的假位置区分度低、合理性差,存在较高的隐私泄露风险。提出基于多属性决策模型的匿名集构建(MDMASC)算法,基于多属性决策模型选取假位置,从而构建安全匿名集。考虑到攻击者可能具有背景知识等信息,通过对地图进行网格划分,根据用户对各位置点的历史查询概率进行初次过滤。考虑到匿名集语义多样性、物理分散性、假位置敏感程度等因素,定义语义跨度、语义敏感等级、位置普遍度等指标属性。利用层次分析法建立层次结构模型,分析位置普遍度、语义敏感等级、语义跨度等5个影响匿名集安全性的指标之间的相对重要关系,基于此构建成对比较矩阵,计算出各指标的属性权重。最后,利用多属性决策模型计算候选假位置集中各位置点的综合属性值,选出最优假位置构建安全匿名集。实验结果表明,MDMASC算法相对于MMDS算法降低了约10.3%时间开销,被语义攻击算法识别的概率相比MMDS算法和K-DLS算法分别降低了14.9%和25.5%,在满足用户隐私要求的前提下具备可行性和有效性。

  • 邓昕, 刘朝晖, 欧阳燕, 陈建华
    计算机工程. 2023, 49(11): 178-186. https://doi.org/10.19678/j.issn.1000-3428.0066558
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    对网络流量进行加密有助于保护数据安全和用户隐私,但是加密也隐藏了数据的特征,提高了恶意流量识别的难度。针对传统机器学习方法依赖专家经验、现有深度学习方法对加密流量特征表征能力不足等问题,提出一种在不解密的前提下自动提取空间特征和时序特征以进行加密恶意流量识别的CNN CBAM-BiGRU Attention模型。该模型分为空间特征提取与时序特征提取两部分:空间特征提取选用不同大小的一维卷积核,为了防止空间特征丢失,修改卷积层参数代替池化层进行特征压缩和去除冗余,再利用CBAM块对提取到的不同尺寸的空间特征进行加权,使得模型能够关注到区分度高的空间特征;时序特征提取部分利用双向门控循环单元来表征数据包之间的时序依赖关系,然后利用Attention来突出会话中重要的数据包。在此基础上,将两部分特征向量进行融合,利用Softmax分类器进行二分类和多分类。在公开数据集上进行实验,结果表明,该模型在二分类任务中的加密恶意流量识别准确率达到99.95%,在多分类任务中整体准确率达到99.39%,在Dridex与Zbot类别的加密恶意流量识别中F1值相比1D_CNN、BiGRU等模型有显著提高。

  • 王雨燕, 赵佳鹏, 时金桥, 申立艳, 刘洪梦, 杨燕燕
    计算机工程. 2023, 49(11): 187-194, 210. https://doi.org/10.19678/j.issn.1000-3428.0066805
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    暗网网页中用户身份标识信息的分布呈现出稀疏、不规律的特点,当前主流的信息聚合技术无法直接应用于该场景。提出一种基于共指关系抽取的用户身份信息聚合模型,该模型输入一对用户身份信息及其上下文语境,返回该信息对是否包含共指关系,并且构建相应的用户身份信息数据集用于聚合实验。为进一步提升模型的识别能力,在基线模型的基础上引入实体类别信息,提出实体类别敏感的共指关系抽取模型。针对暗网中通过某些身份类别信息无法获取足够多训练样本的问题,引入少样本学习任务,构建基于多任务的低资源条件下用户身份信息聚合模型。实验结果表明,在低资源条件下,经过优化的聚合模型F1值达到87.03%,较基线模型提升11.98个百分点。

  • 图形图像处理
  • 方琳琳, 邓豪, 张华, 赵俊琴
    计算机工程. 2023, 49(11): 195-202. https://doi.org/10.19678/j.issn.1000-3428.0066322
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    γ辐射场景下CMOS图像传感器受高能光子影响,成像图像存在对比度不足、偏色等视觉退化问题,严重干扰γ辐射场景的清晰化可视化效果。为提升场景视觉图像质量,提出一种基于多元重映射的γ辐射场景图像增强方法,从提升图像对比度和消除颜色失真2个方面实现γ辐射场景的清晰可视化效果。针对γ辐射场景图像对比度不足的问题,利用限制对比度直方图均衡方法在抑制图像结构信息过度增强的同时提升图像对比度。针对γ辐射场景图像偏色的问题,采用颜色直方图重映射方法改善各颜色分量动态响应不均衡。通过分段非线性重映射对亮、暗区域进行不同程度的校正,解决在对比度提升及颜色校正过程中因亮暗像素同等尺度调节引起的图像局部过调问题。在真实γ辐射场景图像上进行多组对比实验,结果表明,相比典型图像增强方法,该方法在颜色、对比度、信息熵量化指标及视觉呈现中均取得较优的效果,图像质量综合评价指标最高可为3.140 76。

  • 刘禹锋, 杨帆, 刘健
    计算机工程. 2023, 49(11): 203-210. https://doi.org/10.19678/j.issn.1000-3428.0066285
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对图文法的推导工作流中存在的停机和不确定性问题,提出一种基于改进图文法的图自动推导算法,并将其应用于图样本生成。为了建立推导的停机机制,对EGG图文法进行改进,通过终结产生式确保每个非终结点可以在保持原有图规模的情况下进行有效推导并生成终结点。在图生成过程中,通过应用概率指导产生式和图柄的选择,解决了推导操作的不确定性问题。利用图自动推导算法,在满足精准推导要求的情况下保持了多项式级的时间复杂度。在EGGSS环境中开发图样本生成模块,以程序流程图样本生成为例演示推导算法的详细过程,并对不同应用概率分配下所生成图样本的规模分布情况进行分析和讨论。实验结果表明,在图样本规模限制为10的情况下,该方法通过降低终结产生式应用概率可使图样本的平均规模从3.16增至6.87。

  • 刘英芳, 王松, 马亚彤
    计算机工程. 2023, 49(11): 211-219. https://doi.org/10.19678/j.issn.1000-3428.0066051
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现有人脸属性识别模型存在的特征提取不足、划分属性组时未充分考虑属性相关性强弱等问题,为了实现对多个人脸属性的同时识别,建立一种结合特征融合和任务分组的人脸属性识别模型。在参数共享部分,通过多尺度特征融合模块将不同尺度的特征进行融合增强特征相关性,同时设计基于中心核对齐和谱聚类的属性分组策略进行属性识别,通过中心核对齐方法度量属性的相关程度,并以此为基础使用谱聚类算法得到属性的合理分组,使同一组内的属性相关性尽可能大,提高属性识别准确率。在分支部分,使用注意力机制加强对目标区域的关注,并通过不确定性加权方法表示任务间的相对难度,自动调整每组任务损失之间的相对权重,进一步优化模型性能。在CelebA公开数据集上的实验结果表明,所提模型的分类准确率相较于MOON、GNAS和DMM-CNN模型提升了0.78、0.09和0.02个百分点,参数量仅为上述对比模型的1.10%、17.08%和0.37%。

  • 吕学强, 赵兴强, 贾智彬, 韩晶
    计算机工程. 2023, 49(11): 220-230. https://doi.org/10.19678/j.issn.1000-3428.0066122
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    深度学习的可解释性对推动其在军事场景中应用至关重要。当前主流方法使用类激活图的方式可视化最后一层卷积特征,然而对于网络根据该特征进行分类解释比较模糊。针对此问题,设计一种面向分类网络的视觉语义解释模型。综合考虑前向传播与反向传播,提出CGNIS算法获取对分类结果起重要作用的神经元,并将其映射到原图,得到更加细化的视觉特征。提出分类网络IRENet,在VGG16中间层添加SIRM和ECA对视觉特征进行识别,更加客观地提取视觉特征中包含的语义特征,并结合视觉特征、语义特征、重要神经元分数信息生成描述模型分类过程的解释性语句。在ImageNet2012数据集上提取10类图像进行实验,结果表明,删除CGNIS算法得到的某一类重要神经元后,对应类的分类准确率下降3%以上,在语义特征提取任务上,IRENet的F1值、准确率、精确率和召回率4项指标较ResNet101等分类网络提升2%以上。此外,利用CGNIS、IRENet对飞机类别进行实验,可生成模型对其分类过程的解释性语句。

  • 张文丽, 程兰, 任密蜂, 续欣莹, 阎高伟, 张喆
    计算机工程. 2023, 49(11): 231-237. https://doi.org/10.19678/j.issn.1000-3428.0066359
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了提高现有点云配准模型在真实点云数据中的配准精度,基于自适应图卷积(AGConv)的局部特征描述符,提出一种改进的点云配准模型。在数据预处理模块中,通过对点云中的采样点构建局部块并计算局部参考坐标系,规范局部块中的采样点,使其对旋转变换不敏感。在特征提取模块中,利用AGConv为采样点生成自适应核,充分挖掘不同语义部分的点之间的关系,并将规范化的局部块输入基于AGConv的特征提取网络计算局部特征描述符,提高局部特征对遮挡及杂波的鲁棒性。在点云配准模块中,使用随机采样一致性算法估计刚性变换矩阵。在3DMatch数据集上的实验结果表明,相比于DIP模型,该模型的特征匹配和配准召回率分别提高了2.3和5个百分点,能有效提高点云配准精度并且具有较好的鲁棒性。

  • 雷嘉铭, 俞辉, 夏羽, 郭杰龙, 魏宪
    计算机工程. 2023, 49(11): 238-246. https://doi.org/10.19678/j.issn.1000-3428.0066214
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    三维目标检测方法是自动驾驶环境感知系统的重要技术之一,但是现有三维目标检测方法大多存在目标位置识别精度不足、目标朝向预测偏差较大的问题。为此,提出一种基于多方向特征融合的三维目标检测方法。对场景点云进行数据编码,建模距离、夹角等信息并转换成伪图像。利用所提多方向特征融合骨干网络进行特征提取和融合,基于多方向融合特征,利用以中心为基准的检测器进行潜在目标的回归和预测。该方法通过点间距离、夹角建模提供点间的相互关系,丰富特征信息,利用多方向特征融合增强骨干网络的特征提取能力,从而提高位置及朝向的预测精度。实验结果表明,该方法在KITTI和nuScenes数据集上的平均精度均值分别为64.28%和50.17%,相比次优方法分别提升了0.36和1.30个百分点,且在朝向预测准确率对比实验中均取得了最好的平均朝向相似度和平均朝向误差。此外,泛化性实验结果验证了所提多方向特征融合骨干网络能提高网络检测能力并大幅减少参数量,从而提升检测方法的应用表现。

  • 杨谢柳, 门国文, 梁文峰, 王丹, 谢正义, 范慧杰
    计算机工程. 2023, 49(11): 247-256. https://doi.org/10.19678/j.issn.1000-3428.0066610
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    因水下环境的特殊性,水下光学图像往往存在色偏、模糊、对比度低等退化现象。为恢复颜色正常、清晰的水下图像,大量的水下图像增强复原方法已被提出,但是现有的水下图像增强复原方法主要以提高水下图像的视觉效果为直接目标,对基于深度学习的水下目标检测精度的影响尚不明确。因此,使用14种典型的水下图像增强复原方法和3种典型的基于深度学习的目标检测模型,在URPC2018和URPC2019数据集上从训练集与测试集的域差异、训练集的域数量、训练集的图像数量等方面,详细深入地探讨图像增强复原方法对基于深度学习的目标检测模型精度的影响,并自建数据集进行跨数据集测试。实验结果表明,在训练集和测试集均属同一数据集时,水下图像增强复原方法无论作为图像预处理方法还是数据增强方法,对深度学习目标检测精度的提升都无明显效果,但是在跨数据集检测时,借助水下图像增强复原方法能够大幅提升深度学习目标检测精度,mAP最高可提高13.6个百分点。

  • 常文斌, 牟明任, 贾海鹏, 张云泉, 张思佳
    计算机工程. 2023, 49(11): 257-266. https://doi.org/10.19678/j.issn.1000-3428.0067337
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    图像滤波算法广泛应用在机器学习、图像处理、图像识别等领域,在降低椒盐噪声、图像二值化、边缘识别和特征提取等方面发挥着重要作用。现有图像滤波算法虽然在OpenCV开源库中均有实现,但是在Android平台的性能表现与其他平台相比仍存在较大差距。随着嵌入式平台的高速发展,实际应用对嵌入式平台上滤波算法的性能要求越来越高。为此,从形态学滤波、盒式滤波、阈值滤波、压缩滤波、算术滤波等具有广泛应用场景的滤波算法入手,提出并实现针对Android平台设计、基于OpenGL ES的一系列高性能图像滤波算法。使用OpenGL ES计算着色器对算法进行并行加速,使用纹理对象进行访存优化,并在图像边界处理、图像数据类型和数据通信等方面进行深入优化,取得了较优的性能。将优化的图像滤波算法与开源OpenCV库中对应算法进行对比,实验结果表明,基于Android平台使用OpenGL ES接口的图像滤波算法整体性能明显优于OpenCV库中的相关算法,且图像规模越大计算优势越明显,性能最大提升为OpenCV库中对应算法的110.018倍。

  • 贵向泉, 张馨月, 李立
    计算机工程. 2023, 49(11): 267-274. https://doi.org/10.19678/j.issn.1000-3428.0066329
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    皮肤黑色素瘤切片图像分辨率过大且病理特征表现形式多样,现有很多分割算法结果不精准同时消耗巨大显卡内存。针对该问题,提出一种低显存消耗的两阶段式精细分割算法。该算法第一阶段采用全局分割网络对以ResNet50为骨干的特征金字塔结构进行改进,图像特征提取过程中使用全局金字塔平均池化模块增强图像全局语义信息的提取,并采用多尺度特征融合分支将高层特征图的语义信息融入到低层特征图中,增强低层特征图语义信息的表征能力。第二阶段采用一种全局到局部的精细分割策略,以全局分割结果为基准对图像进行剪裁,得到一个较小的候选区域,将其输入到局部分割网络中,局部分割网络仅处理候选区域内的像素并与全局网络对应层共享图像特征,精细分割结果的同时减少显存的消耗。在经典数据集ISIC2018上的实验结果显示,该算法的准确度和IOU分别达到93.5%和82.1%,相较于对比的经典分割算法精度最高且占用的显卡内存减少了22.8%~36.9%,能有效适用于高分辨率皮肤病灶图像的分割任务。

  • 开发研究与工程应用
  • 李刚, 邵瑞, 周鸣乐, 李敏, 万洪林
    计算机工程. 2023, 49(11): 275-283. https://doi.org/10.19678/j.issn.1000-3428.0066270
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    工业领域的表面缺陷检测对提高工业产品质量、维护生产安全具有重要意义。因工业产品表面缺陷复杂多样、形状各异、缺陷检测场景和硬件配置不同,对工业产品的表面缺陷检测提出更高要求。基于图像的工业产品表面缺陷检测方法难以兼顾实时性和准确性的要求。为满足工业产品缺陷检测快速准确的需求,提出一种轻量级的缺陷检测网络。该网络由主干网络、多尺度特征聚合网络、残差增强网络和注意力增强网络4部分组成。其中,主干网络将通道注意力层和坐标注意力层嵌入到特征提取部分,以获取丰富的表面缺陷特征信息,多尺度特征聚合网络则融合深层语义和浅层语义特征信息,残差增强网络关注空间信息,注意力增强网络利用全局特征与局部特征的信息交互,在满足低硬件配置的同时增强模型对复杂多样缺陷的检测性能。实验结果表明,该网络在NRSD-MN、NEU-DET和PCBData等公开数据集上的精准度、召回率、F1值、mAP@0.5和GFLOPS这5项指标上优于YOLOv3-tiny、YOLOv5s、YOLOv7-tiny等同参数量级算法,能有效兼顾工业产品表面缺陷检测场景下实时性和准确性的要求。

  • 房俊, 薛晓东, 周云亮
    计算机工程. 2023, 49(11): 284-292, 301. https://doi.org/10.19678/j.issn.1000-3428.0066222
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目前大多数近似查询方法都是用一个估计值来回答查询,这种点估计的方法虽然简单但是会存在误差。区间估计方法需要在大量样本上完成计算,会造成较高的查询时延,导致在实际中难以广泛应用。以模型驱动的近似查询技术虽在效率上有一定优势,但其查询结果缺乏可靠性保障。为此,提出一种融合数据抽样和机器学习算法的近似查询方法,通过深度生成模型提高查询效率,用区间估计代替点估计来回答查询,即通过多个样本的查询结果来生成一个相对可靠的区间结果。首先利用改进的生成对抗网络模型学习数据分布,在不访问数据集的情况下快速生成多个样本,然后利用大规模并行处理架构来分配计算任务,完成样本生成和查询执行的过程,最后将查询结果返回给用户。实验结果表明,该方法得出的聚合查询区间估计结果的归一化置信区间覆盖率(NCIC)达到85%以上,在聚合函数为COUNT且选择性低于0.03的查询实验中,针对ROAD、PM2.5这2个数据集,该方法的NCIC较随机抽样方法分别提高了13.9%和14.8%,虽然其查询时延相较基准方法有所增加,但是也可满足常规应用要求。

  • 柯博文, 杨湘, 陈艳红
    计算机工程. 2023, 49(11): 293-301. https://doi.org/10.19678/j.issn.1000-3428.0066133
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    心房颤动是一种具有隐秘性的心血管疾病,发病时具有较高的致命性,因此,对其进行预判和早筛尤为重要。电子健康病历(EHR)作为常规的检查结果记录方式,相较于心电图(ECG)数据,能使房颤的预测和筛查更具普遍性。现有的基于EHR的房颤风险预测方法缺乏对房颤重要指标的关注,同时传统的基于卷积的模型无法提取到医疗诊断之间的依赖关系。提出一种双通道混合神经网络学习模型FR-ANN。该模型分两个通道进行特征提取,一个通道利用注意力机制Attention提取医疗事件之间的潜在关系,另一个通道对房颤的部分重要指标进行特征提取,这些与房颤相关的重要指标在医生的协助下筛选得到。实验结果表明,所提模型在武汉亚洲心脏病医院的私有数据集上的AUC值为80.1%,F1值为68.1%,在MIT的公共数据集MIMIC-Ⅲ上的AUC值为71.4%,F1值为62.8%,相比基于EHR数据的疾病风险预测模型在房颤风险预测任务上的表现更好。此外,注意力机制的引入提供了事后可解释性,具有临床意义。

  • 季娟娟, 王佳, 陈亚杰, 卢道华
    计算机工程. 2023, 49(11): 302-310. https://doi.org/10.19678/j.issn.1000-3428.0066734
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对液压阀块表面缺陷尺寸微小、对比度低、周围干扰信息多导致的漏检率高、识别准确率低等问题,提出一种基于改进YOLOv7的液压阀块表面微小缺陷检测算法。在多尺度特征融合模块后引入CA注意力机制来提高对微小缺陷特征信息的关注度。使用改进的UpC多支路上采样结构代替多尺度特征融合模块中的最近邻插值上采样UpSampling模块,以丰富微小缺陷的特征信息。利用改进的ELAN-RepConv结构代替多尺度特征融合模块中的ELAN_2结构,使模型在训练过程中可以学习到更多的特征信息。为了进一步提高算法的鲁棒性与收敛速度,使用离线数据增强融合Mosaic数据增强的数据增广技术与K-means++锚框聚类算法来提高算法性能。实验结果表明:该算法在液压阀块表面微小缺陷数据集中平均精度达到97.6%,较原YOLOv7算法提高8.4个百分点,检测速度达到55.2 frame/s;相较于YOLOv7系列中检测精度最高的YOLOv7-E6E算法,该算法在参数量减少75.4%的情况下,平均精度值提高1.8个百分点。所提算法在保证实时性的前提下能够有效提高检测精度。

  • 李嘉豪, 闵卫东, 陈炯缙, 朱梦, 展国伟
    计算机工程. 2023, 49(11): 311-320. https://doi.org/10.19678/j.issn.1000-3428.0066372
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    交通标志检测在智能交通领域的安全保障上具有重要作用。对于部分外观相似的交通标志在尺度变化下,现有模型难以提取它们之间的细微差异,导致标志被错误分类。此外,在复杂场景下,其他相似物体容易被误检为交通标志。为此,提出一种逐层特征细化检测模型。根据交通标志特点提出分层聚类锚框和分组损失,分层聚类锚框根据目标尺度对数据集分层并通过K-means聚类算法获取各层锚框,更好地适应交通标志灵活的尺度变化,分组损失对外观相似的类别分组并设计损失函数,指导模型学习相似交通标志间的细微差距,从而降低错误分类。在Neck层加入弱语义分割模块和特征细化模块,通过弱语义分割模块学习浅层特征上下文信息,从而分割出可信区域和非可信区域,利用特征细化模块挖掘非可信区域的上下文信息,主动学习并消除造成误检的干扰,从而降低对其他相似物体的误检。弱语义分割模块和特征细化模块结合通道注意力构建逐层细化特征金字塔,实现对多尺度特征的整体优化并提高模型精确率。实验结果表明,该方法在TT100K和GTSDB交通标志数据集上的$ \mathrm{A}{\mathrm{P}}_{50} $指标分别达到97.0%和98.6%。