作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2023年, 第49卷, 第7期 刊出日期:2023-07-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2023, 49(7): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 进化和群体智能算法与应用
  • 蔡星娟, 郭彦亨, 赵天浩, 张文生
    计算机工程. 2023, 49(7): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0066105
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    服务部署和任务卸载是边缘计算面临的两大挑战,但目前在边缘环境下都是对任务卸载这一单一问题的求解,较少考虑服务部署问题。由于服务部署与任务卸载是高度耦合的,只考虑其中一个问题具有局限性,会造成资源的浪费及较大的时延,从而影响用户的体验感。此外,传统的进化算法不能同时处理多个单目标或多目标优化任务。为解决上述问题,构建一个多任务多目标模型,将每个优化问题视作一个任务,并针对该模型提出一种改进的基于多因子优化的进化多任务算法,通过引入位置更新策略来增加搜索种群的多样性,并在此基础上设计改进选型交配方法,提高后代个体的质量。仿真实验结果表明,与多目标算法对比,该算法在SP、Span、PD等多个指标上均有较好的表现,明显提高了算法收敛性能,大幅加快了求解速度,整体系统性能提高了11.4%。

  • 费蓉, 马梦阳, 张晓, 黑新宏, 徐庆征, 邱原
    计算机工程. 2023, 49(7): 10-20. https://doi.org/10.19678/j.issn.1000-3428.0066975
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    轨迹预测和碰撞检测是自动驾驶的关键技术,可以提高自动驾驶系统对周围环境的感知能力,保障自动驾驶系统的安全性。Conv-LSTM模型能够有效处理具有时空相关性的轨迹数据,具有良好的轨迹预测能力,但该模型在交通拥堵、复杂道路等复杂情形下预测性能较差。提出一种基于行驶意图识别的轨迹预测模型。通过基于长短期记忆(LSTM)网络的行驶意图识别模块对车辆的行驶意图进行预测,基于Conv-LSTM构建轨迹预测模块,结合识别的行驶意图信息预测未来轨迹,从而提高轨迹预测的精度和可解释性。引入2种注意力机制对目标对象及其周围车辆的历史轨迹信息进行重要性分析,使模型关注最具有代表性的邻居车辆,并且更好地捕捉不同时间步之间的关系,从而提高模型的预测准确度和稳定性。针对有向包围盒碰撞检测算法执行效率低的问题,提出一种基于混合包围盒的碰撞检测算法,通过最小安全距离和最大冲突距离进行碰撞预判断,避免非冲突情况下有向包围盒的创建和基于分离轴定理的碰撞检测过程,从而提高碰撞检测的效率。在NGSIM数据集上进行实验,结果表明:该模型的均方根误差优于Conv-LSTM、sys-Conv等对比模型,轨迹预测的精度更高;与有向包围盒(OBB)算法、轴对齐包围盒(AABB)算法和AABB-OBB算法相比,基于混合包围盒的碰撞检测算法平均碰撞检测时间分别缩短了64.47%、53.88%和55.47%。

  • 潘大志, 蒋妍, 刘雅文
    计算机工程. 2023, 49(7): 21-33. https://doi.org/10.19678/j.issn.1000-3428.0066578
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对传统多维背包问题的求解算法存在的修复方式单一、种群动态适应性差等问题,提出一种双决策交互差异算法(DDEA)。融合自主学习思想,设计多维加权价值密度和相对价值概率指标,双重决策确定物品选择顺序,制定相应解的修复优化策略。采用双种群交互差异进化算法,设置主群和辅助群2个种群,种群间进行信息交互,提高种群多样性,避免陷入局部最优,提高算法寻优能力。主群实施差异进化机制,依照个体优劣依次划分为3个子群,分别按照特定方式进化,并在进化过程中完成与辅助群的交互,增强算法群智能性。引入刺激-响应机制,平衡算法的全局和局部搜索能力,并加入精英库协同寻优,加快算法收敛速度。仿真结果表明,DDEA算法可求出全部最优解,平均相对误差率为3.04×10-5,相比于同类算法降低2个数量级,有效提升了多维背包问题的求解精度、效率和稳定性。

  • 梅晶, 戴龙宝, 童钊, 邓昕, 王嘉珂
    计算机工程. 2023, 49(7): 34-46. https://doi.org/10.19678/j.issn.1000-3428.0067064
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    移动边缘计算(MEC)将计算、存储、网络资源和服务向网络边缘下沉,并允许用户在边缘服务器上处理任务。然而,在实际应用中,用户请求的任务卸载量和无线信道状态随时间不断变化,同时计算和通信资源受限也对任务卸载和资源分配任务带来了挑战。针对该问题,构建一种资源约束下面向动态环境的系统效用优化模型。该模型中各个终端设备均配备能量收集装置,充分利用外界可再生能源来支持系统处理任务。运用Lyapunov优化理论消除优化模型对不确定信息的依赖,将原依赖未知信息的目标优化问题转化为只依赖当前时间片系统信息的优化问题,使用归约法证明该优化问题为一个NP-hard问题。结合深度强化学习方法设计一种资源约束下的自适应卸载算法LyUO,该算法在系统动态信息未知的情况下实时确定近优任务卸载决策及MEC服务器通信/计算资源分配策略。仿真结果表明,LyUO算法在任务到达率和无线信道状态变化时可使系统中所有设备的任务队列保持稳定,在满足队列长期约束的同时使系统效用较基准算法提升约15%。

  • 程适, 王雪萍, 刘悦, 史玉回
    计算机工程. 2023, 49(7): 47-54. https://doi.org/10.19678/j.issn.1000-3428.0066642
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    求解非线性方程组的难点是在一次运行中获取问题的多个根,常规求解方法难以同时满足解的精度和解的数量要求。提出一种基于知识学习的目标空间头脑风暴优化(LBSOOS)算法,通过将非线性方程组问题建模为多模态优化问题进行求解,在求解过程融合算法的求解特性和待求解问题的领域知识,采用求解问题学习和求解算法学习两种学习方式解决求解精度和解集合多样性的冲突。从算法层面改进算子的学习方式,将随机解的扰动算子替换为最差解的解间学习,提高算法的整体寻优能力。通过对多模态问题进行分析,在算法中增加额外的档案集,保证输出解集合的多样性。将LBSOOS算法与5种群体智能优化算法在7个非线性方程组问题上进行性能测试,实验结果表明,LBSOOS算法在保证求解精度的条件下,在绝大多数测试问题上的求解多样性优于BSO、BSOOS、PIO等对比算法。

  • 蔡倩倩, 史旭华
    计算机工程. 2023, 49(7): 55-64. https://doi.org/10.19678/j.issn.1000-3428.0066530
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    多目标多任务进化优化是多目标优化的一个重要研究方向,通过跨任务共享有益信息以同时解决多个相关任务的优化问题。然而,现有多目标多任务进化优化研究存在相似任务匹配准确度低、缺少对知识迁移的动态控制等问题。为提高多目标多任务进化优化算法的优化效果,引入相似性动态指标和迁移概率动态调整机制,提出自适应迁移的分解多目标多任务进化算法。为了给目标任务子问题匹配关联度最高的迁移源,同时考虑种群的当前分布以及种群的进化方向2个指标,设计一种基于种群静态和动态特征相结合的迁移源匹配策略。为了合理地控制任务间的信息传递,提出基于种群进化状态的知识迁移概率自适应调整策略,在优化过程中根据优化任务的进化状态自适应地调整任务间的知识迁移概率,以满足优化任务在不同进化阶段对外部知识的需求。实验结果表明,相比MOEA/D、MO-MFEA、MO-MFEA-Ⅱ等算法,该算法具有较优的稳定性和收敛性,在常用的9组(18个独立任务)多目标多任务测试问题中有15个表现较优,优化率为83%。

  • 人工智能与模式识别
  • 聂志勇, 阴宇薇, 汤佳欣, 涂志刚
    计算机工程. 2023, 49(7): 65-75. https://doi.org/10.19678/j.issn.1000-3428.0065328
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对目前基于交并比(IoU)的框回归方法在实际应用中存在的检测精度不高、收敛速度较慢等问题,提出一种基于关键点距离交并比(KIoU)的框回归方法。从几何知识入手,将矩形的3个顶点和1个中心点作为关键点,通过计算对应点之间的距离来判断预测框与真实框的位置以及形态差异。构建基于关键点交并比损失的新型损失函数,计算实际情况与理想情况下预测框与真实框的关键点交并比之差,将关键对应点的距离作为IoU的惩罚项以加速模型收敛过程,利用关键点信息在定位上的高效性和准确性来提高目标检测精度。以单阶段目标检测算法SSD和两阶段目标检测算法Faster R-CNN为基准算法,在PASCAL VOC和COCO数据集上将KIoU与IoU、GIoU、DIoU、CIoU等4种交并比方法进行实验对比,结果表明:在检测精度方面,在Faster R-CNN上KIoU相较IoU提升了2.91%,相较目前表现较好的DIoU提升了0.11%,在SSD上KIoU相较IoU与DIoU分别提升了0.96%与0.06%;在目标检测视觉效果方面,KIoU方法对目标的定位更加准确,且在一定程度上能够减少目标漏检的情况。

  • 白明昌
    计算机工程. 2023, 49(7): 76-84. https://doi.org/10.19678/j.issn.1000-3428.0064318
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    属性网络嵌入是图分析领域具有挑战性的任务之一,旨在从网络的拓扑结构和节点特征中学习节点的低维向量表示,同时最大限度地保持其结构和固有特性,然而现有方法多数仅研究网络间的基本关系,未考虑节点邻居的相对重要性。基于此,提出一种基于折叠路径聚合的属性网络节点嵌入方法,有效挖掘属性网络中的复合关系并充分度量节点邻居的重要程度。基于拓扑结构捕获节点的直接邻居并构建结构-属性二部图,挖掘“节点-属性-节点”折叠路径中所蕴含的复合关系,捕获节点的间接邻居。设计语义路径内部聚合策略,通过卷积神经网络聚合器聚合间接邻居表示和直接邻居表示,同时融合节点属性以捕获不同语义之间细粒度的特征交互,并根据语义路径间聚合策略整合2种细粒度嵌入表示,得到最终的节点嵌入。在Flickr、ArXiv和Pubmed这3个真实数据集上的实验结果表明,该方法的节点分类性能优于先进的属性网络嵌入方法,且与Node2Vec方法相比,Macro-F1和Micro-F1值分别高出0.067~0.234。

  • 赵世豪, 毛国君, 熊保平, 黄山, 林江宏
    计算机工程. 2023, 49(7): 85-93. https://doi.org/10.19678/j.issn.1000-3428.0065313
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对传统时空图网络模型对时空序列数据空间结构刻画和时空特性挖掘不充分的问题,提出一种基于图小波神经网络的时空图挖掘模型(ST-GWNN)。基于图小波神经网络通过学习节点特征的局部化表达来捕捉时空序列数据中的空间拓扑结构,时间门控卷积层通过门控线性单元所堆叠的因果卷积来提取时间特征信息,并将多个时间步的空间图相融合来学习时间和空间2个维度关联特征的能力,以更好地捕获时空序列中复杂的时空相关性信息。在公共交通数据集PEMS-BAY上的实验结果表明,ST-GWNN模型能够获得较好的预测效果,当预测时长为15 min时,在MAE、RMSE、MAPE 3个评价指标上相较于基准模型取得最小值,且较基准模型最优值分别降低了2.31%、6.96%、5.84%;当预测时长为30 min和60 min时,较基准模型最优的MAPE、RMSE值分别降低了4.9%、3.51%和6.05%、6.68%,可适用于图网络属性的时空关系预测任务。

  • 郭艳霞, 金勇, 唐宏, 彭金枝
    计算机工程. 2023, 49(7): 94-101. https://doi.org/10.19678/j.issn.1000-3428.0064965
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了防止一段话语中含有情感色彩的重要信息被无关信息淹没并实现多模态信息交互,通过挖掘高级局部特征以及设计有效的交互融合策略,提出一种基于动态卷积与残差门控的多模态情感识别模型。提取文本、音频和图像中的低级特征、高级局部特征以及上下文依赖关系,同时使用跨模态动态卷积对模态间和模态内交互信息进行建模,模拟长序列时域间的相互作用,捕捉不同模态的交互特征。设计一种残差门控融合方法来融合不同模态交互表征,自动学习每组交互表征对最终情感识别的影响权重,并将多模态融合特征输入分类器进行情感预测。在CMU-MOSEI和IEMOCAP数据集上的实验结果表明,该模型能够避免多模态中含有情感色彩的重要信息被无关信息淹没,情感分类准确率分别达到83.5%和83.9%,性能优于MulT、MFRM等基准模型。

  • 刘豪, 吴红兰, 房宇轩
    计算机工程. 2023, 49(7): 102-109. https://doi.org/10.19678/j.issn.1000-3428.0065022
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的人体姿态估计模型通常使用复杂的网络结构提升关键点检测准确率,忽视了模型参数量和复杂度,使得模型难以部署在资源受限的计算设备上。针对这一问题,构建一个感知全局上下文信息的轻量级人体姿态估计网络模型(GCEHNet)。对HRNet进行轻量化改进,使用深度卷积模块代替HRNet结构中的标准3×3残差卷积模块,在保证网络性能的同时大幅度降低模型参数量与复杂度。为了克服卷积神经网络(CNN)在长期语义依赖性建模方面的局限性,使用双支路方法联合CNN与Transformer,将全局位置信息嵌入CNN后期模块,使GCEHNet模型能感知上下文特征信息,从而提升网络性能。设计一种CNN特征与全局位置特征高效融合的策略,通过学习联合特征信息重新分配特征权重,捕获并增强来自不同感受野的特征信息。实验结果表明,GCEHNet模型在MS COCO val2017和test-dev2017数据集上的检测准确率分别达到71.6%和71.3%,相比于HRNet模型,在检测准确率仅损失4.5%的条件下参数量降低了76.4%,在检测准确率和模型复杂度间取得了较好的平衡。

  • 邱天晨, 郑小盈, 祝永新, 封松林
    计算机工程. 2023, 49(7): 110-117. https://doi.org/10.19678/j.issn.1000-3428.0064016
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在超大规模边缘设备参与的联邦学习场景中,参与方本地数据为非独立同分布,导致总体训练数据不均衡且毒药攻击防御困难。有监督学习中增强数据均衡的多数方法所要求的先验知识与联邦学习的隐私保护原则发生冲突,而针对非独立同分布场景中的毒药攻击,现有的防御算法则过于复杂或侵害数据隐私。提出一种多服务器架构FedFog,其能在不泄露参与方本地数据分布的前提下,对数据分布相似的参与方进行聚类,将非独立同分布的训练数据转换成多个独立同分布的数据子集。基于各聚类中心,全局服务器计算出从各类别数据中提取的特征在全局模型更新时的权重,从而缓解总体训练数据不均衡的负面影响。同时,将毒药攻击防御任务从参与方全集分配至每个聚类内部,从而解决毒药攻击防御问题。实验结果表明:在总体训练数据不均衡的场景中,FedFog的全局模型精度相较FedSGD最多获得了4.2个百分点的提升;在总体数据均衡但1/3的参与方为毒药攻击者的场景中,FedFog的收敛性接近于无毒药攻击场景中的FedSGD。

  • 蔡丽娇, 秦进, 陈双
    计算机工程. 2023, 49(7): 118-124. https://doi.org/10.19678/j.issn.1000-3428.0065296
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    以内在动机为导向的探索类强化学习中,通常根据智能体对状态的熟悉程度产生内在奖励,难以获得较合适的近似度量方法,且这种长期累计度量的方式没有重视状态在其所处episode中的作用。Anchor方法使用锚代替分层强化学习中的子目标,鼓励智能体以远离锚的方式进行探索。受Anchor方法的启发,根据转移状态与同一个episode中历史状态之间的距离设计内在奖励函数,进而提出远离旧区域和避免回路的强化探索方法。将当前episode中部分历史状态组成的集合作为区域,周期性更新区域为最近访问的状态集合,根据转移状态与区域的最小距离给予智能体内在奖励,使智能体远离当前最近访问过的旧区域。将转移状态的连续前驱状态作为窗口并规定窗口大小,根据窗口范围内以转移状态为终点的最短回路长度给予内在奖励,防止智能体走回路。在经典的奖励稀疏环境MiniGrid中的实验结果表明,该方法避免了对状态熟悉程度的度量,同时以一个episode为周期对环境进行探索,有效提升了智能体的探索能力。

  • 张家熔, 苑津莎, 许珈宁, 罗志宏
    计算机工程. 2023, 49(7): 125-134. https://doi.org/10.19678/j.issn.1000-3428.0065117
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    自动抽取力学问题中的关键实体是力学问题自动解答的重要手段。然而,与开放域相比,力学问题具有大量的专业词汇和较长的实体,其识别难度高,准确率低。针对该问题,基于图注意力网络(GAT)和Transformer编码器提出一种用于力学问题关键实体抽取的实体识别算法。针对汉语的特点设计一个包括字符信息、词汇信息和部首信息的多元信息嵌入用于增强中文句子表示。提出结构图和语境图两个图模型对中文句子进行建模,并设计一种协同架构,该架构使用两个独立的GAT整合多元信息并学习句子的上下文信息。为平衡词汇信息与部首信息对中文字符的影响,提出一种协同Transformer架构,该架构由字符-词汇Transformer与字符-部首Transformer构成,并增加词汇-部首注意力偏置,从而增强模型的识别能力。在自建的数据集上进行多组对比实验,结果表明,在力学问题实体识别任务中,相对于WCGCN算法,该算法在精度、召回率和F1值上分别提高1.92、0.99和1.44个百分点,能够有效提取力学问题中的关键信息。

  • 杨璇, 马建敏, 赵曼君
    计算机工程. 2023, 49(7): 135-142. https://doi.org/10.19678/j.issn.1000-3428.0065390
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    特征选择作为一种数据预处理方法,主要目的是消除冗余和不相关属性,保留性能显著的属性,从而提高模型精度且降低计算复杂度。传统的特征选择方法多基于截面数据,对于实际生活中大量存在的高维时序数据的研究较少。现有特征选择算法并未考虑属性间相互依赖的影响,导致分类性能下降。为此,提出基于邻域互信息的高维时序数据特征选择方法。构建时序信息系统,提出时序邻域关系,并引入该关系下的时序邻域熵、时序邻域联合熵、时序邻域互信息等信息度量。在最近最远邻特征选择算法(算法1)中引入高维时序数据,定义属性重要度,以确定分类性能较优的特征,通过引入累计重要度贡献率控制特征选择规模。设计最近最远邻邻域互信息特征选择算法(算法2),根据阈值得到分类能力强的初始特征集,进一步由时序邻域互信息定义属性冗余度,去除初始特征集中重要度最低、依赖程度最大的属性,得到最终特征子集。在UCR数据集上的实验结果表明,相比原始数据和所提算法1,所提算法2在最佳取值范围和分类精度上分别平均提升13.69%和6.70%,对于处理高维时序数据的特征选择具有一定的有效性和优越性。

  • 顾轶寅, 王鸿奎, 殷海兵
    计算机工程. 2023, 49(7): 143-149. https://doi.org/10.19678/j.issn.1000-3428.0064999
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    系数独立的死区硬判决量化是典型的视频编码量化算法,复杂度低,但算法性能相对低下。新一代视频编码标准VVC引入基于动态规划的依赖量化(DQ)算法,编码性能显著提升,但计算复杂度急剧增加。由于算法系数间依赖性高,量化候选搜索空间复杂,导致遍历计算率失真代价效率较低。为此,提出一种基于上下文的量化候选剪枝算法,减小动态规划搜索空间,解决量化候选搜索复杂度较高的问题。依据DQ算法原理和量化结果的统计分析,发现DQ量化结果与量化余数、系数位置、邻域量化结果等上下文变量密切相关,将复杂的动态规划量化抽象为余数、位置、邻域量化结果多变量多区间分类问题,针对同一区间内存在的不同量化结果,通过分析同一区间内样本的累积分布函数,提出基于阈值比较的剪枝方法,裁剪部分“安全”的量化候选,减小搜索空间,简化全路径搜索。实验结果表明,快速DQ算法在All Intra和Random Access配置下,率失真性能平均损失分别为0.19%和0.34%,编码复杂度平均降低了4.31%和3.36%。

  • 汤卫芬, 高翠芳
    计算机工程. 2023, 49(7): 150-160. https://doi.org/10.19678/j.issn.1000-3428.0065500
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现有动态时间规整(DTW)算法普遍计算量大、时间复杂度高的问题,提出极值点自适应加权的动态时间规整算法(EWDTW)。局部极值的波动可反映序列变化趋势和整体形状特征,在提取局部极值点后按其原有位置分布近似表示原始时间序列,降低原始序列维数。在计算极值序列最佳动态弯曲路径的过程中,基于极值点的相位差、大小、类型等特征量为每个点设置自适应代价权重。利用权重参数调整距离矩阵的加权结构以适应不同特征的数据,并在降低计算复杂度的同时有效改善序列的病态对齐现象。实验结果表明,相比于DTW及其衍生算法,EWDTW算法在15个UCR数据集上的运算效率提升了10倍以上,尤其是在长时间序列和极值点占比低的序列上表现突出,并且对于大部分不同类型的时间序列具有良好度量性能,分类准确率更高。

  • 图形图像处理
  • 侯华, 郭宏洋, 代超娜, 李峻辉
    计算机工程. 2023, 49(7): 161-168. https://doi.org/10.19678/j.issn.1000-3428.0064969
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于深度学习的立体匹配算法具有较高的精度,但存在速度慢、显存消耗大与视差搜索范围受限等问题。为此,提出一种多重注意力和迭代优化相结合的立体匹配算法。给出Transformer结构的交叉注意力模块,聚合左右图之间的全局和局部特征信息,获取左右图之间沿极线方向的长距离依赖关系,可更加有效地融合左右图全局特征信息,并生成无视差范围限制的视差图。通过设计迭代残差优化模块,在最小尺度上依据交叉注意力模块生成无视差范围限制的稠密视差图,依据迭代方式逐步恢复视差分辨率生成稀疏代价体,并经过视差回归后估计视差残差图,在保留稠密视差图优点的同时减少计算成本和显存消耗。在此基础上,设计上下文注意力模块,捕获动、静态上下文特征信息,减少浮点运算数量和参数量,为代价聚合提供丰富的显著特征。在SceneFlow、KITTI2012和KITTI2015数据集上的实验结果表明,与主流算法AANet相比,该算法精度分别提高了0.46%、0.47%和0.25%,同时推理速度平均降低了50%。

  • 李军侠, 王星驰, 殷梓, 石德硕
    计算机工程. 2023, 49(7): 169-178. https://doi.org/10.19678/j.issn.1000-3428.0065413
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于深度学习的显著性目标检测算法大多依赖于大规模标注数据下的监督学习模式,但是,样本的像素级标签存在获取困难、标注成本高的问题。为此,设计一种边缘深度挖掘的弱监督显著性目标检测算法,仅使用图像级类别标签,从输入图像的显著性目标边缘角度得到能够较准确描述目标轮廓信息的边缘特征图,以生成伪标签对显著性模型进行监督训练。通过粗糙边缘生成模块对显著性目标轮廓特征进行简单标定,用于获取粗糙边缘特征图。在此基础上,利用精细边缘生成模块优化特征以得到精细边缘特征图,能够更准确地反映目标的边界信息,在完整刻画轮廓信息的同时可以更好地抑制背景噪声。伪标签生成模块基于精细边缘特征图生成像素级伪标签。实验结果表明,相比MSW、MFNet、NSAL等算法,该算法能够准确识别显著性区域,获得的预测图具有较完整的细节信息,其中,在ECSSD数据集上S-measure值和E-measure值相较于第2名NSAL算法分别提高1.1和0.6个百分点。

  • 吴珊, 周凤
    计算机工程. 2023, 49(7): 179-188. https://doi.org/10.19678/j.issn.1000-3428.0065253
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    SSD属于经典的单阶段目标检测算法,通过在不同卷积层上生成6个尺度的特征图进行预测,但由于其存在浅层特征图的非线性程度不够、语义信息缺乏等问题,且小目标所含像素少,导致小目标在经过多次卷积操作后信息丢失严重,小目标的检测准确率远低于大中尺度目标的检测准确率。提出多尺度特征与混合注意力机制融合的策略,在替换原骨干网络的基础上构建自下而上的下采样路径和自上而下的上采样路径。具体来说,下采样路径使用自注意力机制自适应地增强浅层空间特征和深层语义特征。在上采样路径中,通过融合3个尺度特征图的局部信息和全局信息,增强深层特征的语义信息,并引入空间注意力机制和坐标注意力机制以丰富待融合特征图的语义信息和位置信息,同时使用自注意力增强模块增强融合特征的表达能力。实验结果表明,当输入图像大小为512×512像素时,所提改进算法在PASCAL VOC和HRRSD数据集上的平均精度均值分别为84.6%、89.6%,与SSD算法相比分别提高了6.1、8.8个百分点。

  • 惠子薇, 何坤, 冯犇, 苏曜
    计算机工程. 2023, 49(7): 189-195. https://doi.org/10.19678/j.issn.1000-3428.0064923
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对传统图像质量评价算法特征单一、全局和局部特征相关性不高的问题,从人眼视觉特性出发,结合图像全局与局部特征,提出一种基于视觉特性的图像质量评价算法。依据人眼视觉对亮度的响应和位置信息将图像划分为各个视觉区域,根据亮度和位置信息分割小区域,再利用颜色和位置信息对小区域进行合并以生成视觉仿生区域。利用区域内的颜色分布和区域之间的KL距离分别表示局部特征和全局特征,计算图像任意空间近邻区域颜色分布的KL距离以构建二元关系矩阵,即图像区域颜色相似性矩阵。在此基础上,对矩阵进行奇异值分解,提取矩阵的相似性信息,构造图像质量评价指标。在LIVE、CSIQ、TID2008这3个公开图像数据库上进行测试,结果表明,与PSNR、SSIM、BRISQUE、BIQI等算法相比,该算法的Pearson线性相关系数(PLCC)、Spearman等级相关系数(SROCC)、Kendall等级相关系数(KROCC)均取得了稳定且优异的结果,在LIVE和CSIQ数据库上的PLCC、SROCC和KROCC分别达到0.959 0、0.947 8、0.865 3和0.940 4、0.938 8、0.801 7,其评价结果与人眼主观质量评价结果具有高度的一致性,能够较好地评价图像质量。

  • 谢虹, 姜文刚
    计算机工程. 2023, 49(7): 196-203. https://doi.org/10.19678/j.issn.1000-3428.0064914
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现实场景中人脸局部遮挡导致的表情识别准确度较低的问题,提出一种RRA-InceptionV3结合鲁棒稀疏表示的表情识别方法。将人脸图像通过多支路卷积运算和空洞卷积模块来获取丰富的表情特征,基于Asm-CBAM卷积注意力机制划分人脸表情特征的权重并进行多特征融合,随后堆叠密集残差模块,从多通道中自适应提取人脸特征信息,通过Asm-CBAM卷积注意力机制提高网络对人脸关键特征的注意力。在此基础上,利用鲁棒稀疏表示分类器方法对表情进行分类。在人脸数据集FER2013和CK+上的实验结果表明,该方法的人脸表情平均识别精度分别达到79.86%和98.74%,与OAD Net算法相比,分别高出7.50和3.14个百分点,能够高效提取人脸表情特征。此外,在人脸被遮挡的情况下具有较强的鲁棒性,有效提高了在人脸遮挡情况下表情识别的准确度。

  • 曹坪, 杨怀志, 薄一军, 尤嘉, 张淳杰, 李丹勇
    计算机工程. 2023, 49(7): 204-213. https://doi.org/10.19678/j.issn.1000-3428.0065323
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    裂缝受损程度分类是混凝土安全检测中重要的环节之一,在真实场景下,由于裂缝图像分辨率的降低和模糊噪声的增多,导致现有的分类方法难以识别低质量裂缝图像的受损程度。提出一种面向低质量裂缝图像的多知识蒸馏分类方法,基于退化重建网络的教师模型通过模拟高分辨率裂缝图像的退化和重建过程,缓解与学生模型之间的域差异,利用高质量模型引导的学生模型从具有高分辨率信息的教师模型中学习类别知识和重建知识。通过将教师模型的类别知识迁移到学生模型中,使教师模型的重建网络监督学生模型生成更有利于分类的超分辨率图像,确保图像恢复和图像分类之间的动态交互。经过教师模型的重建知识和类别知识的多重知识引导,使缺乏高分辨率信息的学生模型能有效识别低质量裂缝图像的受损程度。实验结果表明,与单一知识蒸馏的方法相比,该方法在最低分辨率的情况下,在裂缝数据集上的分类准确率提高了4.02个百分点,能有效提高低质量裂缝图像受损程度的分类准确率。

  • 席建锐, 唐红梅, 梁春阳, 刘鑫
    计算机工程. 2023, 49(7): 214-222. https://doi.org/10.19678/j.issn.1000-3428.0064984
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    利用隐函数对非结构化点云进行物体重建,具有不受拓扑结构和分辨率限制的特点,但是存在重建物体结构不准确、缺乏局部细节等问题。为此,提出一种样条编码和长短期记忆(LSTM) 网络相结合的改进点云物体重建算法。针对重建物体缺乏局部细节的问题,提出一种增强细节表示能力的样条编码模块,采用均匀二次B样条提取点云的局部位置特征信息。为了提高隐函数的重建准确率,设计LSTM点云预测模块,挖掘点云潜在的空间结构信息,利用包含空间相关性的动态权重自适应地预测靠近物体表面的点云,进一步提高隐式重建的准确率。为提高点云预测的合理性,引入点云变形损失和结构排斥损失,用于优化预测点云的整体结构。在2个公开的三维模型数据集ShapeNet和ABC上进行实验验证,结果表明,该算法的倒角距离分别为0.009%和0.427%,与DeepSDF、CurrSDF和MetaSDF算法相比,所提算法能够重建出更丰富的细节特征,获得更准确的重建结果及良好的视觉效果;在真实世界数据集Pix3D上的实验结果表明,该算法相较对比算法具有更优的泛化性能。

  • 王款, 宣士斌, 何雪东, 李紫薇, 李嘉祥
    计算机工程. 2023, 49(7): 223-231. https://doi.org/10.19678/j.issn.1000-3428.0065330
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有用于人体姿态估计的深度卷积网络方法大多采用堆叠Transformer编码器技术,未充分考虑低分辨率全局语义信息,存在模型学习困难、推理成本高等问题。提出基于交叉注意力的Transformer多尺度表征学习方法。利用深度卷积网络获取不同分辨率特征图,将特征图转变为多尺度视觉标记,并且预估关键点在标记空间中的分布提高模型的收敛速度。为增强低分辨率全局语义的可识别性,提出多尺度交叉注意力模块,该模块通过对不同分辨率特征标记之间的多次交互,以及对关键点标记采取移动关键点策略,实现减少关键点标记冗余和交叉融合操作次数,交叉注意力融合模块从特征标记中抽取的不同尺度特征信息形成关键点标记,有助于降低上采样融合的不准确性。在多项基准数据集上的实验结果表明,与当前最先进的TokenPose方法相比,该方法能有效促进Transformer编码器对关键点之间关联关系的学习,在不降低性能的前提下计算代价下降11.8%。

  • 付雪, 朱良宽, 黄建平, 王璟瑀, ARYSTANRyspayev
    计算机工程. 2023, 49(7): 232-241. https://doi.org/10.19678/j.issn.1000-3428.0065186
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    多阈值图像分割是一种简单、准确、高效且普遍的图像分割方法,相比单阈值图像分割更适用于包含大量信息的彩色图像。在多阈值图像分割中,随着阈值数量的增加,传统的枚举法计算量增大,分割一幅彩色图像不仅需要更多的时间,而且分割精度也随之降低。提出一种基于改进北方苍鹰优化(INGO)算法的多阈值图像分割方法。利用立方混沌优化与透镜成像反向学习策略增加种群多样性,在优化初始解的同时扩大种群搜索范围,使INGO算法尽可能搜索到潜在的最优解,增强算法的搜索能力。将最优最差反向与透镜成像反向学习策略相结合,避免INGO算法易陷入局部最优的情况,提高收敛精度。在对经典的伯克利测试图像进行多阈值彩色图像分割的实验结果表明,在GWO、PSO、ChOA等算法中,INGO算法取得峰值信噪比和特征相似度最优平均值的占比分别为100.000%和78.125%,在保证算法收敛效率的同时获得较优的图像分割结果,在多阈值图像分割领域具有较强的理论应用价值。

  • 徐正梅, 刘华明, 毕学慧, 王亚
    计算机工程. 2023, 49(7): 242-250. https://doi.org/10.19678/j.issn.1000-3428.0064884
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    光场图像因其能够捕捉光的方向信息而备受学术界和产业界的广泛关注,然而,光场图像在压缩和重建过程中常会出现不同程度的失真,影响光场图像的后续处理和应用。因此,需要设计一个光场图像质量评估器来估计失真光场图像的质量。传统的光场图像评价方法在提取光场图像的空间特征和角度特征时,未充分考虑人眼视觉的多通道特性以及人眼对角度变化的敏感性,从而影响光场图像的质量评价结果。为此,提出一种无参考光场图像质量评价方法。设计多频带局部二值模式算法,提取光场图像的空间特征并利用优化提取的空间特征测量光场图像的空间质量。提出加权局部相位量化算法,该算法在对微透镜图像单元中提取的角度特征进行相位量化时,根据角度信息变化的强弱赋予不同的权值。在此基础上,将空间和角度纹理特征结合成一维特征向量,输入到已经训练的支持向量回归中,得到光场图像的质量分数。在Win5-LID和NBU-LF1.0数据集上的实验结果表明,该方法的斯皮尔曼等级相关系数分别为0.799 1和0.803 2,相比SSIM、FSIM、BRISQUE等方法,具有更优的质量评估准确性和稳定性。

  • 开发研究与工程应用
  • 闫兴亚, 匡娅茜, 白光睿, 李月
    计算机工程. 2023, 49(7): 251-258. https://doi.org/10.19678/j.issn.1000-3428.0065369
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    学生课堂行为动作能够直接反映课堂质量,通过人工智能和大数据对课堂行为进行分析和评估,有助于提高教学质量。传统的学生课堂行为识别方法通过老师直接观察学生状态,或者是课后通过监控视频进行分析,该课堂行为识别方法耗时耗力且识别率较低,难以实时反映课堂以及考试中存在的问题。提出基于深度学习的姿态识别方法BetaPose。采用数据增强技术提高后续检测模型的鲁棒性,通过改进的YOLOv5目标检测算法得到人体检测框,并基于MobileNetV3模型设计轻量级姿态识别模型,提高在拥挤场景下的姿态识别准确率,将得到的人体关键点图输入到线性分类器中,获得最终行为结果,有效提高模型的建模和表达能力。实验结果表明,所提轻量级姿态识别方法BetaPose对人体各个部位的平均识别准确率最高可达82.6%,在简易和拥挤场景下对各种行为的识别率分别达到91%和85%以上,能够有效识别课堂的多种行为。

  • 余长宏, 陆雅, 王海鑫, 高明
    计算机工程. 2023, 49(7): 259-268. https://doi.org/10.19678/j.issn.1000-3428.0064882
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的物联网设备流量分类方案多依赖完整的流或流的前几个数据包。依赖完整的流会使流量数据增多,从而增加计算复杂度与存储资源的消耗,但物联网设备的存储空间与CPU性能都十分有限;而依赖流的前几个数据包,若其部分数据包丢失就会导致分类效果变差。针对上述问题,提出一种基于滑动时间窗口的随机森林物联网设备流量分类算法,利用物联网流量信息来表征各种设备的属性。首先,基于物联网设备流量时间依赖性的特点,利用滑动时间窗口将流划分为多个时间周期为T的子流;然后,基于物联网设备流量的加密特性,从子流中提取流信息与流头部的数据包信息建立特征向量;最后,基于随机森林随机抽样和随机选特征的特性构建分类模型,以增强模型的泛化能力,进一步提高分类性能。在公开数据集UNSW上的实验结果表明,该算法的分类准确率为96.23%、精确率为94.8%、召回率为91.47%、F1值为93%,具有较好的分类效果。

  • 靳雁霞, 史志儒, 杨晶, 刘亚变, 乔星宇, 张翎
    计算机工程. 2023, 49(7): 269-277. https://doi.org/10.19678/j.issn.1000-3428.0064921
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为解决布料与精细建模物体间碰撞检测速度慢、剔除率低等问题,提出简化模型的有向包围盒(OBB)算法和使用深度神经网络优化的连续碰撞检测(CCD)算法提高碰撞检测效率。在粗略检测阶段, 提出一种简化模型的OBB算法,对于精细建模物体使用二次误差度量的表面简化法对精细模型进行简化,将简化后的模型嵌入原模型中,并利用一种快速自适应的OBB算法对简化后的模型构建包围盒。对于布料模型,构建固定球形-轴向混合包围盒和碰撞检测包围盒树。在精确检测阶段,采用全连接深度神经网络学习滤波器剔除在粗略检测阶段未发生碰撞的碰撞对,使用训练后的最优深度神经网络模型优化连续碰撞检测算法。实验结果表明,使用简化程度为90%的模型构建的OBB可以完全替代原模型的OBB,所提简化模型的OBB算法与传统OBB包围盒算法及快速自适应包围盒算法相比,在耗时上分别缩短了约64.6%、35.8%。在布料与精细建模物体交互的场景下,使用深度神经网络优化的CCD算法比使用不同类型滤波器优化的CCD算法速度更快,耗时缩短了约7%~11%。

  • 齐咏生, 杜晓旭, 朱俊峰, 高胜利, 刘利强
    计算机工程. 2023, 49(7): 278-287. https://doi.org/10.19678/j.issn.1000-3428.0064802
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    实现大数据管理牲畜需要实时监测牲畜,但对牲畜进行实时监测容易受到目标尺寸变化大、光照、环境因素等干扰,因此检测难度大,现有牲畜检测算法存在鲁棒性差等问题。提出一种基于增强型YOLOv4-tiny的目标检测算法(E-YOLOv4-tiny),采用多尺度特征融合的金字塔网络,兼顾浅层局部细节特征与深层语义信息,解决牧区牲畜尺寸波动问题。通过改进残差结构,减少主干网络参数量,以适应嵌入式平台需求。引入一种新的复合聚类算法设计锚框,在保证可移植性的前提下提高算法精度。针对牧区环境特点,提出一种新的复合多通道注意力机制,改善目标检测网络精度差的问题,增强算法鲁棒性。实验结果表明,E-YOLOv4-tiny算法的平均精度均值(mAP)为0.878 9,帧率为32帧/s,相较于传统YOLOv4-tiny算法,在保持几乎相同的检测速率条件下,mAP提升了9.32%。

  • 殷文君, 黄建华, 纪元法
    计算机工程. 2023, 49(7): 288-294. https://doi.org/10.19678/j.issn.1000-3428.0065381
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    皮肤癌的诊断受医生个人主观影响较大,现有的神经网络皮肤癌诊断研究大多停留在图像层面,没有考虑患者的临床数据,诊断准确率有待提高。提出一种融合皮肤肿瘤临床患者元数据的MD-Layer模块,并嵌入到密集卷积分类网络模型DenseNet-169中。在ImageNet数据集上对DenseNet-169网络进行预训练,使得到的模型在皮肤癌数据集上进行调参训练,并提取图像隐含的高层次特征。MD-Layer模块由MetaNet模块和MetaBlock模块提取到的特征融合构建而来。MetaNet模块通过元数据控制DenseNet-169网络中每个特征通道的特定部分,从而获得加权特征。MetaBlock模块利用元数据增强从图像中提取的特征,即根据元数据信息引导图像选择最相关的特征输出。最后,将融合后的结果输入到分类器,实现皮肤肿瘤的分类。实验结果表明,融合MD-Layer模块的DenseNet-169网络模型的平衡准确率为0.814,相较于已有工作提升0.080~0.156,解决了少数皮肤肿瘤类别诊断准确率不高的问题。

  • 杨萍, 吴振宇, 龙刚, 杨华晖, 杨竣铎, 刘鹏辉, 牛颖蓓
    计算机工程. 2023, 49(7): 295-304. https://doi.org/10.19678/j.issn.1000-3428.0065480
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的基于代码覆盖和功能覆盖的软件测试充分性评价方法,能够满足嵌入式软件或小规模信息系统软件的测试充分性评价要求,但由于指挥信息系统具有规模大、用户多、任务多样且复杂性高等特点,从代码覆盖和功能覆盖的角度难以做到对测试充分性的有效衡量和全面评价。提出一种基于任务剖面的指挥信息系统测试充分性评价方法,通过分析指挥信息系统的使用场景和业务需求构建任务剖面,根据马尔可夫链理论研究任务剖面相关特性和梳理任务状态间的时序交互关系,建立基于任务剖面和系统特征状态的测试仿真模型,通过构建基于系统特征状态、迁移边和变量空间等维度的测试充分性评价指标体系,采用模糊综合评价方法实现测试仿真模型的测试充分性量化评价。以文电传输下发为对象进行实例验证,结果表明,测试路径概率乘积最高的13条测试序列即可达到测试充分性为非常充分的评价结果,相较于测试仿真模型识别出的89条测试序列,执行的测试序列规模下降85%以上,实现了测试效率和测试充分性的平衡。

  • 褚跃跃, 闫飞, 李浦
    计算机工程. 2023, 49(7): 305-312. https://doi.org/10.19678/j.issn.1000-3428.0065007
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    城市交通流具有随机性,导致存在诸多未知干扰,在一定程度上影响了交通流模型的质量,使得基于交通流模型的城市交通信号预测控制效果受到限制。已有城市交通信号预测控制方法大多是对控制目标和控制方法进行改进,忽略了模型建立过程中由于城市交通流随机性而带来的扰动。针对该问题,在宏观交通流模型的基础上建立路网路段模型,通过模型预测控制对交叉口的排队长度进行控制,同时利用城市路网交通流的周期性特征,通过迭代学习对交通流预测模型中的未知重复扰动进行补偿,以减少扰动对所建立路网路段模型的影响。在此基础上,提出一种含扰动迭代学习补偿的城市交通信号预测控制方法,有效结合迭代学习和模型预测控制的优势,通过改变路口信号时长使路网内的车辆分布更加均匀,提高路网最大通行能力。数学分析结果验证了该方法的收敛性。仿真结果表明,相比固定配时和不含迭代补偿的模型预测控制2种方案,在该方法下路网中车辆的平均停车次数分别减少23%和10%,车辆平均延误时间分别缩短16%和8%,车辆平均速度分别提高14%和5%。

  • 刘波, 李小霞, 秦佳敏, 周颖玥
    计算机工程. 2023, 49(7): 313-320. https://doi.org/10.19678/j.issn.1000-3428.0065311
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    食管内镜图像多类癌前病变区域的类间特征差异小且个体差异大,难以实现高精度分割,使用自注意力机制可提取远距离依赖信息以获取判别性特征,但是计算开销大。为此,提出一种全局相关块级自注意力(GC-BLSA)方法,用于食管癌前病变区域分割。利用块级自注意力对骨干网络的输出特征进行分块,并在多个特征块上引入自注意力机制,降低网络参数量和计算量,采用块相关机制建模每个特征块和整个特征图之间的关系,解决每个特征块在单独使用自注意力时无法提取与全局相关的远距离依赖信息的问题。在此基础上,在块级自注意力模块中引入相对位置偏移对位置信息进行补充,有效提高网络分割精度。实验结果表明,在四分类食管癌数据集上该方法的分割指标mIoU和F1值分别为50.213%和63.786%,相比传统自注意力Non-local模块分别提高3.744和4.297个百分点,参数量和计算量分别下降26.38%和10.62%。