计算机工程

Select

2025年第6期《计算机工程》中英文目录

计算机工程. 2025, 51(6): 0-0.

摘要 ( ) PDF全文 ( )

可视化

Select

声景识音：数字化时代声学场景分类的探索与前沿

庞鑫, 葛凤培, 李艳玲

计算机工程. 2025, 51(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境，是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步，近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程，梳理了该领域的早期工作和近期发展，全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战；其次详细介绍了ASC的主流框架，重点阐述了应用于此领域的深度学习算法；然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集；最后对ASC的发展趋势进行探讨与展望。

Select

有噪声加权无标度小世界网络的一致性问题

董宇泽, 章忠志

计算机工程. 2025, 51(6): 20-28. https://doi.org/10.19678/j.issn.1000-3428.0070532

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

一致性问题是分布式系统和网络控制中的一个基本问题。传统上，关于一致性的研究主要集中于无权网络，忽略了网络中边的权重影响。然而，现实中的网络，如交通网络、社交网络和电力网络，往往具有显著的加权特性，单纯依赖无权网络模型无法充分刻画其中的复杂交互行为。为了将权重影响纳入网络分析，重点研究了一类伪分形加权网络簇，探讨了边的权重对网络一致性的影响。利用拉普拉斯矩阵构建基尔霍夫指标与网络一致性的关系，深入分析一致性问题在加权网络中的表现。通过计算在相邻迭代间不同指标的递推关系，推导出相关指标的精确计算公式，包括基尔霍夫指标、加法基尔霍夫指标、乘法基尔霍夫指标和网络一致性等重要量的计算公式。数值分析表明，随着网络规模的增长，加权网络中的一致性逐渐收敛为常数，网络能够更好地抵抗外部噪声的影响。

Select

基于图注意力网络的门级网表功能识别

秦永旺, 张洋, 胡星, 刘胜, 李少青

计算机工程. 2025, 51(6): 29-37. https://doi.org/10.19678/j.issn.1000-3428.0068882

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

随着集成电路设计复杂度的急剧攀升，其呈现出全球化和分工化的发展趋势，需要越来越多的第三方知识产权(IP)核提供者的参与。第三方IP核的广泛使用会引入硬件木马，为了检测和评估第三方IP核是否存在硬件木马以及硬件木马的功能，迫切需要探索出一种可行的IP核硬件安全评估方法，数字电路模块的功能识别作为硬件木马分析的基础研究引起了人们的广泛关注。将电路功能检测任务转换为多分类任务，结合电路结构和图数据结构的特点，提出一种基于图注意力网络(GAT)的门级电路功能分类和检测方法。首先，针对门级网表缺乏功能识别数据集的问题，通过搜集具有代表性的寄存器传输级(RTL)代码并综合生成门级网表，构建一个规模适当、种类多样的门级电路数据集。然后，为了提取和处理电路特征信息，开发了一种基于文本识别的软件工具，将复杂的电路互连结构映射为结构简单的JSON(JavaScript Object Notation)格式，便于神经网络处理。最后，采用图注意力神经网络，利用构建的门级网表数据集对多分类器进行训练，经过训练后的多分类器能够对未知门级电路进行分类和识别。实验结果表明，该多分类器通过对自建数据集中6类共计3 000多条网表数据进行学习后，最终对6类645个网表能够达到90%的分类正确率。

Select

基于个性化PageRank高阶邻域聚合的图神经网络增强

商雅名, 吴安彪, 袁野, 王一舒

计算机工程. 2025, 51(6): 38-48. https://doi.org/10.19678/j.issn.1000-3428.0068976

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

图神经网络(GNN)的关键思想是通过图的拓扑结构来聚合邻域信息学习目标节点的信息表征，当图中存在与下游任务无关的边，或者节点的邻居有限时，都会限制神经网络的表达。现有的增强方法很少从结构和特征两方面出发来同时增强图数据，其中现有的局域增强方法运用生成模型通过一阶邻域来生成特征，无法为节点获得更多相关高阶邻域信息。针对这种现象，提出一种有效的数据增强策略。首先运用边预测模型来调整图的拓扑结构，提高信噪比(SNR)，促进节点之间的消息传递；然后运用个性化PageRank(PPR)算法从全局角度聚合多阶邻域中的有效信息进行全局特征增强；最后运用生成模型来生成更多特征进行局域增强，丰富节点表达，尤其是低度节点。实验结果表明，在Cora、CiteSeer和PubMed数据集上，在图卷积网络(GCN)和图注意力网络(GAT)模型上运用该数据增强策略，在测试精度方面模型准确率平均提高3.1和1.3百分点，证明当应用于不同的基准集的各种神经网络架构时，该数据增强策略都能产生一定程度上的性能提升。

Select

基于交叉模态注意力特征增强的医学视觉问答

刘凯, 任洪逸, 李蓥, 季怡, 刘纯平

计算机工程. 2025, 51(6): 49-56. https://doi.org/10.19678/j.issn.1000-3428.0068910

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

医学视觉问答(Med-VQA)需要对医学图像内容与问题文本内容进行理解与结合，因此设计有效的模态表征及跨模态的融合方法对Med-VQA任务的表现至关重要。目前，Med-VQA方法通常只关注医学图像的全局特征以及单一模态内注意力分布，忽略了图像的局部特征所包含的医学信息与跨模态间的交互作用，从而限制了图像内容理解。针对以上问题，提出一种交叉模态注意力特征增强的Med-VQA模型(CMAG-MVQA)。基于U-Net编码有效增强图像局部特征，从交叉模态协同角度提出选择引导注意力方法，为单模态表征引入其他模态的交互信息，同时利用自注意力机制进一步增强选择引导注意力的图像表征。在VQA-RAD医学问答数据集上的消融与对比实验表明，所提方法在Med-VQA任务上有良好的表现，相比于现有同类方法，其在特征表征上性能得到较好改善。

Select

一种基于块平均正交权重修正的连续学习算法

廖丁丁, 刘俊峰, 曾君, 邱晓欢

计算机工程. 2025, 51(6): 57-64. https://doi.org/10.19678/j.issn.1000-3428.0069310

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

连续学习能力是人类智能行为的一个重要的方面，可使人类具有持续获取新知识的能力。然而，大量的研究表明，当前常规的深度神经网络并不具备这样的连续学习能力，它们在序列学习新任务后，往往会对已学习的任务产生灾难性遗忘，从而无法持续地积累新知识，这限制了智能水平的进一步提升。因而，使深度神经网络具备连续学习能力是达成强人工智能技术的一项重要课题。提出一种基于块平均正交权重修正的连续学习算法(B-OWM)。该算法采用具有极优值分块数的输入样本块平均向量组作为输入空间的表示，结合正交权重修正(OWN)思想来更新网络参数，使得深度神经网络模型在学习新任务时可以克服对已学习知识的灾难性遗忘。在多个数据集上进行的大量任务不相交类增量连续学习实验表明，B-OWM在连续学习性能上显著优于OWM算法，尤其在大批次数连续学习场景中，测试精度提升率可达80%。

Select

基于大内核自适应融合的小目标检测算法

王磊, 胡君红, 任洋

计算机工程. 2025, 51(6): 65-73. https://doi.org/10.19678/j.issn.1000-3428.0068540

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

针对当前基于卷积神经网络的单阶段目标检测算法(YOLO系列、VFNet等)在高空拍摄场景下目标背景复杂、检测精度低、特征混叠等问题，提出一种端到端的目标检测算法CSPENet。首先，采用基于大内核深度卷积CSPNeXt作为模型主干，提高模型捕捉全局上下文的能力；其次，通过引入特征细化模块(FRM)在空间和通道维度上生成自适应权重，可有效抑制混叠特征，并在特征融合阶段添加基于移动网络的感受野注意力(RFA)机制解决大内核参数共享问题；最后，采用EIoU损失函数作为模型的回归损失函数，并拆分预测框和真实框纵横比的影响因子，以提高模型收敛速度并改善定位效果。实验结果表明，CSPENet在VisDrone-DET数据集上相对于DINO算法平均准确率均值提升4.4百分点，为小目标检测算法的研究及其应用提供新的参考方案。

Select

基于向量转换的卷积计算优化方法

王培吉, 邹承明

计算机工程. 2025, 51(6): 74-82. https://doi.org/10.19678/j.issn.1000-3428.0069199

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

针对卷积计算中的效率问题，提出卷积计算优化方法OAC。该研究的主要目的在于提高卷积计算的效率，以应对深度学习领域对卷积计算速度不断增大的需求。在该技术实现过程中，OAC方法以向量转换为基础，采取一系列巧妙的步骤来优化卷积计算。首先，通过逐行取值的方式将输入矩阵连接成一个向量；然后，对卷积核进行拉伸变换，并根据输入矩阵的宽度和卷积核的大小在适当位置进行补零，形成另一个向量，这一转换的设计旨在和输入矩阵转换后的向量能够进行正确计算，最大程度地减少计算过程中的冗余操作，从而提高效率；最后，结合一些其他的优化手段对向量计算进行加速。实验结果表明，与传统MEC方法相比，OAC方法的计算速度提高了58.9%，与im2col方法相比，计算速度提升90.1%，内存占用相比于MEC方法减少了53.7%。OAC方法不仅在计算效率上取得了显著成果，而且为深度学习等计算任务提供了高效可行的解决方案。

Select

基于语言特征增强的方面情感三元组抽取

黄梓芃, 曾碧卿, 陈鹏飞, 周斯颖

计算机工程. 2025, 51(6): 83-92. https://doi.org/10.19678/j.issn.1000-3428.0069260

摘要 ( ) PDF全文 ( ) PDF Mobile ( 2 ) HTML ( )

可视化

方面情感三元组抽取是方面级情感分析中的一个重要子任务，旨在从句子中抽取方面词、意见词和情感极性。近年来，句法依赖树结合图卷积网络(GCN)已经在三元组抽取任务中取得了良好的效果。然而，这些方法大多没有充分利用语言特征，也没有对语言特征进行增强，且大部分忽略了全局上下文核心信息。因此，提出一种基于语言特征增强的方面情感三元组抽取模型LFE。首先，引入关键词的词性特征以充分利用语义信息；接着，考虑句法依赖类型，计算词间的相对句法依赖距离，使词能够关注离它较近的词的句法特征；然后，采用双仿射注意力机制结合GCN来增强语义和句法特征，GCN及双仿射注意力机制能有效地利用句法依赖树的结构信息，并将其融入模型中；最后，对全局特征与语言特征进行融合，以确保全局上下文中的关键信息不被忽略，从而提高模型的鲁棒性。实验结果表明，LFE模型在Res14、Lap14、Res15、Res16等4个数据集上的F1值相对GCN-EGTS-BERT模型分别提高了3.52、5.32、1.97、2.63百分点，证明其具有可行性和有效性。

Select

基于显著目标追踪的行为检测方法

单鹏畅, 高利剑, 董文龙, 毛启容

计算机工程. 2025, 51(6): 93-101. https://doi.org/10.19678/j.issn.1000-3428.0069350

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

行为检测任务包含行为分类和边界定位，往往关注行为特征和边界特征。已有方法通常忽略了行为空间特征对于该任务的重要性，并存在行为边界预测模糊的问题，影响行为检测模型的性能和应用效果。针对以上问题，提出一种基于显著目标追踪的行为检测(SOT-AD)方法。首先，为了学习不同尺度的显著空间信息，提出分级注意力网络，旨在捕捉与行为关联的显著目标，减少与行为无关的信息的干扰；其次，为了使相邻时序位置关注到的显著目标具有一致性，提出显著目标追踪损失；最后，引入中性样本辅助构造“目标-次目标-背景”特征池，旨在学习特征时序上下文信息，实现显著目标追踪。在THUMOS14和ActivityNet1.3两个通用数据集上的实验结果表明，与主流方法相比，SOT-AD在平均精度均值(mAP)指标上分别平均提升了0.9和0.6百分点。其中，在THUMOS14数据集上，SOT-AD的mAP@0.5达到72.7%。

Select

基于角色学习的多智能体强化学习方法

沈思彤, 王耀吾, 谢在鹏, 唐斌

计算机工程. 2025, 51(6): 102-115. https://doi.org/10.19678/j.issn.1000-3428.0070739

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

多智能体强化学习(MARL)在解决复杂协作任务中具有重要作用。然而，传统方法在动态环境和信息非平稳性方面存在显著局限性。针对这些挑战，提出一种基于角色学习的多智能体强化学习框架(RoMAC)。该框架通过基于动作属性的角色划分，并借助角色分配网络实现智能体角色的动态分配，以提升多智能体协作效率。框架采用分层通信设计，包括基于注意力机制的角色间通信和基于互信息的智能体间通信。在角色间通信中，利用注意力机制生成高效的通信信息，以实现角色代理间的协调；在智能体间通信中，通过互信息生成有针对性的信息，从而提升角色组内部的决策质量。实验在星际争霸多智能体挑战(SMAC)环境中进行，结果表明，RoMAC胜率平均提高了约8.62百分点，收敛时间缩短了0.92×10⁶时间步，通信负载平均降低了28.18百分点。消融实验进一步验证了RoMAC各模块在提升性能中的关键作用，体现了模型的稳健性与灵活性。综合实验结果表明，RoMAC在MARL和协作任务中具有显著优势，为复杂任务的高效解决提供了可靠支持。

Select

融合全局与局部语义的跨领域方面词抽取

柳大格, 游进国, 耿齐祁

计算机工程. 2025, 51(6): 116-126. https://doi.org/10.19678/j.issn.1000-3428.0069205

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

方面词抽取(ATE)是方面级情感分析的核心任务之一，提取和标注成本极高。当训练样本和测试样本来自不同领域时，由于两个样本之间存在差异，传统方法的性能往往会急剧下降。传统方法侧重考虑基于语义信息丰富的局部上下文的领域适应方法，以实现跨领域ATE，却忽略了方面词在文本中可能存在的全局长程依赖关系，从而使得模型的性能、可扩展性和鲁棒性受到一定程度的制约。针对上述问题，提出一种无须进行额外手动标记的融合全局与局部语义的跨领域方面词抽取模型CBiLSTM。该模型以语义信息作为枢轴，首先在词嵌入阶段融入外部语义信息并以此构建为源领域与目标领域的枢轴信息，然后结合全局与局部上下文语义信息进行并行编码，从而更好地捕获综合的语义特征信息，进一步弥合了源领域与目标领域之间的差异，最后实现方面词的跨领域抽取。在3个公测数据集上的实验结果表明，与基线模型相比，CBiLSTM模型的跨领域ATE的平均F1值达到53.87%，比当前最优模型提升了0.49百分点，具有较优的性能以及较低的计算成本。

Select

基于双超图神经网络特征融合的文本分类

郑诚, 李鹏飞

计算机工程. 2025, 51(6): 127-135. https://doi.org/10.19678/j.issn.1000-3428.0068324

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

近年来, 图神经网络(GNN)在文本分类任务中受到广泛应用。当前基于GNN的文本分类模型首先将文本建模为图, 然后使用GNN对文本图进行特征传播与聚合, 但是此类方法有两点不足: 一是现有模型由于图结构的限制无法捕获单词之间的高阶语义关系; 二是现有模型无法捕获文本中的关键语义信息。为了解决上述问题, 提出一种基于双超图卷积网络特征融合的文本分类模型。一方面, 使用原始文本建立文本超图; 另一方面, 为短文本引入外部知识, 使用基于SenticNet词库的外部知识对文本进行语义增强, 构建语义超图。经过超图卷积后通过注意力机制对双超图特征进行融合, 实现短文本分类。在4个文本分类数据集上的实验结果表明, 该模型优于基线模型, 具有优越的文本分类性能。

Select

基于分层强化学习的在线三维装箱模型

亓明凯, 王迪, 张立晔

计算机工程. 2025, 51(6): 136-145. https://doi.org/10.19678/j.issn.1000-3428.0069109

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

在过去的一些研究中, 人工智能如何以一种分层的方式在多个抽象级别和多个时间尺度上表示感知和行动规划逐渐成为一个研究热点。受限于技术手段, 多数工作都局限在人工分解任务阶段, 如在三维装箱问题(3D-BPP)中, 通过启发式规则指导神经网络解析打包点帮助智能体分解状态空间, 将原本庞大、复杂的空间转换为一个个子空间, 为神经网络提供更好的备选解决方案。然而这种方式受限于规则本身, 若规则不能完美地拆解问题, 则这种固定规则的辅助会限制神经网络的性能, 使得更好的解决方案被规则本身忽略。针对这种情况, 提出一种基于启发式规则融合策略的改进装箱配置树(PCT)模型, 通过分层强化学习的思想将问题分层, 引入图注意力分类模型来判断在当前情况下最优的空间点拓展方案, 由此为拆解箱体内部空间点与探寻可行性位置提供更多的排列组合方式。实验结果表明, 基于启发式规则融合策略的改进模型在多个数据集上表现优于原始模型, 在包含额外密度信息的数据集中平均装箱利用率高达77.2%, 较原始模型提升1.7百分点, 能够在合理的时间内给出性能更优的解决方案。

Select

融合可变形核和自注意力的点云分类分割边卷积网络

陈思帆, 杨家志, 黄琳, 吕志玮, 沈露

计算机工程. 2025, 51(6): 146-154. https://doi.org/10.19678/j.issn.1000-3428.0069284

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

点云数据具有无序性和离散分布的特点, 传统动态图卷积方法在处理点云数据时仍充满挑战, 无法准确地表示三维点间的特征对应关系。为此, 提出一种融合可变形核和自注意力的点云分类分割边卷积网络DKSA-Net, 该网络由DKConv (Deformable Kernels Edge Convolution)模块和SAConv (Self-Attention Edge Convolution)模块组成。通过融合可变形核与边卷积构建DKConv模块, 能够动态学习点的特征, 生成可变形核, 不会忽略不同特征之间的对应关系, 从而更好地处理不同特征之间的对应关系。引入自注意力机制, 并与边卷积结合构建SAConv模块, 能够对特征进行更细粒度的特征提取, 充分捕捉点云的重要特征, 增强模型的判别能力。实验结果表明, DKSA-Net在ModelNet40和ShapeNet数据集上取得出色性能, 分别达到93.4%的总体精度(OA)、90.7%的平均精度(mAcc)和86.1%的平均并交比(mIoU), 且有着较低模型复杂度和较好鲁棒性, 具有优秀的点云数据处理能力。

Select

基于透镜反向学习和差分进化的帝国竞争改进算法

李斌, 潘智成

计算机工程. 2025, 51(6): 155-173. https://doi.org/10.19678/j.issn.1000-3428.0069309

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

针对帝国竞争算法(ICA)收敛过快导致求解高维复杂问题容易陷入局部最优以及全局寻优能力不足等问题, 提出一种基于透镜反向学习和差分进化的帝国竞争改进算法LODE-IICA。首先, 引入透镜反向学习差分进化机制, 周期性地为算法种群提供新的进化方式和平衡各个帝国势力, 帮助算法种群跳出局部最优; 其次, 将精英保留策略植入到算法演化中, 重新分配殖民地, 维持种群多样性; 最后, 引入动态同化系数, 协调算法在不同阶段探索, 提高算法的稳定性。仿真实验中, 采用标准函数测试集、CEC2017测试集及CEC2020测试集检验LODE-IICA在多个维度下对不同类型函数的寻优能力。选取在标准函数测试集、CEC2017测试集和CEC2020测试集中具有代表性的15种改进算法与LODE-IICA进行实验结果比较, 结果显示, LODE-IICA引入的机制在大多数情况下有效地提高了算法性能, 同时具备较好的收敛速度和寻优能力。

Select

不同基本单元信息融合的藏文短文本摘要生成

夏吾吉, 黄鹤鸣, 樊永红, 更藏措毛, 范玉涛

计算机工程. 2025, 51(6): 174-183. https://doi.org/10.19678/j.issn.1000-3428.0069112

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

藏文文本摘要能使用户快速有效地理解藏文文本内容。然而, 公开的、多领域的大规模藏文摘要数据集的稀缺, 使得藏文文本摘要生成的发展面临挑战; 此外, 藏文文本摘要生成研究借用中文和英文等以词作为基本单元的文本摘要生成技术构建模型, 但由于藏文受分词技术的限制, 直接以词作为文本摘要生成的基本单元, 对性能的影响较大。针对上述问题, 构建包含10 523条文本-摘要对的多领域藏文短文本摘要数据集TB-SUM, 在研究藏文文本构成单元的基础上, 提出适用于藏文文本摘要生成的不同基本单元融合方法, 并构建融合不同基本单元的藏文文本摘要生成模型Fusion_GloVe_GRU_Atten, 利用全局词向量表示(GloVe)模块实现藏文文本向量化后通过双向门控循环单元(Bi-GRU)模块对输入向量进行编码, 利用注意力机制获取输入向量的完整语义信息, 使解码器更加关注与当前单词相关的编码器输出, 同时将GRU作为解码器生成藏文摘要。在数据集TB-SUM和Ti-SUM上的实验结果表明, 以音节和词的融合作为模型训练的基本单元, 以音节作为测试的基本单元时, Fusion_GloVe_GRU_Atten模型生成短文本摘要效果更好, 能得到更高的ROUGE (Recall-Oriented Understudy for Gisting Evaluation)分数。

Select

基于改进YOLOv3的航拍小目标检测算法

奚琦, 王明杰, 魏敬和, 赵伟

计算机工程. 2025, 51(6): 184-192. https://doi.org/10.19678/j.issn.1000-3428.0068698

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

针对小尺度目标在检测时精确率低且易出现漏检和误检等问题, 提出一种改进的YOLOv3 (You Only Look Once version 3)小目标检测算法。在网络结构方面, 为提高基础网络的特征提取能力, 使用DenseNet-121密集连接网络替换原Darknet-53网络作为其基础网络, 同时修改卷积核尺寸, 进一步降低特征图信息的损耗, 并且为增强检测模型对小尺度目标的鲁棒性, 额外增加第4个尺寸为104×104像素的特征检测层; 在对特征图融合操作方面, 使用双线性插值法进行上采样操作代替原最近邻插值法上采样操作, 解决大部分检测算法中存在的特征严重损失问题; 在损失函数方面, 使用广义交并比(GIoU)代替交并比(IoU)来计算边界框的损失值, 同时引入Focal Loss焦点损失函数作为边界框的置信度损失函数。实验结果表明, 改进算法在VisDrone2019数据集上的均值平均精度(mAP)为63.3%, 较原始YOLOv3检测模型提高了13.2百分点, 并且在GTX 1080 Ti设备上可实现52帧/s的检测速度, 对小目标有着较好的检测性能。

Select

基于双重情感和多特征融合的虚假新闻检测

曹蓓, 赵奎

计算机工程. 2025, 51(6): 193-203. https://doi.org/10.19678/j.issn.1000-3428.0070158

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

在信息爆炸且真伪难辨的网络环境中，精准识别虚假新闻成为一项重要的研究课题。现有研究多采用多种深度学习模型提取多元语义特征，以捕捉文本中不同层次的语义信息，但简单拼接这些特征会导致信息冗余和噪声，限制检测的准确性和泛化性，目前缺乏有效的深度融合方法。此外，现有研究往往忽视了新闻内容与其对应评论共同构建的双重情感对揭示新闻真实性的影响。针对上述问题，提出一种基于双重情感和多特征融合的虚假新闻检测（DEMF-FND）模型。首先，通过情感分析提取新闻和评论的情感特征，并利用相似度计算引入反映两者关联性的情感差异特征，构建双重情感特征集。然后，采用基于多头注意力的融合机制，将双向长短期记忆网络（BiLSTM）与设计的集成静态-动态嵌入的卷积神经网络（ISDE-CNN）所捕捉的新闻文本全局与局部语义特征进行深度融合。最终，将双重情感特征集与经深度融合得到的语义特征拼接融合，输入由全连接层构成的分类层，以判断新闻的真假。实验结果显示，该方法在Weibo20、Twitter15和Twitter16 3个真实数据集上的基准指标均优于基线方法，在准确率上分别实现了2.5、2.3和5.5百分点的提升，凸显了双重情感和深度融合语义特征在提升虚假新闻检测性能方面的重要性。

Select

SAP-AKA二次认证协议的形式化验证与改进

彭程炜, 杨晋吉, 杨光

计算机工程. 2025, 51(6): 204-211. https://doi.org/10.19678/j.issn.1000-3428.0069175

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

SAP-AKA协议是根据第3代合作项目(3GPP)标准定义的基于可扩展身份认证(EAP)框架, 为垂直用户提供密钥服务安全的二次认证协议，在5G实际环境中，认证与密钥协商协议受到各种网络攻击的影响，导致非法访问、无法认证以及身份信息泄露，在面临巨大安全挑战下SAP-AKA协议的安全属性能否满足要求仍未知。为此, 采用概率模型检测方法对SAP-AKA协议建立形式化模型，在协议交互状态迁移中引入攻击率，定量分析攻击率对协议的影响程度，使用概率计算树逻辑描述协议属性，并利用概率模型检测工具PRISM对协议的安全属性进行定量形式化分析。实验结果表明，SAP-AKA协议的时延性、认证性和完整性在不同程度上受各实体间攻击率的影响，随着攻击率变大，协议的安全属性不再满足要求。最后根据实验结果分析造成安全缺陷的原因，提出了改进方案并进行形式化验证，协议的安全属性均得到有效提升。

Select

动态网络调度下安全弹性模糊控制器设计

陈靖东, 罗玉强

计算机工程. 2025, 51(6): 212-222. https://doi.org/10.19678/j.issn.1000-3428.0069054

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

针对在网络攻击情形下时滞系统的安全模糊控制问题，研究具有传感器饱和、动态网络调度、随机发生的欺骗攻击（RODA）和无穷分布时滞模糊系统的安全控制问题。建立了能统一描述RODA和传感器饱和的测量输出模型。为了有效减小网络通信负担，采用尝试一次丢弃（TOD）协议对网络节点进行调度。设计一个弹性模糊安全控制器，使得当同时存在RODA、传感器饱和及TOD协议时，控制系统能达到规定的安全要求。根据稳定性理论、矩阵论、随机分析技术等，首先导出控制系统满足安全要求的充分条件，然后通过求解线性矩阵不等式（LMI）来获得控制器增益。最后，通过一个数值例子证明了所提设计方案的可行性。实验结果表明，所设计的安全弹性模糊控制器能够有效应对网络攻击。

Select

一种隐私保护的抗投毒攻击联邦学习方案

姚玉鹏, 魏立斐, 张蕾

计算机工程. 2025, 51(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

联邦学习实现了各参与方在不泄露原始数据的前提下联合建模，有效解决了分布式数据隐私的问题，但随着研究的深入，联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进，不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击，提出一个隐私保护的抗投毒攻击联邦学习（APFL）方案。设计一个模型检测算法，使用差分隐私（DP）技术，根据模型间余弦相似度赋予各客户端相应聚合权重，使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明，APFL在保证数据隐私的同时能有效筛选恶意模型，抵御投毒攻击，当投毒比例不超过50%时，APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致，模型测试错误率较Krum方案平均降低19%，较FLTrust方案平均降低9%。

Select

基于自然最近邻的联邦聚合算法

施永辉, 代琪, 陈丽芳, 韩阳

计算机工程. 2025, 51(6): 236-244. https://doi.org/10.19678/j.issn.1000-3428.0069131

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

联邦学习框架在保护本地数据隐私的同时，面临着来自攻击者污染客户端数据的挑战，导致全局模型性能下降。目前主流联邦学习框架通常假设客户端本地数据是干净的，但实际情况中攻击者可通过数据污染手段来降低模型的准确性。为此，提出一种基于自然最近邻的联邦聚合算法。与其他传统联邦防御算法不同，该算法为非独立同分布条件下的联邦学习框架，能够防御有目标的攻击。该算法引入自然最近邻的搜索过程，通过此过程赋予模型异常度，有效区分异常模型。选取其中异常度较小的节点参与训练，确保正常节点参与的训练次数远大于恶意节点次数。实验结果表明，在非独立同分布条件下，该算法在标签翻转和后门攻击等有目标攻击的场景下，能保持模型性能稳定，增强了联邦学习框架的鲁棒性。即使受到恶意攻击，该算法能够有效维护全局模型的性能和可靠性，为解决客户端数据污染问题提供了有效途径，为联邦学习框架安全性和稳定性提供新思路。

Select

基于信息价值的协同感知信息传输控制方案

刘建航, 周翔, 李世宝, 崔学荣

计算机工程. 2025, 51(6): 245-254. https://doi.org/10.19678/j.issn.1000-3428.0068898

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

路边单元(RSU)检测感知道路环境后形成协同感知信息(CPM)，将该CPM由RSU传输至道路中的车辆，可以扩大车辆的感知范围，有效提升车辆行驶的安全指数。但是，在车辆和行人众多的城市场景中，RSU感知道路个体(包括车辆、行人等)后形成的CPM数据规模过大，其中包含过多低安全价值的感知对象信息(POI)，将其频繁共享给车辆容易造成网络拥塞，从而增加传输延迟，降低CPM的服务质量。为此，提出了一种命名为TRAC的CPM传输控制方案。该方案通过改进的碰撞预警时间(Improved-TTC)识别道路个体的碰撞风险，从而确定感知对象信息的交通安全价值。根据该安全价值，路边单元可以有选择性地传输POI。TRAC方案中的自适应CPM传输控制算法根据实时的网络状态决定CPM的生成频率。CPM高价值传输内容选择算法根据交通安全价值决定应该传输哪些POI。实验结果表明，该方案有效降低了传输延迟，提高CPM的服务质量，与现有方案相比，TRAC方案的CPM传输延迟最多可降低了89%，服务质量最多可提升8.1倍。

Select

一种改进蛇优化算法的边缘服务器动态放置策略

武小丰, 袁培燕

计算机工程. 2025, 51(6): 255-265. https://doi.org/10.19678/j.issn.1000-3428.0069008

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

移动边缘计算(MEC)可为用户提供低延迟和高可靠性的服务, 近年来受到了学术界和工业界的广泛关注。边缘服务器部署是MEC应用实施的关键环节, 具有重要的研究价值, 选择合适的放置位置不仅能够满足计算需求, 还可以提高系统的资源利用率, 降低部署成本。因此, 对时变网络状态下的边缘服务器放置问题进行研究。首先, 将边缘服务器划分为静态服务器和动态服务器两类; 然后, 提出一种改进的蛇优化(ISO)算法来确定每个时刻边缘服务器的部署数量和放置位置, 以满足一定范围内用户卸载数据的传输延迟要求; 最后, 利用内点法进一步降低服务成本。实验结果表明, 所提方法能够动态地部署边缘服务器, 同时与经典算法相比, 在相同的实验条件下所提方法能够减少20%~43%的服务成本。

Select

多天线无人机视频通信中的节能资源分配策略

杨莉斌, 詹成, 李婷婷, 廖婧睿

计算机工程. 2025, 51(6): 266-274. https://doi.org/10.19678/j.issn.1000-3428.0069356

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

凭借移动便捷、部署灵活的特点, 无人机(UAV)通信成为满足下一代蜂窝用户需求的有效技术。利用UAV捕获视频并通过边缘计算对视频进行处理, 可以为多用户提供高质量的视频服务。考虑一种多天线固定翼UAV视频传输系统, 通过合理规划UAV轨迹, 利用波束成形技术将每个传输信号引导到至用户端的最佳路径上, 从而降低能耗并提高接收信号的强度。将上述要求建模为一个非凸问题, 这个问题需要联合优化UAV轨迹、飞行时间、传输波束成形以及计算资源分配, 从而在满足用户服务质量(QoS)要求的同时, 最小化UAV总能耗。为了解决该问题, 提出一种两阶段算法: 在第一阶段, 利用路径离散化方法、交替优化技术以及连续凸逼近(SCA)技术, 最小化UAV的推进能耗; 在第二阶段, 采用路径离散化方法和SCA技术来最小化UAV的通信和计算能耗。仿真结果表明, 相较于基准方案, 该算法在保证视频质量的同时, 能够明显降低UAV的能耗, 具有很高的效率和实用性。

Select

基于多步强化学习的多目标组播路由算法

田金玮, 李晓乐, 秦尧, 王翠平, 王华

计算机工程. 2025, 51(6): 275-285. https://doi.org/10.19678/j.issn.1000-3428.0068573

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

当前网络中存在过度供应、冗余和拥塞等问题, 导致能耗过高和用户满意度下降。联合优化能耗和延迟的组播路由问题是一个NP完全问题。在软件定义网络(SDN)架构下, 提出一种基于多步Q-Learning的多目标组播路由算法, 以解决延迟和能耗的组播路由问题。该算法旨在降低网络能耗和延迟, 同时满足网络性能和服务质量(QoS)的要求。基于多步Q-Learning, 准确估计每条路径的长期奖励, 通过在每个步骤中更新Q值, 为节点选择最优的动作, 并最终找到最佳路径。通过将多个时间步的奖励和价值函数相结合, 更快地收敛到最优策略。此外, 在设置奖励值时, 为每一个目标赋予不同的权重, 用来平衡目标所占的比重。仿真结果表明, 与现有的代表性算法相比, 该算法能够有效降低网络能耗和延迟, 提高网络性能。

Select

基于动态联合加权的带钢表面缺陷分类方法

王亚, 甘青松, 沈琦, 宋余庆, 刘毅, 韩凯, 刘哲

计算机工程. 2025, 51(6): 286-296. https://doi.org/10.19678/j.issn.1000-3428.0068831

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

带钢表面质量是衡量钢铁产品质量的重要指标之一, 针对全流程表面缺陷进行分类研究, 可以减少表面缺陷的发生, 同时提升表面缺陷信息捕获的准确性。在实际生产过程中, 带钢缺陷样本的精准类别标签往往难以获取, 因此不依赖标签数据的无监督分类方法逐渐成为研究热点。现有的传统机器学习无监督分类方法对噪声数据鲁棒性差, 而基于深度学习的无监督方法对数据量依赖性较强。为此, 将传统的机器学习算法和深度学习算法相结合, 提出一种无监督动态加权联合的带钢表面缺陷分类(DWJC)方法。首先, 根据纹理特征聚类算法为缺陷图像分配初始类别标签; 然后, 通过卷积神经网络(CNN)提取图像的深度特征; 最后, 基于KL散度提出一种动态加权重标注方法, 联合初始类别标签、Softmax、约束聚类等多个分类方法, 在模型训练过程中不断修正初始类别标签, 以获取更加稳定且精准的缺陷分类结果。在NEU公共数据集和上海宝钢缺陷数据集上进行大量实验, 结果表明, DWJC分别取得了99.5%和94.3%的平均精度。

Select

基于YOLOv5n模型改进的口罩检测算法: Mask-YOLO

李毅, 徐慧英, 朱信忠, 黄晓, 王舒梦, 李悉钰

计算机工程. 2025, 51(6): 297-310. https://doi.org/10.19678/j.issn.1000-3428.0069311

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

口罩作为基础的个人防护物品, 在公共卫生领域发挥着重要作用。针对复杂场景下口罩检测精确度低的问题, 提出一种基于YOLOv5n改进的轻量级口罩检测算法Mask-YOLO, 以提高口罩检测精确度和模型训练的稳定性。在特征提取阶段的卷积模块组中采用Softplus激活函数, 提升模型非线性映射效率, 加快模型的收敛速度; 在主干特征提取深层网络中添加Coordinate Attention, 通过嵌入位置信息得到通道注意力, 使网络获取更大的物体区域信息和通道目标特征, 同时避免较大的内存开销; 在深层网络将快速空间金字塔池化(SPPF)模块替换为接受域模块(RFB), 借助不同的膨胀率来扩大卷积特征采样的感受野, 以获取高层网络中丰富的物体语义信息; 在多尺度特征融合网络PANet结构的基础上, 添加BiFPN跨阶段多尺度特征融合设计, 使得具有不同尺度空间信息和语义信息的目标特征充分融合交互, 进一步提升小目标检测精度; 采用DIoU作为边界框损失函数, 用以解决边界框回归不稳定和目标漏检的问题; 采用Soft-NMS的方法, 通过降低重叠检测框置信度得分的方式, 进一步提升检测效率。实验结果表明, Mask-YOLO与基准模型YOLOv5n相比, 在mAP@0.95综合评价指标上性能提升8.58%, 解决了原始YOLOv5n算法在口罩检测中小目标检测精度低、边界框回归不稳定、模型训练收敛慢等问题, 实现了高效的口罩检测。

Select

基于GC特征和脑区频段Transformer模型的EEG情感识别

张睿, 张雪英, 陈桂军, 黄丽霞

计算机工程. 2025, 51(6): 311-319. https://doi.org/10.19678/j.issn.1000-3428.0068745

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

人的情感在发生变化时, 不同通道间脑电图(EEG) 信号会交互作用, 且不同频段交互特征存在分脑区特性。为提取全脑交互性特征和充分捕获特征在不同脑区频段间依赖性, 提出主对角线非0的格兰杰因果(GC)特征提取方法和分脑区分频段的Transformer模型。首先, 针对计算自身因果度量值时GC值为0的问题, 通过改进GC算法, 提取出EEG信号各通道非0的自身因果信息。然后, 针对常用情感识别模型总是关注局部特性, 缺乏全局视野的问题, 根据不同频段下同脑区间存在关联的特点, 对因果特征进行脑区频段划分, 使用脑区频段Transformer模型将特征进行不同脑区不同频段特征间的依赖性和贡献捕获。在TYUT3.0数据集上的实验结果表明, 在使用提出的脑区频段Transformer模型分类识别时, 主对角线非0 GC矩阵相比于常用GC矩阵, 平均识别准确率提升了约1.59百分点, 说明了所提出特征的优越性; 在使用提出的主对角线非0 GC矩阵作为特征时, 提出的脑区频段Transformer模型平均准确率达到94.50%, 较已有的模型平均识别准确率提升了1.89百分点, 说明了脑区频段划分特征依赖性及全局融合思路的有效性。

Select

基于Gabor滤波器和改进线性判别分析的掌纹识别方法

马思远, 江粼, 李春林, 胡钦太, 武继刚

计算机工程. 2025, 51(6): 320-326. https://doi.org/10.19678/j.issn.1000-3428.0069258

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

现有的基于方向模式的掌纹识别方法利用预定义的滤波器来获取掌纹图像中的线响应, 然而, 这种方法对丰富的先验知识依赖较强, 且常常忽略重要的方向信息, 还会造成维度过大的问题。为了解决以上问题, 提出一种基于Gabor滤波器和改进线性判别分析的掌纹识别方法。首先使用二维Gabor滤波器提取掌纹图像中的鲁棒卷积差分特征, 提取到的特征可以更充分地描述掌纹图像中每个像素的局部方向的变化。然后提出一种判别特征学习模型, 该模型通过最大化类间距离和最小化类内距离, 从局部方向特征中学习出判别特征, 在降低数据维度的同时减少噪声的影响。在PolyU、M_Blue、GPDS和IITD 4个公共掌纹数据库上进行实验, 其中在GPDS和IITD 2个非接触式掌纹数据库上的识别率分别达到96.80%和99.29%。实验结果表明, 提出的算法能够更有效地提取掌纹图像的判别特征, 并显著提高掌纹识别的准确度。

Select

基于CNN-Transformer的电子喉镜病灶及器官分割网络

李白芽

计算机工程. 2025, 51(6): 327-337. https://doi.org/10.19678/j.issn.1000-3428.0070192

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

在电子喉镜检查中, 随着镜头的移动, 病灶和器官的形态会发生多种变化, 同时病灶和器官与黏膜组织的边界不清晰, 导致了对病灶和主要喉部器官进行同步图像分割的准确率不理想。为解决这一问题, 提出一种CNN-Transformer双流混合网络。双流混合网络中的卷积神经网络(CNN)分支负责提取细粒度特征, 而Transformer分支则负责提取全局语义特征。具体来说, 混合网络通过CNN对图像中多种尺度下的细粒度特征进行挖掘, 然后将提取到的不同尺度下的CNN特征与Transformer分支提取到的相应尺度下的全局语义特征进行融合。这种双流混合结构既能有效实现捕获到特征的浅层次及局部细节信息表现, 同时又能对深层特征和全局信息保持敏感。此外, 在进行多层次特征融合前, 使用暗部特征强化模块来增强阴影区域图像的特征细节, 以保证分割的准确率。为验证方法的有效性, 使用了来自不同医疗机构的2 425张喉镜手术图像进行实验, 并与近期提出的9种方法进行了对比分析, 实验结果证明了所提出方法的先进性。

Select

基于TCM-YOLO网络的金属表面缺陷检测方法

赵小虎, 谢礼逊, 慕灯聪, 张悦

计算机工程. 2025, 51(6): 338-348. https://doi.org/10.19678/j.issn.1000-3428.0069285

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

针对金属生产制造中表面缺陷检测环节存在检测准确率低、处理速度慢等问题, 提出一种基于改进YOLOv8网络的金属缺陷检测方法(TCM-YOLO)。该方法改进坐标注意力机制为三通道坐标注意力机制(TCCA), 并与第2版可变形卷积网络相结合改进为三通道可变形卷积网络(TDCN), 增强网络的特征提取能力。在特征融合网络中采用双向特征金字塔与动态蛇形卷积(DSC)相结合的方法, 改善网络对于带钢缺陷检测的漏检率, 更好地保留缺陷微小纹理和复杂结构的信息。采用最小点距离交并比(MPDIoU)损失函数替换原来的损失函数加快收敛速度和获得更准确的回归结果, 最后嵌入全局注意力机制, 以不断地捕获缺陷全局形态的重要信息。实验结果表明, TCM-YOLO方法在东北大学带钢缺陷数据集上的平均精度达到了81.8%, 相比于原始的YOLOv8算法提高了7.4百分点, 精确率达到了78.3%, 相比于原模型提升了8.9百分点, 算法检测速度达到61.73帧/s, 在天池铝型材缺陷的数据集上平均精度相比于原始的YOLOv8算法提高了4.1百分点, 精确率相比于原模型提升了8.7百分点。结果表明了TCM-YOLO算法具有检测精度高、检测速度快的特点, 能更好地满足金属表面实际检测需求。

Select

基于路侧相机的自适应空间变换车辆检测方法

华家宝, 张京瑞, 朱福民, 陈璐

计算机工程. 2025, 51(6): 349-359. https://doi.org/10.19678/j.issn.1000-3428.0068539

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

为了提高基于路侧相机的车辆检测的准确性和效率, 研究了融合卷积神经网络(CNN)与Transformer模型的车辆检测模型。针对复杂的交通场景, 设计了自适应空间Transformer, 将其与ResNet50结合构建了可以应对车辆视角和尺度变换的主干网络。设计了基于角度和距离的位置编码, 优化Transformer模型输入, 使模型充分利用图像中的空间信息, 并采用了通道空间注意力模块, 以更好地捕获图像中的上下文信息。在解码器部分, 去除了自回归机制, 允许模型并行解码多个目标, 并引入了目标查询集嵌入, 使其更适应车辆检测任务。实验结果表明, 所提模型在UA-DETRAC、IITM-hetra和自采数据集上的mAP@0.5分别达到96.42%、87.82%和98.64%, 在所有尺寸上均超越了其他对比模型。消融实验进一步验证了各模块对性能的关键贡献。

Select

融入节点平衡性指数的有向符号网络链路符号预测

李树鹏, 董继远, 刘娟

计算机工程. 2025, 51(6): 360-374. https://doi.org/10.19678/j.issn.1000-3428.0068368

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

有向符号网络链路符号预测问题是网络科学领域核心问题之一, 在现实生活中的许多实际问题都可以建模为有向符号网络链路符号预测问题。结构平衡理论作为有向符号网络链路符号预测算法的主要理论支撑, 具有深远的研究意义。事实上, 现实世界的网络构成十分复杂, 并非完全符合结构平衡理论, 不同类型的网络有其独有特点。基于此, 分析影响链路符号的各项基本机理, 对反映链路符号形成的网络特征进行研究, 从每个节点出发, 定义节点平衡性指数, 并在Chiang的预测方法基础上融入节点平衡性指数相关特征, 增大特征信息量, 实现有向符号网络链路符号预测, 且在此过程中不提升计算复杂度。将所有网络特征分为三类, 通过逻辑回归模型对三类网络特征的不同组合进行训练和测试, 在真实网络数据集上的实验结果表明, 节点平衡性指数相关特征的加入能大幅提升模型的预测精度, 且模型具有较好的泛化能力。最后根据逻辑回归模型对所有涉及的网络特征进行训练和测试, 通过提出算法与目前较为先进的链路符号预测算法做实验对比, 验证其有效性。

Select

基于视觉-语言预训练模型的开集交通目标检测算法

黄琦强, 安国成, 熊刚

计算机工程. 2025, 51(6): 375-384. https://doi.org/10.19678/j.issn.1000-3428.0069168

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

交通目标检测是智慧交通系统的重要组成部分, 但现有的交通目标检测算法只能实现对于预设目标的检测, 无法应对开集目标场景。为此, 提出一种基于视觉-语言预训练(VLP)模型的开集交通目标检测算法。首先, 基于Faster R-CNN修改预测网络使其能够适应开集目标的定位问题, 并将损失函数改进为交并比(IoU)损失, 有效提升定位精度; 其次, 构建一种新的基于VLP的标签匹配网络(VLP-LMN), 对预测框进行标签匹配, VLP模型作为一个强大的知识库, 可有效匹配区域图像和标签文本, 同时, VLP-LMN的提示工程和微调网络模块可以更好地发掘出VLP模型的性能, 有效提高VLP模型标签匹配的准确性。实验结果表明, 该算法在PASCAL VOC07+12数据集上实现了60.3%的新类目标检测平均准确率, 这证明了其具有良好的开集目标检测性能; 同时在交通数据集上的新类目标检测平均准确率达到了58.9%, 作为零样本检测, 仅比基类目标低14.5%, 证明了该算法在交通目标检测上具有良好的泛化能力。

Select

基于动静结合互学习的预制梁工序检测方法

冯晓飞, 谢诚, 张秀振, 董仕奎, 陈军胜, 叶舒, 钟忺

计算机工程. 2025, 51(6): 385-394. https://doi.org/10.19678/j.issn.1000-3428.0069033

摘要 ( ) PDF全文 ( ) HTML ( )

可视化

针对预制梁场位置偏远、场景复杂、光线不足, 导致数据采集困难、背景干扰、画质受损等问题, 提出一种基于动静结合互学习的预制梁工序检测方法。在单阶段目标检测模型上建立互学习框架, 分别使用数据扩增技术在空间和时间上对样本干扰的能力, 构造动静结合的双分支子网络, 在网络中引入基于归一化的注意力通道子模块动态地调整通道权重, 以适应真实场景下的环境光照复杂性和噪声干扰随机性。为充分发挥两支子网络各自的优势, 利用目标检测模型真实值的预测边界框不唯一的特性, 提出正样本对齐策略, 实现边界框数量及表征分布的双重对齐。构建一个基于真实场景的预制梁工序数据集, 在自制数据集上的实验结果表明, 该方法的精确率和均值平均精度分别达到了97.2%和97.7%, 推理速度达到了78帧/s, 在满足工业落地应用需求的同时, 为预制梁工序检测识别问题提供了一种有效且可靠的解决方案。

选择文件类型/文献管理软件名称

选择包含的内容

2025年, 第51卷, 第6期　刊出日期：2025-06-15

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

2025年, 第51卷, 第6期 刊出日期：2025-06-15

2025年, 第51卷, 第6期　刊出日期：2025-06-15