作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用


期刊的电子版内容存储于(但不限于)中国知网 :
https://navi.cnki.net/knavi/journals/ZGYR/detail?uniplatform=NZKPT&language=chs。


Please wait a minute...
  • 全选
    |
  • 李淑怡, 阳波, 陈灵, 沈玲, 唐文胜
    录用日期: 2024-05-21
    针对机器人清洁作业过程中现有曲面覆盖方法难以适应曲面变化且覆盖效率低问题,提出一种自适应奖励函数的PPO(Proximal Policy Optimization)曲面覆盖方法(a surface coverage method based on PPO with adaptive reward function, SC-SRPPO)。首先,将目标曲面离散化,以球查询方式获得协方差矩阵求解点云的法向量,建立3D曲面模型;其次,以曲面局部点云的覆盖状态特征和曲率变化特征作为曲面模型观测值构建状态模型,有利于机器人移动轨迹拟合曲面,提高机器人对曲面变化的适应能力;接着,基于曲面的全局覆盖率和与时间相关的指数模型构建一种自适应奖励函数,引导机器人向未覆盖区域移动,提高覆盖效率;最后,将曲面局部状态模型和奖励函数与PPO强化学习算法融合,训练机器人完成曲面覆盖路径规划。在球形、马鞍形、立体心形等三种曲面模型上,以点云覆盖率与覆盖完成时间作为主要评价指标,SC-SRPPO的平均覆盖率为92.72%,与NSGA II、PPO和SAC等3种方法对比,覆盖率分别提升了4.98%、14.56%、25.51%,覆盖完成时间分别缩短15.20%、67.18%、62.64%。结果表明,SC-SRPPO能够在适应曲面变化的基础上,使机器人更加高效地完成曲面覆盖任务。
  • 王 杨, 宋世佳, 王鹤琴, 袁振羽, 赵立军, 吴其林
    录用日期: 2024-05-21
    光照一致性是增强现实系统中实现虚实有机融合的关键因素之一。由于拍摄视角局限性和场景光照复杂性,开发者在估计全景照明信息时常忽略局部光照一致性,影响最终渲染效果。为解决这一问题,提出了一种基于改进Vision Transformer结构的局部光照一致性估计框架(ViTLight)。该框架首先利用ViT编码器提取特征向量并计算回归球面谐波系数,进而恢复光照信息;其次改进了ViT编码器结构,引入多头自注意力交互机制,采用卷积运算引导注意力头之间相互联系,同时在此基础上增加局部感知模块,扫描每个图像分块并对局部像素进行加权求和,捕捉区域内特定特征,有助于平衡全局上下文特征和局部光照信息,提高光照估计的精度。在公开数据集上对比了主流特征提取网络和四种经典光照估计框架,实验结果和分析表明,ViTLight在图像渲染准确度方面高于现有框架,其均方根误差和结构相异性指标分别为0.1296和0.0426,验证了本文框架的有效性与正确性。
  • 沈忱, 何勇, 彭安浪
    录用日期: 2024-05-21
    在物联网场景中,数据在采集和传输过程中易受噪声的干扰,导致数据中存在一定的离群值与缺失值。现有的时间正则化矩阵分解模型通常考虑平方损失来衡量重构误差,忽略了在处理存在异常数据的多维时间序列时,矩阵分解的质量同样是影响模型预测性能的关键因素。为此,提出了一种基于L2,log范数的时间感知鲁棒非负矩阵分解(Time aware robust nonnegative matrix factorization,TARNMF)多维时序预测框架。TARNMF通过非负矩阵分解和参数可学习的自回归时间正则项建立多维时序数据的时空相关性,基于存在离群值的数据会服从拉普拉斯分布的假设,提出使用 L2,log范数来估计非负鲁棒矩阵分解中原始数据和重建矩阵的误差以减小异常数据对预测模型的干扰。L2,log范数具备现有鲁棒度量函数的性质,解决了L1损失的近似问题,并通过压缩异常值的残差来减少其对目标函数的影响。为优化该模型,还提出了一种基于投影梯度下降的优化方法。实验结果表明TARNMF具有良好的可扩展性和鲁棒性,尤其在高维Solar数据集上,与次优结果的相对平均绝对误差降低了8.64%。在噪声数据的实验结果验证了TARNMF能高效地处理和预测存在异常数据的物联网时序数据。
  • 许明, 屈泰澎, 姜彦吉
    录用日期: 2024-05-21
    为解决现有目标检测算法在复杂场景下对交通标志的误检、漏检等问题,提出了一种改进YOLOv7的交通标志检测算法YOLOv7-MBFE。首先,提出一种基于膨胀卷积的多分支特征提取模块,控制最短和最长的梯度路径,增强模型的特征提取能力;其次,在头部网络中构建渐进特征金字塔结构,充分融合不同层次的特征信息,改善模型的特征表达;在SPPCSPC模块中引入通道注意力机制,自适应调整通道的权重,增强不同通道之间特征交互,并将多头自注意力机制融合至下采样阶段,增强模型对全局上下文信息的感知能力,提高模型在复杂场景下的检测性能。最后,使用Focal-EIOU替换原YOLOv7模型中的损失函数,使模型更专注于高质量的锚框,加快模型的收敛速度,提高模型的鲁棒性。将该算法在中国交通标志检测数据集上进行了大量实验。实验结果表明,该算法相较于YOLOv7算法平均精度均值提升了9.25%、准确率提升了3.92%、召回率提升了5.19%。改进后的算法在复杂场景下的误检、漏检等问题得到了显著改善,检测效果优于原始模型与经典目标检测模型。
  • 夏吾吉, 黄鹤鸣, 樊永红, 更藏措毛, 范玉涛
    录用日期: 2024-05-21
    藏文文本摘要能使用户快速有效地理解藏文文本内容。然而,公开的、多领域的大规模藏文摘要数据集的稀缺,使得藏文文本摘要生成的发展面临挑战;此外,藏文文本摘要生成研究借用中文和英文等以词作为基本单元的文本摘要生成技术构建模型,然而,由于藏文受分词技术的限制,直接以词作为文本摘要生成的基本单元,对性能的影响较大。因此,首先构建了包含10523条文本-摘要对的多领域藏文短文本摘要数据集TB-SUM;其次,在研究藏文文本构成单元的基础上,提出了适用于藏文文本摘要生成的不同基本单元融合方法;最后,提出了融合不同基本单元的藏文文本摘要生成模型Fusion_GloVe_GRU_Atten,该方法利用GloVe模块实现藏文文本向量化后通过Bi-GRU模块对输入向量进行编码,并用注意力机制获取输入向量的完整语义信息,使解码器更加关注与当前单词相关的编码器输出,同时将GRU作为解码器生成藏文摘要。在数据集TB-SUM和Ti-SUM上的实验结果表明:以音节和词的融合作为模型训练的基本单元,以音节作为测试的基本单元时,模型Fusion_GloVe_GRU_Atten生成的短文本摘要效果更好,能得到更高的Rouge分数。
  • 华家宝, 张京瑞, 朱福民, 陈璐
    录用日期: 2024-05-21
    为了提高基于路侧相机的车辆检测的准确性和效率,研究了一种融合卷积神经网络与Transformer模型的车辆检测模型。针对复杂的交通场景,设计了自适应空间转换器,将其与ResNet50结合构建了可以应对车辆视角和尺度变换的主干网络;然后,设计了基于角度和距离的位置编码,优化Transformer模型输入,使模型充分利用图像中的空间信息,并采用了通道空间注意力模块,以更好地捕获图像中的全局信息;在解码器部分,去除了自回归机制,允许模型并行解码多个目标,并引入了目标查询集嵌入,使其更适应车辆检测任务。实验结果表明,所提模型在UA-DETRAC、IITM-hetra和自采数据集上的mAP0.5分别达到96.42%、87.82%和98.64%,在所有尺寸上均超越了其他对比模型。消融实验进一步验证了各模块对性能的关键贡献。
  • 沈艳峰, 冯建龙, 张家诚
    录用日期: 2024-05-21
    600km/h高速磁浮列车的研发是高速磁浮系统向更高速商业应用迈进的重要过程。高速磁浮列车已完成低速动态试验车轨空间关系论证,但诸多关键指标仍需通过达速试验进行验证,因此建设长距离试验线已成为制约高速磁浮发展的瓶颈之一。依托上海磁浮示范线,针对高速磁浮列车构造、既有线线路条件、系统配置等多方面进行分析,论证600km/h高速磁浮列车在上海磁浮示范线上试验的可行性。在现有试验线路条件下,提出了对运控系统的创新设计,对牵引系统供给做出适应性调整。通过仿真结果实现车-地间的通信数据的收发、列车运控系统的优化。得出在该示范线上进行600km/h高速磁浮列车试验是经济可行的方案,并通过对于运控系统的创新设计为将来的更高速列车的达速试验提供方案设计经验。 关键词:600km/h高速磁浮;上海磁浮示范线;试验线;运控系统;牵引系统。
  • 周思瑜, 徐慧英, 朱信忠, 黄晓, 盛轲, 曹雨淇, 陈晨
    录用日期: 2024-05-21
    手机屏幕作为人机交互的主窗口,已成为影响用户体验和终端整体性能的重要因素。因此,市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求,针对在手机屏幕瑕疵检测过程存在检测精度低、小目标瑕疵漏检率高、检测速度慢的情况,提出了以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头,并结合SeaAttention注意力模块,有效提升对小目标的探测能力;将骨干网络和特征融合网络中分别融入PConv与GhostNetV2轻量化模块,保证精度的同时降低模型的参数量,提高瑕疵检测的速度与效率。实验结果表明,在北大手机屏幕表面瑕疵数据集中,相较于YOLOv8n,PGS-YOLO算法的mAP@.5提升了2.5%,mAP@0.5-0.95提升了2.2%。可见该算法在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测,还能对小瑕疵保持一定的准确度。此外,检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时,参数量仅为2.0M,小于YOLOv8n,满足工业场景对手机屏幕瑕疵检测的需求。
  • 王亚, 甘青松, 沈琦, 宋余庆, 刘毅, 韩凯, 刘哲
    录用日期: 2024-05-21
    带钢表面质量是钢铁产品质量的重要指标之一,针对全流程表面缺陷分类研究,以减少表面缺陷的发生,同时能提升表面缺陷信息捕获的准确性。在实际生产过程中带钢缺陷样本的精准类别标签往往难以获取,无监督分类方法成为研究热点。现有传统机器学习无监督分类方法对噪声数据鲁棒性差,而基于深度学习的无监督方法对数据量依赖性较强。本文将传统的机器学习算法和深度学习算法相结合,提出了一种无监督动态加权联合的带钢表面缺陷分类方法(Dynamic Weight Joint Classification, DWJC)。首先,根据纹理特征聚类算法为缺陷图像分配初始类别标签;然后,通过卷积神经网络提取图像的深度特征;最后,基于KL散度提出了一种动态加权重标注方法,联合初始类别标签、Softmax和约束聚类多个分类方法在模型训练过程中不断地修正初始类别标签以获取更加稳定且精准的缺陷分类结果。在NEU公共数据集和上海宝钢缺陷数据集进行了大量实验,分别取得了99.5%和94.3%的平均精度。
  • 蓝章礼, 邢彩卓, 张洪
    录用日期: 2024-05-21
    智能驾驶中道路交通标志的检测与识别极其重要,交通标志被遮挡时存在目标小、检测精度低的问题,提出一种基于YOLOv5s改进的被遮挡交通标志识别模型。针对交通标志在被遮挡情况下数据集缺乏的问题,自制中国遮挡交通标志数据集(Chinese occlusion Traffic Sign Dataset,COTSD);针对细粒度物体检测需要模型提取丰富判别特征,提出一种基于MobileNetv2改进的主干网络;针对交通标志较小、被遮挡且分辨率较低,普通线性插值方式无法捕捉更高阶、更细节特征的问题,设计一种改进的动态权重上采样模块(Dynamic weight upsampling module,DEUM),整合经过通道注意力加权之后的通道信息进行像素重排,生成高分辨率图像;针对CIoU(Complete-IoU)等损失函数对小目标位置变化敏感的问题,使用归一化高斯wassertein距离(Normalized Gaussian Wasserstein Distance,NWD)来优化边界框回归损失。在自制被遮挡COTSD数据集上准确率为93.60%,召回率为72.50%,F1为81.71%,mAP50为79%;在包含少量被遮挡交通标志的公开CCTSDB数据集上,准确率为92.2%,召回率为78.8%,F1为85%,mAP50为88.5%。两个数据集的实验结果表明,改进后的算法能有效提高被遮挡后交通标志的检测精度。
  • 李伟康, 张思全
    录用日期: 2024-05-20
    实例分割任务是视觉场景理解的基本任务之一,目前现有的算法具有一定的相似性,通过梳理现有算法中的共通性与差异性,抽象出了一种新颖的实例分割范式,掩码特征融合(Mask Feature Fusion, MFF),该范式将实例分割任务分为语义无关的掩膜特征提取、语义相关的序列提取,以及序列特征和掩膜特征融合三个模块。进一步,根据新范式的结构特性,提出了两项优化。首先,通过设计一个非局部全局偏置(non-local global bias)增强骨干网络对全局信息的关注,使掩膜特征提取模块在网络浅层可以提取到全局的信息,并且消除预训练权重带来的数据集固有偏置。其次,实验过程中观察到一些transformer模型在训练初期时出现查询向量不稳定的现象,即多数查询向量所关注的区域在每次交叉注意力操作后会发生漂移现象。为了解决查询向量漂移的问题,针对序列提取模块提出了一种去噪训练的方法,以保持查询向量的注意力在训练前期就可以保持在同一区域,从而加速Transformer解码器的收敛,并在其他参数配置相同的情况下提高模型精度。实验结果确切地证明了改进的有效性。具体来说,在MS-COCO数据集上的实例分割任务中,相比与当前SOTA基线模型 mask2former(使用ResNet50骨干网络),增加了新的改进措施后,MMF范式的基础模型在掩码AP指标上取得了5.0%(+1.6AP)的显著性能提升。
  • 徐永刚, 孙琦烜, 李凡甲, 程健维, 戴佳俊
    录用日期: 2024-05-20
    近年来,在基于骨架的人体行为识别领域,图卷积网络取得了很大的进展。但现有图卷积网络大多将时间卷积和空间卷积简单串联,导致时空特征融合效果不佳。另外,现有模型还存在无法高效提取时间特征的问题。为此,提出了扩展时间和时空特征融合图卷积网络(ETFF-GCN)。该网络采用通道聚合的方法,对动态空间拓扑和时序特征进行一次融合,接着运用注意力机制进行二次融合,进一步增强融合效果。在此基础上,为了全面提取时序特征,采用了多个不同大小的卷积核构建时域图卷积,以提取多尺度和多粒度的时间特征,并引入有效压缩激励模块进行特征增强,进一步提升特征表达能力。在三个大型数据集上对所提出的方法进行了评估,实验结果表明,该方法的性能优于现有的方法。
  • 黄舒怡, 谭光
    录用日期: 2024-05-20
    为解决视频分析任务中利用深度神经网络进行目标检测时精度需求和计算开销难以平衡的问题,现有工作大多以全帧视频图像作为计算资源调度的单位,为信息价值高的视频帧分配更多资源,而为信息价值低的视频帧少分配甚至不分配资源,从而在保证精度的前提下尽可能节省计算开销。然而,这种策略忽略了由于每帧视频图像中感兴趣目标分布不均,算法会因为含有少量小部分高信息价值区域的存在为全帧图像分配过多资源,耗费引入不必要的检测计算开销的问题。针对这一问题,提出了基于分区的视频目标检测方法。将视频图像进行分区后,对各个分区感兴趣目标的特征进行快速提取和处理,通过配置映射分析器为每个分区映射满足精度需求且最小化检测开销的检测配置,并将具有相同检测配置的分区拼接检测以,进一步减少检测开销;。最后,针对分区引起的边缘目标碎片化导致检测精度下降的问题进行修复。实验结果表明,该方法在满足检测精度需求的前提下,显著降低了计算开销,最大节省了90.84%;在开销相近的情况下,平均提升了10.48%-23.13%的精度,实现了高效的视频目标检测,且在静态和动态的不同场景下有更好的适应性。
  • 隗昊, 刁宏悦, 孔亮宸, 邓耀臣
    录用日期: 2024-05-20
    东北亚地区的国际形势变化与中国的发展密切相关,面向该地区构建舆情信息知识图谱能够有效地监测舆情热点,这不仅能够引导社会舆论健康发展、协助政府决策,而且对防范政治营销、提升国家语言能力、构建和谐稳定国际关系具有重大价值。命名实体识别是构建知识图谱的关键技术和核心任务,受到研究者们广泛的关注。文章以社交媒体、门户网站中与东北亚地区相关的实时热点舆情文本作为数据源,充分考虑到东北亚地区的区域特点和地缘结构,建立包含10个大类、35个子类的细粒度命名实体识别数据集,并提出基于预训练语言模型RoBERTa和多层残差BiLSTM-CRF架构(RoBERTa-ResBiLSTM-CRF)的舆情实体识别模型,同时在模型完成标签预测后设计了基于规则模板的后处理策略,以提高整体的实体识别性能。实验结果表明,所提出的舆情命名实体识别模型的性能优于主流的传统神经网络模型,验证了方法的有效性。
  • 黄业恒, 覃团发 , 苏振朗, 王素红
    录用日期: 2024-05-17
    针对6G网络中超密集无线体域网(Wireless Body Area Network,WBAN)面临的计算资源匮乏与共信道干扰的问题,提出了一种干扰感知的高效任务卸载策略。首先,介绍了面向WBAN医疗信息的软件定义网络边缘计算架构,并建立了考虑历史状态的优先级评分机制与优先级排队模型。其次,提出了邻居节点感知算法,生成当前超帧节点的邻居节点矩阵。再次,提出了干扰感知的卸载策略(Interference-Aware Offloading Strategy,IAOS),该策略定义了考虑卸载收益、卸载开销与卸载状态的系统收益模型;设计了考虑系统收益与节点并发数量的目标函数;引入了遗传算法的交叉变异策略来跳出局部最优,并且对不可行解进行修正;利用二进制开普勒优化算法解出使得目标函数最大化的卸载决策。最后通过实验仿真说明所提出的策略在动态通信环境中相较于其他对比算法的优越性。在数据量变化的环境中,IAOS策略在平均时延方面对比其他算法平均降低了74.5%;在患者数量变化的环境中,IAOS策略在节点干扰率、平均时延、能耗方面分别平均降低了61.43%、59.28%、58%,在平均吞吐量与系统收益方面对比其他方法分别平均提升了149.5%,74.38%。
  • 陈德品, 赵珅, 焦一平, 王向学, 吕泓, 徐军
    录用日期: 2024-05-17
    计算组织病理学为解析肿瘤微环境提供独特视角,具有重要价值。图网络能够刻画病理图像中非结构化连接关系,这极大地加速了计算病理学的发展。但由于计算开销巨大,使用基于图的方法处理数十亿像素的全景切片图像(Whole Slide Image,WSI)一直以来都极具挑战。不同于常规阈值法或边与节点的合并等图采样方法减少图的规模,该工作提出了一种具备创新性的基于Transformer架构的图神经网络模块AdaptConv,该模块能够在图结构中进行信息聚合的同时动态学习去除冗余的边,从而构建出新的图,称之为重构图。重构图保留了原本图结构的有效信息,也为计算病理提供了新的可视化角度和分析角度。为了评估AdaptConv及重构图的有效性,该工作将AdaptConv模块集成在CLAM框架中,并在乳腺癌的激素受体(Hormone Receptor,HR)和人表皮生长因子受体 2(Human Epidermal Growth Factor Receptor 2,HER2)两种分子分型的计算病理诊断预测任务上验证了模型准确性。与原生CLAM模型相比,改进模型的AUC指标在HR分型上取得了4.1%的提升,在HER2分型上取得了0.9%的提升。此外,AdaptConv优化模型生成的注意力分布图更合理可靠,呈现出与诊断标准免疫组织化学染色一致的分布模式。最后,该模型生成的创新性的重构图与特定组织区域和注意力图都表现出了关联,具备进一步研究的价值。
  • 杨竣辉, 李苏晋
    录用日期: 2024-05-17
    词语作为一种上下文信息在中文命名实体识别任务中发挥着重要作用。以往基于字符的方法虽然一定程度上取得了成功,但仍存在以下问题:其一,现有方法嵌入词语信息的方式简单、特征捕捉方式单一;其二,忽视了潜在词的影响、未能充分利用词语信息。针对以上问题,提出了一种基于RDKVC(RoBERTa-wwm+DGCNN+KV-MemNN+CRF)模型的中文命名实体识别方法。该方法首先通过基于全遮蔽技术的预训练模型RoBERTa-wwm将文本表示为字符级嵌入向量;其次使用门控空洞卷积神经网络(DGCNN)模型进一步捕捉文本的特征信息;然后在键值记忆网络(KV-MemNN)模型中采用“位置实体类别组合机制”(PECM)来更有效地融合词语信息并缓解潜在词冲突所带来的影响;最后利用CRF模型对预测结果进行约束,得到最佳标签序列。实验结果表明,该方法在Weibo、MSRA和Resume数据集上的F1值分别达到71.82%、95.00%和96.14%,相比于融合词语信息的WC-LSTM模型和FLAT模型分别提升了11.98、1.26、0.93和11.50、0.88、0.69个百分点。同时该方法在不同实体上的识别表现整体优于RoBERTa-wwm+CRF模型和Lattice LSTM模型。此外,通过预训练模型对比实验和消融实验进一步证明了键值记忆网络模型和预训练模型RoBERTa-wwm的有效性。
  • 张朋, 严盼盼, 乔凤杰
    录用日期: 2024-05-17
    在滑雪教学过程中,由于学员的迅速移动和姿态的大幅变化,导致以短时智能图像变化特征为主的姿态跟踪算法失效或不稳定。特别是在雪地条件恶劣或光线不足等复杂环境下,跟踪效果会受到较大的影响。为此,提出基于长时跟踪的滑雪教学姿态辅助矫正方法。使用递归最小二乘法(Recursive Least Squares,RLS)分类器训练得到学员姿态位置核相关滤波器(Kernelized Correlation Filters,KCF)。计算最大的KCF响应值,精确检测学员的姿势位置。如果KCF结果低于经验阈值,表明目标丢失,启动再检测模块。利用光流法,在前一帧学员姿态位置附近寻找当前帧中的姿态位置,以获取一个大致位置。在此位置重新应用跟踪器,获得精确的学员姿态位置,实现长时跟踪。依据得到的姿态位置数据,构建滑雪学员姿态误差补偿模型,提取学员身体的运动参数和姿态误差。计算身体运动参数,并结合核相关滤波器KCF,构建滑雪学员身体姿态辅助矫正模型,从而完成滑雪教学的姿态辅助矫正。实验结果表明,该方法在长时跟踪中展现出高度的有效性、可靠性和稳定性。其平均PCK指标达到92.3%,同时,在目标跟踪效率上,参数量和计算量分别为30.24MB和9.26GFLOPS,速度达到142fps,实现了高效实时的跟踪,验证了该方法在滑雪教学姿态辅助矫正中的可行性。
  • 夏倪明, 张洁
    录用日期: 2024-05-17
    深度神经网络极易受到对抗样本的影响,仅需向原始文本中添加细微的扰动即可诱导目标模型做出误判。研究对抗样本的生成不仅有利于提升模型的鲁棒性,还能推动深度神经网络可解释性方面的工作。在中文对抗领域,现有的对抗样本生成方法大多采用单一变换策略,仅考虑了部分汉语特征,并且忽视了攻击对上下文语境产生的影响。为了解决这些问题,提出一种基于启发式算法的对抗样本生成方法BSCA。通过全面分析表音文字和意音文字之间的差异,结合汉语的构字法、字音、字形、认知语言学等先验知识,设计了可准确评估汉字差异的中文文本扰动策略。利用扰动策略构建对抗搜索空间,并运用改进的集束搜索算法对黑盒攻击过程进行优化。在严格限制扰动大小和语义偏移的情况下,BSCA能够自动选择不同的攻击策略,以适应不同场景需求。通过在多个NLP任务上分别对TextCNN、TextRNN和BERT模型进行实验,结果表明,BSCA方法具有较好的泛化能力,能使分类准确度至少降低63.84%,同时拥有比基线方法更低的攻击代价。
  • 杨 萍, 张 汐
    录用日期: 2024-05-17
    有效的道路表面裂缝检测是维护道路安全、延长道路寿命的关键。针对传统道路表面裂缝检测方法存在的难以识别细小裂缝、分割断裂以及分割精度低等问题,提出了一种改进DeepLabv3+的道路表面裂缝检测方法,旨在降低模型参数量的同时提高裂缝检测的准确性。首先,使用优化后的MobileNetv2网络替换基础DeepLabv3+模型的主干网络,降低模型的参数量和复杂度,以加快运行速度;其次,将条形池化模块融入空洞空间金字塔池化模块,使得网络能够捕获到更多的裂缝上下文信息,以保留裂缝细小部分的特征;最后,引入CBAM注意力机制,使网络更加关注图像中对裂缝检测起决定作用的像素区域,以增强裂缝图像的特征表达能力。实验结果显示,改进DeepLabv3+模型的平均像素准确率为87.85%,平均交并比为80.53%,准确率为97.51%,精确率为88.65%,F1值为88.24%,相比于基础DeepLabv3+模型分别提高了1.77%、2.03%、0.30%、2.25%和1.51%,且高于UNet、HRNet和PSPNet模型。此外,改进DeepLabv3+模型的参数量为6.382M,压缩了基础DeepLabv3+模型的88.3%,实时性更好,更适用于道路表面裂缝检测任务。
  • 王晋涛 , 秦昂, 张元, 陈一飞, 王廷凤, 谢承霖, 邹刚
    录用日期: 2024-05-15
    针对基于字符表示的中文医学领域命名实体识别模型嵌入形式单一、边界识别困难、语义信息利用不充分等问题,一种非常有效的方法是在Bert底层注入词汇特征,利用词粒度语义信息的同时降低分词错误带来的影响,然而在注入词汇信息的同时也会引入一些低相关性的词汇和噪声,导致了基于注意力机制的Bert模型出现注意力分散的情况;此外仅依靠字、词粒度难以充分挖掘中文字符深层次的语义信息,对此本文提出了基于注意力增强与特征融合的中文医学实体识别模型,对字词注意力分数矩阵进行稀疏处理,使模型的注意力集中在相关度高的词汇,能够有效减少上下文中的噪声词汇干扰。同时对汉字发音和笔画通过CNN提取特征,经过迭代注意力特征融合模块进行融合后与Bert模型的输出特征进行拼接后输给BiLSTM模型,进一步挖掘字符所包含的深层次语义信息。实验方面通过爬虫等方式搜集了大量相关医学语料,训练医学领域词向量库,并在CCKS2017和CCKS2019数据集上进行验证,F1值分别达到94.90%、89.37%,效果优于当前主流的实体识别模型,具有更好的识别效果。
  • 杨丰豪, 侯 校, 赵紫娟, 强 彦, 赵涓涓
    录用日期: 2024-05-15
    以中医处方推荐任务作为切入点,针对现有处方推荐模型忽略草药配伍等领域知识信息,导致推荐效果不佳、推荐处方偏离实际等问题,提出了一种基于序列到序列框架的中药关键词感知模型。在症状序列信息挖掘部分加入一种关键词感知网络,拓展模型多分支结构,并以处方君药作为关键词嵌入向量,来挖掘处方配伍信息,提升模型深层次知识特征表示能力,提高推荐质量。提出一种交叉传播机制,降低注意力累加过程中被过高关注的特征维度,使得累加结果可以关注到未被关注区域,降低推荐处方重复概率。提出一种混合软损失,通过加大不同分布之间差距,惩罚重复关注同一位置行为,进一步改善结果。模型在两个公共临床中医处方数据集上进行实验,其实验结果表明,与TPGen、Herb-Know等其他深度学习模型相比,该模型能够有效提升推荐处方质量,改善模型生成过程中重复问题,其在Precision、Recall、F1上相比最好的基准模型分别提升了7-9%、5-6%、6-7%。此外,消融实验结果也证明了各个模块之间的有效性。
  • 朱宸敏, 余粟
    录用日期: 2024-05-15
    线性插值常被过采样技术用于合成样本,缺点是采样结果缺乏随机性并且容易提高类重叠度。为了解决上述问题,提出受同轴对称抛物线约束的样本合成方法。该方法由三个部分组成,首先建立一种基于危险度因子和相似度因子的自适应加权策略;再将由一对同轴对称抛物线围成的闭区域作为非线性合成区域;最后通过采样前后近邻域内巴氏系数的变化情况筛选新样本以提高采样质量。在UCI机器学习库的六个公共样本集上进行对比实验,结果显示集成后的过采样技术的Precision值提高7.85%;Recall值提高2.85%;G-means值提高2.00%,证明该方法优于线性插值并具有良好的普适性。
  • 蒋杰平, 王明文
    录用日期: 2024-05-14
    为提升深度学习模型中三维卷积提取时空特征的有效性,提出一种基于时空置换注意力机制的残差行为识别模型。时空置换注意力机制是由通道结合时间和空间注意力子模块组成的轻量化的多维度混合注意力机制,在通道注意力中增加了结合时间的维度,获取时间与通道信息;在空间注意力中压缩冗余的时间信息,提升对空间特征的关注度,对提取的特征进行通道置乱及通道重组,提升模型对数据的表征能力并减少参数量。该模型使用Resnext残差网络提取时空特征,在残差模块中嵌入时空置换注意力机制模块,利用注意力模块自主学习不同特征图的权重参数,针对性的对提取的特征在通道、时间、空间域加权,增强网络对人体行为的表达能力,使用改进的交叉熵函数Focal Loss作为损失函数解决数据集中可能存在的样本分布不均衡的问题。实验结果表明,该模型在UCF101以及HMDB51数据集上的识别准确率分别达到了96.3%以及71.6%,相较于其他模型均有显著提升。
  • 王泽宇, 徐慧英, 朱信忠, 黄 晓, 梁佳杰, 李琛
    计算机工程. https://doi.org/69278
    录用日期: 2024-05-13
    基于深度学习的鱼苗检测在水产养殖中的应用为自动化和精确化管理提供了可能,针对鱼苗检测中设备性能低、实时性要求高等问题,本文提出了一种改进YOLOv8的轻量化鱼苗检测算法:FD-YOLO。将快速网络(FasterNet)替换YOLOv8原CSPDarkNet特征提取网络,采用局部卷积(PConv)减少了冗余计算和内存访问;在特征融合中引入深度可分离卷积(DWConv),将标准卷积过程分解为两个相对简单的深度卷积和逐点卷积两个步骤并行处理,进一步减少了模型的复杂性和计算资源消耗;使用Focal-EIoU作为模型损失函数,提高了检测精度,使得模型更具鲁棒性。实验表明,改进后的检测模型参数量和计算量大幅降低,模型参数量下降91%,计算量下降85%,在CPU上的推理速度加快了三倍。改进后的鱼苗检测算法能更好地兼顾高精度和实时性之间的平衡,便于部署在资源有限的硬件平台上。
  • 高睿, 安国成, 邹丹平, 裴凌
    录用日期: 2024-05-11
    目前在交通场景中,车辆检测存在目标尺度差异显著以及遮挡重叠严重等问题,且对大规模数据进行完全标注需要较高的成本。针对以上情况,提出一种基于改进YOLOv5的半监督车辆检测算法。首先,引入SimOTA样本匹配方法,优化了次优匹配现象,改善了目标遮挡时检测困难的问题;提出一种新的空间金字塔池化网络SPPFA,通过引入LSKA,增大感受野的同时实现空间和通道的自适应性,缓解了目标尺度变化剧烈和特征相似度高的影响;将CIoU替换为SIoU,优化了回归损失函数。随后,提出一种改进的半监督深度学习算法,通过优化损失函数设计,增强了算法学习未标注样本中有益信息的能力,有效提高了模型对车辆的检测精度。实验结果表明:改进后的算法在自制车辆数据集上mAP50指标达到了58.2%,相较YOLOv5n基线模型提升了11.1%,且模型体积远小于主流目标检测算法,具有良好的工程应用前景。
  • 唐莹莹, 陈玉玲, 罗运, 李再东
    录用日期: 2024-05-10
    由于云服务器提供强大的存储和计算能力,个人和企业更趋向于将加密数据存储于云端。为了解决密文数据检索困 难的问题,利用同态加密的密文检索方式成为研究热点。然而,现有的方案主要集中在单关键词检索上,由于检索限制条件 较少、搜索精度较低,从而导致通信和计算开销较大。另外,由于将数据托管到第三方提供的不可信云主机上,可能出现删 除、修改或返回不真实、不全面的搜索信息等恶意情况。为此,基于全同态加密和不经意伪随机函数提出了一种新型的密文 检索方案。通过构造加密的关键词索引和哈希表,使得方案能够支持多关键词的连接查询。并利用文件的标识和大小生成验 证标签,使得数据接收者能够对检索结果的正确性和完整性进行验证。理论分析和实验结果表明,相比于基于全同态加密的 单关键词检索方案,检索 2~3 个多关键词时,其搜索密文效率提升 36.2%~45.9%,并且在检索更多关键词时拥有更好的综合 性能。
  • 袁亚剑, 毛力
    录用日期: 2024-05-10
    交通标志检测在辅助驾驶中扮演着不可或缺的角色,为驾驶安全提供了至关重要的支持。在实际交通环境中,天气影响如黑夜或雨天产生的背景噪声加大了交通标志检测的难度,其次,现有模型往往难以有效检出远处的小目标交通标志,此外,在设计交通标志检测模型时应当考虑到实际部署对模型体积的要求。为此,本文在YOLOv8的基础上提出一种增强前景的轻量级交通标志目标检测模型。首先,设计了一个轻量级的PC2f模块替换掉原本Backbone中的部分C2f模块,该模块降低了模型的参数量和计算量,在保留更多的浅层信息的同时进一步丰富了梯度流信息,同时实现了模型轻量化和提升检测性能。其次,设计了前景增强模块PEM并将其引入Neck位置,该模块能够有效放大前景信息并减弱背景噪声。最后,增加了一层小目标检测层,用于在高分辨率的图像上提取浅层特征,加强模型对小目标交通标志的检测性能。实验结果表明,优化后的模型在数据集CCTSDB 2021和GTSDB上的mAP50分别达到了82.5%和95.3%,相较于原模型分别提升了3.6%和1%,并且模型大小减小了0.22MB。这些结果验证了本文模型在实际应用中的有效性。
  • 秦永旺, 张洋, 胡星, 刘胜, 李少青
    录用日期: 2024-05-10
    随着集成电路设计复杂度的急剧攀升,其呈现出全球化和分工化的发展趋势,需要越来越多的第三方知识产权核(IP)提供者的参与。而第三方IP的广泛使用会引入硬件木马,为了检测和评估第三方IP核是否存在硬件木马以及硬件木马的功能,迫切需要探索出一种可行的IP核硬件安全评估方法,数字电路模块的功能识别作为硬件木马分析的基础研究引起了人们的广泛关注。本文将电路功能检测任务转换为多分类任务,结合电路结构和图数据结构的特点,提出了一种基于图注意力网络的门级电路功能分类和检测方法。首先,针对门级网表缺乏功能识别数据集的问题,本文通过搜集具有代表性的RTL代码并综合生成门级网表,构建了一个规模适当、种类多样的门级电路数据集。随后,为了提取和处理电路特征信息,本文开发了一种基于文本识别的软件工具,将复杂的电路互连结构映射为结构简洁的JSON(JavaScript Object Notation)格式,便于神经网络处理。最后,本文采用图注意力神经网络,利用构建的门级网表数据集对多分类器进行训练,经过训练后的多分类器能够对未知门级电路进行分类和识别。实验结果表明,此分类器通过对自建数据集中6种类型,共计3千余条网表数据进行学习后,最终对6种共645个网表能够达到90%以上的分类正确率。
  • 卢鹏, 仲闯
    录用日期: 2024-05-10
    目前,建筑物提取需要大量的标注数据进行训练,收集和标注数据需要耗费大量时间。针对小样本遥感图像数据集上实现建筑物半监督提取的问题,构建了四组建筑物提取数据集,提出了一种基于循环生成对抗网络CycleGAN(Cycle Generative Adversarial Network)的建筑物提取方法。首先,在生成器中引入GAM(Global Attention Mechanism)全局注意力模块以增强对建筑物和图像背景细节特征的区分。其次,在判别器中加入谱归一化层以增强训练稳定性,解决了训练过程中梯度消失问题。最后,改进对抗损失和循环一致性损失以提高生成图像的质量,避免了生成图像的过度平滑化,并引入Identity损失(身份保真损失)以限制生成器不会自主的修改输入图像的颜色,保证了输入图像与输出图像颜色组成的一致性。实验结果表明,在第一组小样本数据集上,与UNIT模型、MUNIT模型、U-GAT-IT模型、SPatchGAN模型、QS-Attn模型进行半监督实验对比,SSIM(Structure Similarity Index Measure)值和准确率分别至少提高了3%、8%以上;在扩充数据规模的数据集上,使用改进后的算法进行全监督和半监督实验对比,验证了改进后的算法在小样本遥感图像数据集上实现建筑物半监督提取的有效性。
  • 何亨, 程凯莉, 张葵, 成淑君
    录用日期: 2024-05-10
    拷贝数变异(Copy Number Variation, CNV)作为一种遗传变异,广泛存在于人类基因组的基因分布中。提升CNV检测的效率,不仅可以为更多的病患提供更加快速精确的CNV检测结果,大幅降低医疗成本,同时又有利于药物的研发和临床应用。基于读段深度(Read Depth, RD)的方法是目前最为常用的用于检测CNV的方法,对RD相关信息的处理时间较长,在CNV检测中时间占比较高。现有方法存在无法有效应用于全基因组分析、计算效率较低、检测精度下降的问题。针对基于RD的CNV检测方法,提出一种高效的测序数据并行处理方案(Efficient Parallel Processing scheme for sequencing data in Copy Number Variation detection, EPPCNV)。在EPPCNV中,设计两个MapReduce作业串行执行的方法,实现高效全基因组测序数据的并行处理,精准地完成RD相关信息的提取;EPPCNV充分考虑到GC含量偏差对CNV检测结果的影响,对测序数据的RDs进行校正处理,保证最终检测结果的高灵敏度与高精确度;EPPCNV采用独立于具体CNV检测方法的高适配性数据处理方式,其最终生成的RD相关信息能够与多种主流CNV检测方法直接结合,在不改变原方法对CNV区域判定的基础上,实现方法整体性能的大幅提升。实验表明,EPPCNV的综合准确率高,能够分别与CNV-LOF、HBOS-CNV以及CNVnator三种方法直接结合,显著提升原方法的计算效率,并保证检测结果的高灵敏度与高精确度。对于覆盖深度越高、数据量越大的测序数据,CNV检测方法与EPPCNV结合后计算效率的提升更为显著。
  • 陈伟, 王晓龙, 张晏玮, 安国成, 江波
    录用日期: 2024-05-10
    在高速服务区违停检测过程中,由于昼夜光照变化,不同天气等复杂环境会导致车辆检测算法模型精度急剧下降,同时摄像机俯仰角及架设高度等因素会增加违停检测的误报率和漏报率。对此,提出一种基于改进YOLOv8的服务区违停检测算法,其创新点包括:第一、提出两种多尺度感受野特征融合模块,即改进空间金字塔池化模块DSPP和基于注意力机制的DSPP模块,即DSPPA。相比SPP,DSPP模块可有效减少特征提取网络中深层语义信息的丢失。同时,DSPPA中的分支注意力机制为不同感受野分支特征赋予不同权重,使模型更关注于与目标尺寸相适应的特征。DSPP与DSPPA在参数量几乎不变的前提下,对YOLOv8的多个尺寸模型精度有不同程度提升。第二、提出一种基于全局匹配策略停车位分配算法,可有效降低由于视角倾斜,车辆重叠遮挡等情况下违规占用停车位事件的漏报率与误报率。实验表明:利用新算法,违停检测误检率从15%下降至8%,违停漏检率从7.5%下降至6.1%。由此可见,该算法具有很好的工程化前景。
  • 魏德宾, 乔维维, 张怡
    录用日期: 2024-05-10
    由于卫星网络星座规模大、拓扑时变、链路不稳定等特点,软件定义网络(Software Defined Networking, SDN)应用在卫星网络时就需要部署多个控制器来协同工作,这就会引起一些问题,例如多个控制器分别部署在哪里,需要多少个控制器最为合适,如何平衡控制器数量,控制区域以及网络性能之间关系等问题,针对上述这些问题,本文提出了一种基于改进麻雀搜索算法(Sparrow Search Algorithm, SSA)的软件定义卫星网络(Software Defined Satellite Networking, SDSN)多控制器动态部署策略。该策略充分考虑到卫星网络拓扑的周期变化性,以降低网络时延、平衡控制器的负载、提升网络可靠性作为优化目标建立控制器动态部署模型,利用K-means聚类算法对麻雀搜索算法进行初始化改进,并动态调整麻雀算法的步长参数,通过改进后的麻雀算法优化迭代出最优的控制器部署方案。仿真结果表明,与对比实验中的控制器部署策略相比,该部署方案不仅使网络时延降低了10%左右,还使控制器的负载均衡和网络的可靠性分别提升了将近25%和40%,充分保证了动态卫星网络的整体性能。
  • 吴潮宇, 杨斌
    录用日期: 2024-05-10
    本文针对现有变化检测方法在处理高精度遥感影像时存在的漏检、误检,及边缘检测效果差等问题,提出了一种基于大核重参UNet网络的遥感影像变化检测方法,简称RepUNet-CD。该网络以UNet为骨干网络,在编码端用大核重参模块代替单卷积核结构进行特征提取,实现注意力机制的全局感受野。同时,利用重参技术将小核融合进大核结构中辅助训练,使网络保留捕获小感受野中细节特征的能力,从而生成多尺度特征,提高变化检测精度。在网络解码端将不同时相的特征图融合得到特征差分图,再通过跳跃连接和上采样得到变化特征图,最后利用特征边缘增强模块加强网络对特征图的边缘信息关注度,进一步提高检测精度后生成变化结果。此外,针对数据集客观存在的正负训练样本不平衡问题,采用有更好鲁棒性的混合损失函数进行网络训练。本文方法在LEVIR-CD和WHU-CD两个主流的公开数据集上进行实验验证,并与其他最新的遥感变化检测方法进行了对比。结果显示本文方法在许多评估指标上有显著改进,其中F1值分别提高到91.71%和92.60%,IoU分别提高到84.69%和86.20%。
  • 杜剑波, 董伟哲, 金蓉, 王军选, 康嘉文, 刘雷, 策力木格
    计算机工程. https://doi.org/69181
    录用日期: 2024-05-10
    在6G时代,空天地一体化网络 (Space-Air-Ground Integrated Networks, SAGINs) 可以为物联网 (Internet of Things, IoT) 设备提供无处不在的覆盖,能有效解决当前网络架构覆盖能力不足的问题。多接入边缘计算(Multi-access Edge Computing, MEC) 是一种非常重要的技术,可以进一步增强SAGINs的服务能力,其中MEC在有效降低任务执行延迟和系统能耗方面能够表现出显著的能力。本文提出了一种支持MEC的SAGINs架构,其中卫星和多架无人机 (Unmanned Aerial Vehicles, UAV) 作为边缘节点,为IoT设备就近提供算力。通过IoT设备的任务分割,以及UAV和卫星的带宽分配,实现网络平均总能耗最小化。考虑到网络的高动态性,无法获得实时准确的信道信息,将该问题重新建模为马尔可夫决策过程,提出了一种基于深度确定性策略梯度 (Deep Deterministic Policy Gradient, DDPG) 低复杂度的自适应决策算法。仿真结果表明,该算法在最小化网络能耗和DDPG代理累计奖励最大化方面表现出良好的性能。
  • 刘 亮, 毛武平, 李汶蔚, 谭思源, 荆腾祥
    录用日期: 2024-05-10
    由于地理因素影响,在偏远地区无法大规模建设通信网络基础设施,因此导致这些地区的网络通信质量较差以及一系列时延敏感型任务得不到及时处理和响应。针对偏远地区网络覆盖范围有限的问题,将空天地一体化网络(SAGIN)与移动边缘计算(MEC)相结合,可为偏远地区用户的时延敏感型任务卸载提供低延迟和高可靠传输。考虑到天地一体化网络中卫星资源强受限以及本地用户设备能量不足的特点,首先提出一种卫星-无人机集群-地面的三层边缘计算网络架构。在满足各地面任务的时延要求下,将任务卸载问题转化为地面用户设备和边缘服务器之间的Stackelberg博弈,并证明其是NP难的。此外,利用势博弈证明了地面用户设备之间构成的非合作博弈存在纳什均衡。最后,以寻找任务的最优卸载策略来最小化系统卸载成本以及最优的卸载任务转发百分比策略来最大化边缘服务器的效用函数为目标,提出一种基于Stackelberg博弈的纳什均衡迭代卸载算法(NEIO-SG)。仿真结果表明,与其他基线算法相比,NEIO-SG在任务卸载过程中的系统总时延减少约13%,边缘服务器的能耗降低约35%。
  • 张肇鑫, 黄世泽, 张兵杰, 沈拓
    录用日期: 2024-05-10
    在自动驾驶感知系统中,卷积神经网络作为关键技术在车辆感知和决策中发挥着重要作用。然而,其面临的对抗样本攻击威胁对自动驾驶系统的安全性和稳定性产生了严重影响。现有的对抗样本生成方法通常直接在图像中添加对抗扰动,导致对抗样本视觉质量下降,伪装性不足,易被人类观察者识别。为了解决这一挑战,本文引入了交通场景中车辆运动引起的图像模糊先验知识,提出了一种运动模糊伪装对抗样本生成方法。通过模拟车辆和行人在移动过程中产生的模糊效应,生成了具有运动模糊特征的对抗样本。为了保持图像的运动模糊同时有效实现对抗攻击,设计了一种目标隐身的对抗样本损失函数。实验结果显示,在ICDAR2018数据集上,图像检测框数量为0,图像模糊度指标BRENNER为69.28,证明了该方法可以生成运动模糊伪装对抗样本。
  • 吴小红, 李佩, 顾永跟, 陶杰
    录用日期: 2024-05-09
    联邦学习允许多个客户端在不共享私有数据的情况下协同训练高性能的全局模型。在跨组织(cross-silo)场景的水平联邦学习环境下,客户端本地数据分布中的统计异质性将降低全局模型的性能。为提升联邦学习的全局模型性能,同时避免牺牲客户端隐私和增加计算成本,本文提出了一种新的混合联邦学习方法FedAvg-Match,其基本的思路是通过改进联邦学习的方法提升客户端的模型质量。该方法面向以不平衡标签分布为特征的数据异构性,在分层联邦学习框架下设计了客户端分组聚合算法来减轻客户端数据异构性对模型性能的影响。针对客户端优化分组问题设计了一种基于动态规划的客户端匹配算法DP-ClientMatch,根据客户端的数据分布距离EMD得到最优的客户端分组匹配。在MNIST、FashionMNIST和CIFAR-10三个数据集上实验测试结果表明,与其他的联邦学习算法相比,所提出的FedAvg-Match方法可以显著提高联邦学习全局模型在图像分类任务上的性能。特别是在高度统计异质性的联邦学习场景下,最低能使全局模型测试精度提高10%以上。
  • 郭俊辰, 马御棠, 相艳, 赵学东, 郭军军
    录用日期: 2024-05-09
    实体链接旨在将自然语言文本中的提及链接到知识库中相应的目标实体,主要面临提及和候选实体的表征能力有限,导致候选实体精确排序困难的问题,而现有的知识库扩展和图嵌入等提高表征能力的方法依赖外部数据或知识,限制了其应用。本文提出了一种实体链接中提及和候选实体精确排序的方法,通过结合提及上下文构建prompt问句,将提及和候选实体相似度计算转化为基于prompt问句的打分模式。通过预训练模型微调打分 器,得到提及和候选实体相似度的打分,并综合候选实体发现阶段的得分,以筛选出更准确的目标实体。这一过程无需额外的知识,能够融合上下文信息,从而更准确地衡量提及和实体之间的相似度。在两个公共数据集上将本文模型与基线模型进行了实验比较,相比次优模型,本文模型acc@1值分别提升了0.88%和0.41%。
  • 王新良, 王璐莹
    录用日期: 2024-05-09
    安全帽是保障爆破作业人员人身安全的重要工具。针对低照度爆破现场安全帽检测任务中目标视觉信息模糊、图像亮度低及对比度低导致的目标漏检、误检等问题,基于YOLOX提出了特征增强的安全帽检测算法(Feature Enhancement-YOLOX,FEM-YOLOX)。首先,在主干网络使用软池化构建软空间金字塔池化模块(Soft Spatial Pyramid Pooling Module,SSPPM),减少了特征映射中的信息弥散,并在下采样映射中保留了更多上下文信息。其次,设计基于轻量通道注意力机制的高效特征融合模块(Efficient Feature Fusion Module,EFFM),加强了模型对目标区域特征的学习,提高了特征融合的效率,减少了模型检测的误检问题。再次,采用VariFocalLoss替代BCEWithlogitsLoss,动态调整正负样本的权重,促使模型关注数量较少的正样本,加速了模型的收敛过程,提升了两类目标的检测精度。最后,采用CIOU作为边框回归损失函数,提高了模型定位目标预测框的精度。实验结果表明,所提算法的均值平均精度相较于基线算法提升了2.21个百分点,FPS提升了7.67,满足了低照度爆破现场安全帽实时检测的精度和速度需要。
  • 吕超峰, 徐鹏飞, 罗迪, 刘金平
    录用日期: 2024-05-09
    物联网中激增的流量,影响了传感器等设备的数据传输。利用软件定义网络技术,可以优化网络性能,提高数据传输质量。然而,物联网中流量等网络状态的不断变化会影响软件定义网络控制平面的性能。本文研究了软件定义物联网中的动态控制器部署问题,以在流量变化时保证控制平面性能。考虑到物联网节点的能耗以及数据传输的特点,在部署控制器时,综合考虑延迟、控制可靠性以及能耗的影响,并将该问题构建为马尔科夫博弈过程。为了同时兼顾单一控制器性能以及控制平面整体性能,采用多智能体深度强化学习求解该问题。在部署阶段利用动作掩码屏蔽部分节点,避免将控制器部署在性能不足或者供能不方便的节点。仿真实验表明,本文所提算法可以更好的找到高性能的部署方案。
  • 刘春雨 , 陈庆锋 , 莫少聪 , 谢泽
    录用日期: 2024-05-09
    知识图谱补全旨在利用知识图谱中已有的知识推导出新的事实,在多个任务和领域发挥重要作用,引起研究者越来 越多的关注。然而现有的知识图谱补全方法大多专注于对知识图谱中的事实三元组进行建模,未充分考虑知识图谱中实体和 关系之间所蕴涵的深层语义和关联。为了解决这个问题,可以使用逻辑规则反映知识图谱中关系之间的隐含关联,而知识图 谱语义网络的本质决定了事实三元组周围高阶邻域中包含着深层语义信息。因此,为了充分挖掘知识图谱中实体和关系的内 在语义和关联,本文提出一种新模型,基于逻辑规则和图神经网络进行知识图谱补全。该框架首先基于高效 EM 迭代优化算 法进行规则自动学习,将得到的高质量逻辑规则与知识图谱中的实体和关系进行联合嵌入训练,以实现对知识图谱中复杂关 系模式的建模,并提高嵌入表示的泛化性。此后,同时考虑逻辑规则和三元组的重要性进行注意力嵌入传播,以聚合高阶邻 域信息,最终得到融合深层语义和关联的实体、关系嵌入表示用于知识图谱补全。本文在 4 个公开数据集上针对链接预测任 务进行广泛实验,实验结果证明了所提出模型的有效性。
  • 韩鹏, 黄韫栀, 任彩月, 程竞仪, 徐军
    录用日期: 2024-05-08
    准确的肿瘤亚区分割是乳腺癌异质性表征的关键,而这种表征是了解乳腺癌化疗反应的关键。传统的阈值分割在功能性肿瘤亚区的区分上存在不足,提出一种改进的的分割方法(称为GR分割,Gaussian Mixture Model-Radiomics),该算法基于异质性影像组学特征包括纹理信息,强度信息,形状信息,通过高斯混合聚类,实现了功能性亚区的精准分割。基于GR分割,设计了双分支双任务分类模型(DDCN)预测新辅助化疗疗效,利用得到的亚区有助于更好地提取肿瘤内部异质性的特征,并结合文本信息评估疗效。实验证明,提出的放射组学分割模型在在不同功能亚区的识别上表现更出色,在剪影系数和方差比指数上都取得了更好的效果;而DDCN模型,融合了不同亚区的特征,消融实验相比,在受试者工作特征曲线下的面积、准确率等指标上都取得了更好的结果。总体而言,GR分割在肿瘤亚区分割上比传统的阈值分割效果更优,而DDCN模型在评估新辅助化疗疗效方面具有广泛应用的价值。
  • 郭俊博 , 马祥
    录用日期: 2024-05-08
    针对人脸图像在存在复杂环境下的噪声污染、光照变化和遮挡等问题,提出了一种新的人脸识别方法,即基于非凸混合范数误差编码的人脸识别方法(Face recognition method based on non-convex mixed norm error coding ,NMN)。该方法旨在统一基于向量和基于矩阵的回归方法于一个回归模型中,以更好地应对多样化的识别挑战。在考虑到重构图像的低秩性质的同时,引入了核范数约束,以捕捉图像的低秩特征。为了缓解由异常值引起的偏差问题,引入了非凸函数,提高了模型的鲁棒性。为了进一步提升性能,NMN充分考虑了标签信息,以更有效地区分不同类别之间的特征差异。在分类阶段,综合考虑了非连续误差和连续误差,通过利用类重构误差来判别待识别图像。实验阶段,在Extended Yale B、ORL和AR数据集上进行了充分验证。结果表明,相较于其他对比方法,所提出的NMN方法在遮挡人脸识别方面展现出更为卓越的性能。在Extended Yale B数据集上,针对测试样本添加40%的“狒狒”图像遮挡块,NMN方法的识别率达到了80.40%,比其他对比算法至少高出11.68个百分点。
  • 孙浩淼, 李宗民, 肖倩, 孙文洁, 张雯欣
    录用日期: 2024-05-08
    为满足冰壶智能训练的需求,结合计算机视觉与深度强化学习技术,提出了一种新的现场冰壶决策方法AI-Curling。AI-Curling包含冰壶检测(SR-Yolo)以及策略生成(GSP-MCTS)两个部分。前者负责感知关键时刻冰壶状态,提取实景冰壶的位置与种类信息。为提高大场景下的小目标检测精度,防止不恰当下采样造成的特征损失,引入了浅层细化骨干网络(Shallow Refined Backbone Network ,SRNet),通过在网络初级阶段增加层级,捕获更丰富的特征信息。此外,在多尺度融合网络中,引入自适应特征优化融合模块(Adaptive Feature Optimization Fusion,AFOF),以增加各层网络有效样本,避免小尺度目标淹没在复杂背景和噪声中。策略生成模块通过蒙特卡洛树搜索(MCTS)算法结合策略价值网络的方式,实现了冰壶比赛决策分析。该模块通过引入核函数处理处理动作空间连续性和执行不确定性,并通过在策略价值网络中嵌入全局策略感知模块(Global Strategy Perception Module,简称GSP),增强了网络空间感知能力。在实验中,SR-Yolo在常规冰壶数据集Curling上取得0.974mAp@.5,在遮挡较多的复杂冰壶数据集Curlng_hard上取得0.723的mAP@.5。同时,GSP-MCTS与最新实景冰壶模型Curling MCTS对战获得62%的胜率,实验结果表明,GSP-MCTS具有更好的性能。
  • 徐晓滨, 张云硕, 施凡, 常雷雷, 陶志刚
    录用日期: 2024-05-08
    摘 要: 机器学习模型的好坏影响预测精度,输入与输出结果的拟合情况。在复杂系统中,使用单一模型评估系统安全性问题时容易受到数据量、数据格式、模型结构以及环境干扰等问题导致这个模型在解决某个问题的能力上比较出色,而在解决其他问题时,结果却不尽如人意。针对上述问题,本文提出了一种基于特征匹配度和异类子模型融合的安全性评估方法。首先,按照采样数据的输出值划分不同规模的数据集并构建子模型;其次,通过计算每一个新数据对于这些子模型的匹配度进而得到每一个子模型的权重;最后,根据权重的大小融合所有的子模型的子输出得到最终的多模型融合结果。本研究提出的基于特征匹配度和异类子模型融合的安全性评估方法对山东省济宁市霄云煤矿采掘数据集进行研究,实验结果表明,该方法与多样本单模型、少样本单模型和传统多模型方法相比,在以330/70的比例来构建子模型的情况下均方根误差(RMSE)分别降低了15.13% 、51.67%和12.46%。
  • 栾方军, 龚琪, 袁帅
    录用日期: 2024-05-08
    为了应对人群图像中尺度变化和背景干扰的问题,提出了一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先,网络模型采用了ConvNeXt作为主干网络,用于提取特征。其次,为了有效融合不同层次的特征,提出了多层次特征融合模块(MFFM),将主干网络中不同层次的特征进行跨尺度融合,融合后的特征包含了不同尺度的语义信息,可以更好地适应人群计数任务中的尺度变化问题。接着,为了更好地解决人群计数中存在的挑战,设计了一个多尺度注意力模块(MSAM),MSAM利用不同感受野的分支提取不同尺度的特征,利用注意力机制(SKCA)缓解多列结构存在的特征相似问题,并将模块生成的注意力图反馈到对应的尺度特征中,以抑制背景的干扰。网络模型在ShanghaiTechA数据集中MAE和RMSE分别达到了56.1和93.9;在ShanghaiTechB数据集中MAE和RMSE分别达到了6.1和10.3;在UCF_CC_50数据集中分别达到了174.9和252.7;在Mall数据集中MAE和RMSE分别达到了1.42和1.85;。在公开数据集的实验结果表明,提出的网络模型与现有代表性的人群计数方法相比,在提升人群计数任务的准确性和鲁棒性方面均取得了显著一定进展。
  • 聂雷, 胡字升, 鲍海洲
    录用日期: 2024-05-08
    异构车载网络(Heterogeneous Vehicular Network, HVN)环境中车载终端用户的服务质量体验高度依赖于网络选择方法。针对以单个车辆为角度选择接入网络容易导致优质网络阻塞和网络资源分配不均的问题,提出一种基于路侧单元辅助和自适应分簇的异构车载网络选择方法(RSU-assisted and Adaptive clustering based Network Selection method, RANS),适用于融合5G/6G的城市HVN环境。首先,该方法借助RSU的计算存储能力评估候选网络的性能,分别利用层次分析法(Analytic Hierarchy Process, AHP)和熵权法(Entropy weighting method, EWM)计算候选网络的主观权重和客观权重,在利用简单加权法计算其综合权重后,根据车辆的业务类型采用基于直觉模糊集的灰色关联度分析法(Intuitionistic Fuzzy Set based Grey Relational Analysis, IFS-GRA)对候选网络排序;与此同时,在网络负载较高时对车辆进行自适应分簇,利用分层结构有效降低网络的拥塞概率;最终车辆接入从RSU处获取满足其业务需求的最优网络。实验结果表明,RANS方法相较CHSO-GRA和MANSA分别减少了30.72%和9.57%的网络切换次数,相较CHSO-GRA和DUVC分别增加了8.01%和39.36%的吞吐量,提高了网络资源的利用率,也实现了更优的负载均衡。
  • 毛竞争, 胡潇锐, 徐庚辰, 吴国栋, 孙彦斌, 田志宏
    录用日期: 2024-05-08
    基于数字孪生的工业控制系统有助于提升系统的安全性,保护工业生产现场的安全稳定运行以及提高工业生产效率。目前,数字孪生技术在工控安全领域的应用主要涵盖以下两点:安全态势感知和网络靶场。基于数字孪生的安全态势感知能够协助安全人员实时监测系统的安全并检测系统的异常情况,根据其收集的孪生数据进行漏洞分析和威胁识别,并运用可视化技术进一步显示当前系统运行状态的视图。基于数字孪生的工业网络靶场作为安全策略的验证平台,具备模拟工控系统中的攻与防的功能,其有助于评估不同安全策略的有效性,针对关键基础设备进行防护,并为安全人员提供相应的培训和教育。此外,基于数字孪生的网络靶场提供对工控系统的全面感知,通过数字仿真系统的设备和网络,增强设备安全和网络弹性。最后,在工控安全领域中,现有的关于数字孪生的应用主要有智能电网等典型案例,其更好地验证数字孪生技术在工控安全中的重要作用,进一步分析了数字孪生技术在工控安全领域未来的发展方向。
  • 杜松霖, 仵大奎, 余云涛, 刘亚, 周文举
    录用日期: 2024-05-08
    在分布式调度中,调度策略的协同化已逐渐成为分布式调度研究者与分布式制造行业决策者的重点关注方向之一。针对带装配机的分布式阻塞流水车间调度问题(Distributed Blocking Flow-Shop Scheduling Problem with an assembly machine, DBFSP-A),以最大装配完成时间为优化目标,提出一种基于Q-Learning的协同优化算法(Q-Learning-Based Collaborative Optimization Algorithm, QLBC)。首先,建立了以最大装配完成时间为优化目标的数学模型,以增强DBFSP-A的可解释性。在算法构造初始化阶段,QLBC充分利用DBFSP-A的问题特征,分别根据加工任务的总处理时间、前置延迟时间等特定的排序规则,构造式地产生高质量的、多样性的可行调度序列作为算法的初始解。其次,在QLBC的后续迭代中,采用基于Q-Learning的协同搜索策略,自学习地指导当前解根据其各自状态及先验反馈选择合适的搜索操作,从而实现全局搜索和局部搜索、加工过程与组装过程的协同进化与协同优化。最后,在不同实例中,测试和检验了QLBC算法的性能,通过对比能够得出结论:相较于其他6种先进算法,QLBC求解的可行调度序列平均节省时间32.09小时(约2.97%),其在提高生产效率、节约生产成本方面更具优势。