作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用


期刊的电子版内容存储于(但不限于)中国知网 :
https://navi.cnki.net/knavi/journals/ZGYR/detail?uniplatform=NZKPT&language=chs。


Please wait a minute...
  • 全选
    |
  • 罗向龙, 徐忠承, 苏勇东, 何西槟, 刘若辰
    录用日期: 2024-07-26
    路网交通流预测在智能交通领域起着关键性作用,交通流不仅有着高度的空间相关性,同时在时间特征上也存在时间相关性和周期性。现有的时空交通流量预测在时间特征提取方面更多的是关注交通流的局部时间特征。针对上述问题,提出了一种改进膨胀时空图卷积网络模型IDTS-GCN,以改进的图卷积网络(Graph Convolution Network,GCN)为基础提取空间特征,将膨胀卷积的顺序操作改为并行操作后将膨胀序列嵌入Bi-LSTM中提取交通流短期局部与宏观长期时间特征,低膨胀率的序列提取短期局部时间特征,高膨胀率的序列提取长期宏观时间特征,在此基础上添加残差连接融合时空特征得到最终预测结果。为了验证IDTS-GCN模型的有效性,在PeMS04和PeMS08数据集下进行测试,结果表明,IDTS-GCN模型在两种数据集下相较STSGCN时空联合学习模型的平均绝对误差、平均绝对百分比误差和均方根误差平均下降4.917%、3.371%、6.079%和6.291%、5.842%、4.395%。
  • 章艺敏, 黄晓英, 黄正洋, 杨超翔, 万永菁, 蒋翠玲
    录用日期: 2024-07-25
    在工业设计领域,仿生设计是一种从自然界中汲取灵感,将生物特征与产品设计巧妙结合的方法。然而,传统仿生设计方法往往存在创新性不足的问题,难以有效融合抽象生物灵感与具象产品形态。为了解决上述问题,提出一种名为BioFusion的跨域图像多尺度仿生融合算法,旨在实现产品与生物特征的高质量融合。该算法首先采用热启动优化反演方法,将图像映射至生成对抗网络的生成器潜在空间,再通过基于少样本微调的生成模型域扩展,将基于产品数据集训练的潜在空间扩展至包含生物特征的融合空间。之后,提出一种跨域多尺度插值融合方法LISM,有效地整合了产品图像域和生物图像域的语义特征。该算法模型在自建的产品数据集上训练,并与DGBID、Smooth Diffusion等方法在反演质量及跨域图像融合效果方面进行对比。实验结果表明,BioFusion能够生成逼真且富有形态感知的融合图像,在FID、图像插值标准差(ISTD)和融合图像质量(BIQI)上表现更佳,分别达到34.65、18.37和1.11。此外,BioFusion在多尺度仿生融合方面表现良好,能够生成包含不同维度语义信息的融合图像,为设计者提供丰富的仿生设计灵感和参考。
  • 徐式芃, 王雷, 盛捷
    录用日期: 2024-07-25
    识别视频中的异常个体是计算机视觉领域重要的研究课题,已有算法主要研究如何检测出异常行为的爆发期,而忽略了异常行为的发展阶段,同时存在异常定义不明确、可解释性差和应用场景泛化能力不强等问题,针对上述问题,提出一种基于知识图谱的异常个体提前识别模型。对视频进行行人检测与跟踪、行人视觉关注目标检测和行人行为识别任务,以捕获与异常行为相关的行人属性特征;建立针对异常个体的知识图谱网络,提出年龄属性、社交距离和徘徊等四种节点建模算法,根据行人属性对节点进行建模,更好地分析了异常个体在异常行为发展期的特征;提出拐卖儿童、偷窃/抢劫和打架三种基于节点状态转移的异常个体推理算法,对知识图谱节点进行状态推理,得出个体在未来发生异常行为的概率值,实现了对异常个体的提前识别,采用的推理算法增强了模型的可解释性。制作并标注了异常个体提前发现数据集,定义了偷窃、打架、抢劫和拐卖儿童四种异常行为,其中的样本源自不同的拍摄场景。在该数据集上评估模型有效性,实验结果表明,模型的平均精度均值mAP为22.83,优于其他主流行为识别模型,其中与SlowFast模型相比提升了18.96,表明模型能在异常行为爆发之前,有效地提前识别出异常个体,模型对应用场景具有良好的泛化能力。
  • 周炫余, 吴莲华, 郑勤华, 肖天星, 王紫璇, 张思敏
    录用日期: 2024-07-25
    面向全国的学生综合评价与发展平台采集了百万级学生跳绳运动数据用于中小学生身体素质测评,然而在采集的跳绳视频中存在着非跳绳视频、人物未全身出镜等不符合拍摄要求的各类异常视频,严重影响了后续学生身体素质测评模型的准确性和鲁棒性。针对上述问题,论文提出了一种联合语义提示和记忆增强的弱监督跳绳视频异常检测方法。该方法首先提取正常跳绳视频和异常跳绳视频的视觉特征,将正常特征和异常特征成对训练,增强模型对异常视频特征的感知能力;其次设计两个自监督记忆网络分别存储和分离正常视频和异常视频的特征,进一步增强模型的特征表达能力;最后,引入提示学习方法迁移大规模预训练模型中的多种跳绳异常类型的语义先验知识,增强模型在样本不足的情况下对多种异常类型语义信息的理解。实验结果表明,该方法在自建的跳绳异常检测数据集(SRAD数据集)上的AUC为94.14%,相较于基准方法提升了2.71%,具有较高的准确性。该方法的提出为实现身体素质的智能测评、推动教育评价改革具有重大意义。
  • 张黔会, 袁凌云, 谢天玉, 吴加英
    录用日期: 2024-07-19
    为解决秘密共享中因未充分考虑参与方自利行为而引发诚实参与方无法重构共享秘密、非诚实参与方可重构共享秘密等不公平问题,将秘密共享与区块链结合,基于智能合约提出了兼具公平性和可验证性的秘密共享方案(FVSS)。首先,构建了一种秘密份额混淆机制,通过绑定用户口令与秘密值,向参与方分发虚假影子秘密份额,以保护真实份额的共享免受猜测攻击。在此基础上,基于多项式承诺设计了影子秘密份额完整性验证方法,在参与方之间实现影子秘密份额的双向可验证,确保参与方互相监督的有效性。其次,为实现秘密共享的针对性公平保障,基于智能合约构建了公平性奖惩策略,激励参与方高效地实现秘密重构,并实现了对第三方恶意分发行为的有效监控。最后,对方案的可验证性、公平性、安全性、资源开销等方面进行理论分析和实验验证。实验结果表明,该方案能有效约束恶意参与方在秘密共享中的自利行为,抵抗已知攻击且通过支持用户口令和承诺值提供更高的安全性;该方案的平均时间开销在毫秒级,具备较好的实用性和可扩展性。
  • 何兆成 , 刘钦 , 朱依婷
    录用日期: 2024-07-12
    :实时仿真与评价信控策略的碳减排效果是策略调优的必要基础。现有研究中,不耦合交通仿真或仅耦合宏中观交通 仿真的碳排计算模型,面临策略评价可控性不足、分辨率过低等问题;耦合微观交通仿真的碳排计算模型,存在碳排模块与 我国车型特征差异大,耦合模型参数标定的排放计算区段划分不合理、未考虑实际车辆工况特征的问题。因此,本文开展面 向实时信控策略评价的交通-碳排耦合微观仿真模型研究,在建模方面,基于数据传输机制和车型匹配关系耦合微观交通流 仿真模型与修正 IVE(International Vehicle Emission)排放模型,并利用接口实现车辆运动与碳排同步推演与计算;在标定 方面,设计两阶段交通-碳排参数耦合标定方法,阶段一开展考虑车辆运动特征的排放模型标定,阶段二开展考虑车辆行驶 工况的交通流模型标定。实验结果表明:小型客车和公交车仿真排放因子与实测值相比,误差分别为:10.1%,15.6%;实施 “绿波”信控优化后车辆碳排显著降低 。本文耦合模型能准确高分辨率测算交通碳排放,可以对交通减排措施进行有效的评价。
  • 马涛, 佘世刚
    录用日期: 2024-07-12
    :针对电梯群控系统中用户乘梯体验与系统能耗不理想的问题,提出一种基于改进粒子群的电梯群 控多目标优化调度算法。首先,针对系统控制目标的复杂性,建立以乘客候梯时间、乘梯时间、长时候 梯和系统能耗为指标的多目标优化模型,通过线性加权求和的方法设计系统综合评价函数,改变权重可 适应不同的交通模式。其次,引入灰狼优化算法以解决粒子群算法易陷入局部最优解的问题,将灰狼-粒 子群混合优化算法应用到多目标调度系统中。仿真结果表明,该混合算法能够有效减少用户的平均乘、 候梯时长和电梯启停次数,提升了电梯群控系统的综合性能。
  • 曹渝昆, 王天浩, 李云峰, 陈明, 李晶晶, 刘元旻
    录用日期: 2024-07-12
    Text to SQL语义解析任务旨在将自然语言问题转化为可执行的SQL语句。近年来,许多研究将预训练模型等方法应用到该任务中,并取得了一定的进展。然而,由于现有的预训练模型没有针对Text to SQL任务进行重新训练,不能很好地适应任务的场景语义特征信息,从而影响模型的解析性能。同时,许多方法还容易忽略自然语言问题与数据库模式间的关系,造成解析过程中语义模糊的问题。为解决这些问题,本文提出了一种新的RGA-T5模型来完成Text to SQL语义解析任务,该模型在预训练模型T5中引入了关系感知异构图神经网络,将输入的实体与关系构建为异构图上的节点,并通过应用图神经网络实现模型对输入序列的语义关系感知;同时,该方法还提出了空间门控适配器,对其参数进行训练实现对预训练模型的微调,使模型能够针对该任务适应不同场景下的语义特征信息,减少无关信息的引入。实验结果表明,该方法在Spider数据集上相较于其他先进的Text to SQL解析方法取得了一定程度的性能提升,验证了该模型的有效性。
  • 赖小玲, 贺嫚嫚, 胡伟, 张艺, 杜璞良, 刘蕊, 宋晓彤, 郑婷婷
    录用日期: 2024-07-12
    针对传统电力负荷预测方法存在精度不高、负荷数据噪声大等问题,提出一种基于改进变分模态分解(VMD)、卷积神经网络(CNN)和形变长短时记忆网络(Mogrifier LSTM)的多因素电力负荷预测方法。首先,运用麻雀搜索算法(SSA)对变分模态分解进行优化,得到最佳效果的分解子序列,有效减轻了负荷数据噪声对预测精度的影响;其次,分析各因素对负荷预测的影响机理,利用皮尔逊(Pearson)相关系数推导各影响因素与负荷之间的相关性,剔除冗余特征,大大降低了模型失准的发生概率;最后,采用CNN提取特征向量,将分解后的负荷数据及温度、湿度等特征数据输入到CNN-Mogrifier LSTM深度网络模型中,通过CNN-Mogrifier LSTM深度网络模型对特征数据进行多维分析,使短期负荷预测精度得到提高。算例分析结果表明,本文所提出的多因素电力负荷预测模型具有较好的适配性和预测效果。与文中次优VMD-CNN-Mogrifier LSTM模型相比,本文所提模型在两份所用真实数据集上的预测精度分别提升0.5和2.4个百分点,这为短期电力负荷预测提供了一种可行的解决思路。
  • 高昂 , 王银山, 燕雯, 宋昌成, 王龙, 姚二林
    录用日期: 2024-07-12
    当下HPL-MxP基准测试程序被广泛用于衡量超算在混合精度计算下的计算能力。受制于该程序的并行实现算法,矩阵分块大小NB值的选取是一个需要兼顾矩阵乘效率和负载均衡的权衡问题。针对该问题,我们在鲲鹏920系统上进行了优化研究,本文提出多重lookahead优化策略:仍然采用小NB值进行矩阵分块实现更好的负载均衡,同时通过合并多轮尾矩阵更新提升等效NB值,实现负载均衡与高矩阵乘效率两者兼得的目标。为实现多重lookahead优化方案,本文重构了Panel存储方式,设计了计算与通信细粒度流水线,扩展了HPL-MxP源程序接口。在鲲鹏920多节点平台上的单双精度混合测试结果表明,HPL-MxP在多重lookahead优化下可有效解决NB值的权衡问题,且相较单重lookahead策略未产生明显额外开销。
  • 王熠, 李智, 张丽, 石雪丽, 刘登波, 卢妤
    录用日期: 2024-07-11
    深度神经网络在遥感图像的场景分类任务中取得巨大成功。然而,由于对抗样本具有较强的可迁移性,基于遥感图像场景分类网络的脆弱性不容忽视。为了增强遥感图像场景分类网络的鲁棒性,确保其在各种环境和条件下的可靠性和安全性,有效提高其实际应用价值,本文提出一种频域的量化对抗攻击方法FDQ (Frequency domain quantization),将输入图像进行DCT变换,在频域中利用量化筛选器有效捕捉使图像正确分类的关键特征在频域中的突出区域;然后提出一个基于类的注意力损失,使得量化筛选器逐渐丢失这些使图像正确分类的关键特征,模型的注意力逐渐偏离与原始类别毫不相干的特征和区域。所提方法利用模型的注意力分布实现特征层级的黑盒攻击,通过找到不同网络中的共同防御漏洞,从而实现针对遥感图像生成具有通用性的对抗样本;最后通过大量实验证明提出的FDQ算法可在遥感图像场景分类任务中成功攻击大多数最先进的深度神经网络,与目前最先进的基于遥感图像场景分类任务的攻击算法相比,FDQ攻击在基准数据集UCM和AID上基于RegNetX-400MF架构的攻击成功率分别提高了35.43%和23.63%。提出的FDQ具有良好的攻击性和可迁移性,更难被防御系统抵御。
  • 吕敬钦, 胡 朗, 梁炜楠, 李广丽, 张红斌
    录用日期: 2024-07-11
    COVID-19是由新型冠状病毒毒株引发的疾病。现有COVID-19影像诊断模型存在“优质样本匮乏”、“未充分挖掘样本间关系”等问题。提出面向COVID-19影像诊断的注意力蒸馏对比互学习(Attention Distillation Contrastive Mutual Learning,ADCML)模型。构建递进式数据增强策略,它包括自动数据增强与样本过滤,通过扩充图像数量并确保其质量主动应对优质样本匮乏问题;设计注意力蒸馏对比互学习框架:利用注意力蒸馏驱动异构网络互相学习各自注意力关注的病理知识,进而提取样本间对比关系,改善特征判别性;采用自适应模型融合模块,充分挖掘异构网络间互补性,完成COVID-19影像诊断。在三个公开数据集(包括CT图像和X-Ray图像)上进行有效性验证,准确率分别达到89.69%、98.16%和98.91%,F1分数值分别达到88.62%、97.58%和98.47%,AUC分别达到88.95%、97.77%和98.90%。实验结果表明:ADCML模型优于主流基线,模型有较强鲁棒性;递进式数据增强、注意力蒸馏及对比互学习形成合力,共同推动模型性能提升。
  • 黄金贵, 刘朋, 唐文胜
    录用日期: 2024-07-11
    车辆检测与识别是智能交通和自动驾驶领域的一项关键技术,对于道路安全和自动驾驶起着至关重要的作用,一直是备受关注的研究热点。基于深度学习的目标检测模型,使得车辆检测精度得到了大幅提高,但在夜间低光照和恶劣天气等不利条件下现有车辆检测技术的精度和可靠性仍然存在极大地挑战。针对这一问题,基于YOLOv7模型提出了一种专门针对夜间黑暗条件下的车辆检测方法和模型——MMD-YOLOv7。首先基于坐标注意力机制CA构建了一种新的多通道坐标注意力模块MCCA,显著提升了模型在捕捉全局和局部特征信息方面的能力。其次,创新性地通过设计构建了一个多尺度卷积模块MSC实现对ELAN结构针对性的改进,使得模型更好地适应夜间视觉环境中的噪声干扰,同时提升了特征提取的能力和精度。最后,引入了多分支模块DBB,进一步增强了模型对复杂特征的捕捉能力。为了验证所提出的模型效果,选取了BDD100K数据集中的6000张夜间场景图片进行了训练和测试,实验结果表明,本模型在车辆检测精度上相比原始YOLOv7模型提升了5.3个百分点,展现出了本文模型在处理低光照情况下的强大能力。此外,在其它多个公开的车辆检测数据集上也表现出了很好的性能,验证了本文模型具备很强的鲁棒性和泛化能力。
  • 王克文, 张维庭, 孙童
    录用日期: 2024-07-11
    针对快速响应和大范围覆盖的应用场景需求,如卫星数据处理和车辆远程控制,本文聚焦于采用分层控制和人工智能技术的方法,设计一种空天地一体化算力网络资源调度机制。将空天地网络划分为三个域,分别部署域控制器,负责本地域的资源管理;同时,通过卫星和无人机的覆盖范围进行地面区域划分,确保地面区域能够得到有效的服务保障,以实现高效地数据传输和任务处理。为了优化空天地算力网络资源利用率,引入多智能体强化学习算法,对不同场景下产生的计算任务进行实时处理;将每个域控制器视为具备任务调度和资源分配能力的智能体,在满足时延和能耗约束下,通过协同学习和分布式决策实现计算任务智能调度和高效分配。实验结果表明,该机制能够有效提高资源利用率和任务响应时间。
  • 符家成, 田瑾, 张玉金, 方志军
    录用日期: 2024-07-11
    为了充分利用物品间的关系,推荐算法开始引入知识图谱以丰富物品和用户的特征。然而,大部分基于知识图谱的推荐算法往往忽视了当前跳三元组集、初始种子和上一跳三元组集之间的联系,致使所构建的用户和物品的特征表示不够准确。针对这类局限性,文中提出了一种结合前置三元组集的知识图谱推荐模型,它基于异构传播策略生成用户和物品的初始表示,并在知识传播的过程中结合当前跳三元组集、初始种子和上一跳三元组集之间的关系以控制每跳三元组集的表示,从而生成用户和物品的最终表示,进而根据最终表示预测用户和物品交互的概率。在书籍和电影两个场景下的数据集的测试实验表明,该模型在AUC、F1和Recall三个测试指标下优于目前主流的基于知识图谱的推荐模型。
  • 何添翼, 曹海燕, 吉杨锐, 许方敏
    录用日期: 2024-07-11
    针对超大规模多输入多输出(Extremely large-scale multiple-input-multiple-output,XL-MIMO)系统利用极域稀疏性进行的网格信道估计所引起的网格上采样点的估计误差问题,本文提出了一种基于单纯形法的无网格近场信道估计算法。首先使用极域变换矩阵替换传统离散傅里叶变换(Discrete Fourier Transform,DFT)矩阵对近场信道进行极域稀疏表示,再利用极域同步正交匹配追踪的近场信道估计算法(Polar-domain simultaneous orthogonal matching pursuit,P-SOMP)进行高效的初步的估计。但由角度和距离联合产生的极域变换矩阵维度较大且列正交性较差,极域远场信道会导致能量泄露,所以进一步利用单纯形法对初步估计的结果进行基于最大似然原理的无网格精确估计,从而提高了估计精度。仿真结果表明,基于单纯形法的无网格近场信道估计算法相比于传统P-SOMP算法的信道估计精度有一定程度的提升。
  • 郝宏达, 罗健旭
    录用日期: 2024-07-11
    深度学习逐渐被广泛应用于医学图像分割领域,基于注意力机制的分割算法是目前研究的主要方法。现有大多数基于注意力机制的2D图像分割模型在多器官分割任务中往往关注切片的整体分割效果,而忽略了切片中小目标特征信息的丢失或欠分割问题,使模型分割性能受到限制。针对这一问题,提出了一种基于多尺度特征融合和改进注意力机制的多器官语义分割模型DASC-Net。DASC-Net的整体框架基于编码器-解码器架构,编码器采用ResNet-50网络,与解码器之间设置跳跃连接。注意力机制由一个双重注意力模块DAM和一个小目标提取模块SOC的并联结构实现,从而进行多尺度区域特征融合。DASC-Net不仅可以感知到较大目标的特征信息,还可以通过注意力权重重建的方式保留小目标的特征信息,提高了模型的分割性能。在CHAOS数据集上的实验结果表明,DASC-Net在Sensitivity(SEN)、Jaccard相似系数(JI)、positivity predictive value (PPV)、Dice相似系数(Dice)和MIoU上分别可以达到83.72%、75.79%、87.75% 、85.63%和77.60%,在Synapse数据集上的Dice和HD95指标数值分别为82.44%和21.25。DASC-Net在两个数据集上的表现均优于其他分割网络,表明其具有可靠、准确的分割性能。
  • 耿贞伟, 李申章, 于凤荣
    录用日期: 2024-07-11
    准确的超短期、短期多区域电力负荷预测是实现电力系统快速响应和实时调度的关键。为此,本文基于电网不同区域负荷的时空相关性,提出了考虑空间关联的多区域电力负荷超短期、短期的单步和多步预测模型。该模型集成了门控多头时间卷积网络(Gate-controlled Multi-head Temporal Convolution Network,GMTCN)、双向长短期记忆网络(Bi-directional Long Short-term Memory,BiLSTM)和注意力机制(Attention),记为GMTCN-BiLSTM-Attention。首先,采用Spearman相关系数分析不同区域电力负荷空间关联,将15个区域的负荷序列组成多元时间序列作为输入。然后,采用GMTCN和BiLSTM获取不同负荷序列的时序特征和时空依赖,并采用Attention机制赋予重要特征更高的权重,忽略不重要的信息,以提高模型的鲁棒性。在2个数据集上的实验表明,不同区域变压器的负荷之间存在时空相关性,本文提出的模型能够有效获取负荷序列以及负荷序列之间的时空依赖,能够同时实现对多区域的超短期和短期负荷进行单步和多步预测;与其他深度学习模型相比,具有更优的预测性能,更强的鲁棒性和泛化性。
  • 周晨阳, 刘雪宇, 梁少华, 吴永飞
    录用日期: 2024-07-11
    从病理全切片图像中自动准确分割肾小动脉血管是肾脏疾病诊断的前提,在肾脏疾病的诊断中起着重要的作用。现有的方法大多集中于检测和分割突出的肾小球,很少有文献关注小动脉血管的分割,因为其形态外观高度可变,边界不明确。针对以上问题,提出了一种级联检测和分割框架,用于精确分割和定量分析肾小动脉血管。在第一阶段,首先构建了多窗口自适应校准的肾动脉检测网络(RADNet),用于定位肾动脉区域;第二阶段设计分割网络,将高效的通道空间注意力和视觉Transformer结合到卷积网络(U-net)中,准确分割肾动脉壁和管腔。最后,通过计算定量结果与临床信息的相关性,进行定量分析。检测网络采用多尺度自适应标定方法,能够对动脉区域进行定位;分割网络利用Transformer和高效通道和空间注意力机制,能够更好地提取形态外观复杂、边界不明确的动脉壁和管腔。实验结果表明,与之前的最先进的模型相比,所提出的框架在小动脉血管的检测和分割方面取得了显著的提高。此外,该方法在医学图像中小病变的分割和量化方面具有很大的潜力和临床应用价值。
  • 黄道旗 , 张华君 , 孙宁 , 庄丽华 , 徐守坤
    录用日期: 2024-07-10
    :在预测性维护系统中,振动传感器在数据采集阶段可能会受到人为或自然环境的干扰,导致数据异常。为了确 保采集数据的可靠性,提出了一种安全可靠的集成式预检测方案。该方案结合了随机开启策略、相似性检测和声源定位这三 种技术,可以从空间和时间两个维度提升系统的准确性与可靠性。首先,通过随机开启策略确保传感器不会受到定向干扰, 增强系统的安全冗余;其次,相似性检测方法采用多维度距离来计算振动传感器连续采集的加速度数据的相似度,并与阈值 比较以提高系统对设备状态的敏感度;最后,声源定位技术分析异常相似度对应的音频来判断声源位置,进一步提高了预检 测的精确度。在对抗和非对抗场景下的针对性测试环境下的实验结果表明,在非对抗场景下,未集成方案相对于集成方案的 准确率和精确度分别提升了 4%和 4.13%,但召回率保持不变。而在对抗场景下,集成方案相对于未集成方案的准确率和召回 率分别提升了 9.5%和 9.14%,但精确度保持不变。
  • 赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳
    录用日期: 2024-06-27
    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工程领域的广泛关注。传统数字版权保护技术存在侵权难追踪、版权交易复杂、合法权益保护不足等问题,严重制约着数字版权保护事业的发展。区块链的防篡改性、可追溯性和去中心化等为解决数字版权侵权风险提供了高可信、透明和安全的解决思路。文章首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术方面的最新研究成果;进而评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后,文章探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加健全和可持续的区块链版权保护体系。
  • 王浩, 艾克成, 张权益
    录用日期: 2024-06-27
    在弱纹理环境中, 当前的单目视觉惯性同步定位与地图构建(SLAM)存在视觉退化和误差偏移的问题,导致系统位姿估计精度下降。为解决此问题,本文提出一种基于特征协同的单目视觉惯性SLAM方法,首先对IMU数据进行预积分并联合视觉信息进行松耦合的初始化,获取系统的先验信息和尺度信息,再引入线特征提取算法并对提取出的线特征进行优化,以降低计算开销。然后通过利用点线特征的位置关系和几何特性,使用特征协同关联算法在点特征和线特征之间建立稳定的关联约束,从而增强点特征跟踪的可靠性。最后提出一种基于多源信息融合的联合代价函数优化方法,对点特征重投影误差、线特征重投影误差以及IMU残差进行优化以提升位姿估计精度。在EuRoc和TUM VI公共数据集以及真实环境中的实验结果表明,相比较于主流的视觉惯性SLAM方法,本文方法在线特征检测和跟踪耗时部分平均降低26.5%,位姿估计均方根误差平均降低38.6%和43%,由此验证本文方法在弱纹理环境下具有更好的位姿估计精度。
  • 高庆鑫, 刘聪, 张在贵, 郭娜, 苏, 曾庆田
    录用日期: 2024-06-27
    作为组织数字化转型的关键技术,机器人流程自动化(Robotic Process Automation, RPA)近年来得到了学术界和产业界的广泛关注。成功部署RPA的关键是确定哪些活动应该自动化,然而,现有的部署策略缺乏对流程的分析,导致RPA机器人的部署错误,造成资源的浪费。此外,已有的基于流程挖掘的RPA机器人部署方法过度依赖于专家的领域知识,缺乏通用性。针对上述问题,将流程挖掘与RPA相结合,提出一种基于流程挖掘的RPA机器人优化部署方法。具体而言,首先提出从事件日志中挖掘全局流程模型的方法,挖掘得到含有时间信息的时间Petri网模型;其次通过关键流程路径识别方法得到关键流程路径;最后提出RPA机器人优化部署策略,结合时间和成本约束确定RPA机器人的最佳部署结点集合。该方法已在开源流程挖掘工具平台ProM中实现,将其与已有的4种部署方法进行时间效率提升实验比较。实验结果表明,与其他部署方法相比,该方法在不依赖于专家领域知识的前提下,流程的性能提升率达22%~41%,RPA机器人的部署正确率达到1,验证了该方法的通用性和准确性。
  • 倪源松, 韩军, 邹小燕, 胡广怡, 王文帅
    录用日期: 2024-06-27
    在电力系统中,输电线路的稳定性和可靠性至关重要,其中螺栓作为连接和固定线路主体的关键组件,对维持电力系统的稳定性起着决定性的作用。然而,在进行输电线路的巡检时,由于螺栓在巡检图像中所占的比例较小、分布不均且其特征不明显,利用视觉方法来检测这些螺栓的缺陷变得尤为困难。针对这些问题设计了自适应分块检测方法,该方法包含两个阶段,第一阶段中首先采用改进的目标密度分布图生成网络预测出包含目标大致尺寸以及分布信息的目标密度分布图,该网络是由基于参数重构的思想和多维动态卷积技术的RepODconv卷积块组成,有效控制模型的参数量,同时增强网络对小尺寸目标的关注能力;接着根据该目标密度分布图采用设计的聚类分块算法得到固定尺寸且未缩放的分块区域图像;第二阶段中采用结合自注意力模块的YOLOX模型对这些图像进行检测,提升网络对不同类别缺陷的鉴别能力。在无人机巡检的输电线路螺栓数据集上进行实验,多数类别缺陷的召回率R、准确率P均达到70%,相比于目前先进的检测网络实验结果的AP50提升约30%,mAP提升约70%,特别是小目标的mAP提升了约2倍。
  • 张天鹏, 韩晶, 吕学强
    录用日期: 2024-06-26
    小目标通常具有低分辨率和模糊不清的特点,并容易受到遮挡和背景干扰的影响,使得实现准确且实时的小目标检测仍然具有一定挑战。为提升该方面的检测性能,提出了一种名为Multi-Yolo的基于多任务学习的超分辨率辅助小目标检测算法。首先,引入一个超分辨率辅助分支引导主干网络提取有效特征,减少小目标信息丢失。其次,采用Anchor based协同监督Anchor free的双检测头训练方法辅助提升检测准确性。另外在骨干网络尾部使用CTR3模块加强目标信息与位置感知的关联性。最后在推理阶段仅使用检测分支进行推理以保证推理速度。实验结果表明,Multi-Yolo相对于基准网络在VEDAI、COCO MiniTrain和SPCD数据集上均取得了一定的性能提升。其中在VEDAI数据集上,该方法实现了10.9%的mAP提升,且与基准模型保持在相近的模型大小。同时,与主流的单阶段目标检测网络相比,Multi-Yolo在小目标检测方面表现出色,并在精度和速度之间保持了出色的平衡。
  • 李佳松, 崔允贺, 申国伟, 郭春, 陈意, 蒋朝惠
    录用日期: 2024-06-26
    软件定义网络的控制平面与数据平面解耦使其广泛应用于数据中心、物联网、云网络等大规模网络场景中。然而,这种解耦的网络架构也使其面临饱和攻击的挑战。基于图神经网络检测饱和攻击是SDN中的研究热点。但目前图神经网络中常用的KNN图忽略了短期流特征,无法有效聚合节点信息,使模型不能充分利用流的时间特征。为利用流的长短期特征提高饱和攻击检测精度,本文提出了一种基于长短期流图及混合图神经网络的饱和攻击检测方法-HGNM。该方法通过设置两个采样时间收集流的长短期流特征;同时基于灰色关联系数设计了一种长短期流图生成算法(LSGH)构建长短期流图,使流图包含流的全部特征;此外,还设计了一种混合图神经网络模型-GU-GCN,通过并联GRU与GCN获取流的时间特征与空间特征,提高模型检测饱和攻击的精度。实验结果表明,在生成图上,LSGH算法相比于KNN算法与CRAM算法能有效提高模型检测的精度。同时,与其他模型相比,GU-GCN模型的准确率、精度、召回率、F1值、ROC曲线、PR曲线与混淆矩阵都有所提高。
  • 彭奇, 刘银华, 尚云瑞
    录用日期: 2024-06-26
    在现实环境中,由于检测人脸图像时受到光照强弱、面部遮挡、姿势复杂等因素的影响,人脸表情识别的准确率不高。为解决这一鲁棒性问题,提出了一种融合关键区域注意力机制的人脸表情识别方法。根据人脸视觉系统的面部感知机制,将人脸的关键区域与整体区域融合,增强对复杂及微妙表情的识别能力。在提取关键区域阶段,采用MTCNN算法将人脸数据依次输入三个级联网络,得到人脸关键点位置信息。根据人脸解剖学对面部的研究,提出LRC方法对位置信息进行处理,裁剪得到人脸关键区域图像。将人脸整体区域和裁剪得到的人脸关键区域图像分别送入ResNet-50网络并进行特征融合,添加通过精确的位置信息和对通道关系和长期依赖性进行编码的坐标注意力机制,使得模型网络更关注人脸中对表情分类贡献更大的区域。将提出的方法在公开数据集CK+和FER2013上进行实验,识别准确率达到了96.9%和73.22%。该结果与现有的诸多先进方法对比,准确率均有显著提高,表明该方法在网络结构和性能方面具有一定参考价值。
  • 陈晓雷, 王荣
    录用日期: 2024-06-26
    针对现有点云补全网络无法同时提取高质量的点云全局特征和局部特征,丢失点云细节信息与坐标信息等问题,本文提出一种多分支多尺度点云补全网络。该网络首先在编码器将3种不同分辨率的输入点云通过联合特征提取模块依次提取不同尺度的全局特征和局部特征,然后利用细节保持池化模块和多分支编码结构有效融合这些特征,最后在解码器利用点云重构模块和多分支解码结构得到补全点云。本文在具有挑战性的公开点云数据集上开展了充分的实验,主客观实验结果表明本文方法性能优于目前先进的10种点云补全方法,能进一步提高点云补全质量。
  • 王超, 王婷, 王少军, 杨万扣
    录用日期: 2024-06-26
    经典AOD-Net (All in One Dehazing Network)去雾后的图像中存在细节清晰度不足、明暗反差过高和图像画面昏暗等问题,为了解决上述的图像去雾问题便提出了一种在AOD-Net的基础上改进的多尺度算法。在改进的网络结构中用深度可分离卷积替换了传统卷积方式减少了冗余参数来加快计算速度并有效地减少模型的内存占用量,提高了算法去雾效率;同时采用多尺度结构在不同尺度上对雾图进行分析和处理,从而更好地捕捉图像的细节信息去提升网络对图像细节的处理能力来解决原算法去雾时存在的细节模糊问题;然后还在网络结构中加入金字塔池化模块用于整合图像不同区域的上下文信息和扩展了网络的感知范围,从而提高网络模型获取有雾图像全局信息的能力,进而改善图像色调失真、细节丢失等问题。此外,引入一个低光增强模块,通过明确预测噪声来实现去噪的目标来恢复曝光不足的图像。在低光去雾图像中,PSNR和SSIM指标均有显著提升,处理后的图片具有更高的整体自然度。 实验结果表明,与使用经典AOD-Net去雾的结果相比,采用改进算法去雾后的图像效果令人满意。改进算法能够更好地恢复图像的细节和结构,使得去雾后的图像更自然,饱和度和对比度也更加平衡。在RESIDE的SOTS数据集中的室外和室内场景,本文的方法相较于经典AOD-Net网络,PSNR提升了4.5593(dB)和4.0656(dB),SSIM分别提升了0.0476和0.0874。
  • 林帆, 李建华
    录用日期: 2024-06-26
    在光学化学结构识别(Optical Chemical Structure Recognition,OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而影响识别效率。针对这些限制,将多阶门控聚合网络(Multi-order gated aggregation Network,MogaNet)和引入相对位置编码的Transformer构成的编码解码架构用于OCSR领域,提出一种基于多阶门控聚合网络的光学化学结构识别模型。该模型首先在图像特征提取时通过MogaNet空间聚合模块,捕获多尺度特征并减少特征冗余,并且通过MogaNet通道聚合模块改善通道维度的多样性;其次,在序列解码时采用引入相对位置编码的Transformer作为解码器,精确捕捉序列单词之间的相对位置关系。为了训练和验证该模型,构建了一个包含40万分子的化学结构数据集,其中包含Markush结构与非Markush结构。实验结果表明,该模型的准确率达到了92.36%,优于其他现有的模型。
  • 孟波, 史旭华, 张彬
    录用日期: 2024-06-26
    随着近年来深度学习的快速发展,基于深度学习重建稀疏、含有噪声的低质量点云表面成为当前的研究热点。目前已有的点云表面重建算法还存在难以重建复杂场景、局部细节重建不完整以及重建效率低等问题。为了进一步提高点云表面重建的效果,本文结合卷积占用网络模型,提出一种基于双分支卷积和深度插值的点云表面重建模型。首先,使用PointNet网络和双分支卷积构建的融合卷积编码模块进行特征提取,双分支卷积将点分支提取点特征自适应的融入到体素分支的体积特征中,为体积特征提供更细粒的局部信息;其次,结合邻居点特征,通过一个多头注意力网络生成查询点特征,构建深度插值特征模块,使得用于特征解码的全连接层网络预测查询点的空间位置更加准确;最后基于移动立方体算法提取高质量的网格表面模型。在对象级数据集ShapeNet以及场景级数据集Synthetic Rooms上的实验结果表明,本文算法在IoU指标上分别达到了0.931和0.910,对比POCONet分别提升了0.5%和2.6%,在Synthetic Rooms的平均重建时间上提升了约6倍。且在视觉上表现出了良好的效果;在对象级数据集ABC上体现了算法优越的泛化性能,证明了所提算法的有效性。
  • 栾孟娜, 郑秋梅, 王风华
    录用日期: 2024-06-26
    在交通标志检测中由于外界环境的干扰以及驾驶场景中交通标志目标较小的特点,导致提升交通标志检测性能一直是一项具有挑战性的任务。本文提出了一种新的交通标志检测算法,其能够在保证实时检测的情况下明显提高模型的检测精度。该算法首先设计一种新的多尺度特征提取网络,引入大尺度特征来增加小目标定位信息,同时设计多尺度特征注意增强模块进一步获得目标的上下文信息。其次,为了降低模型的计算量和复杂度,本文对原始模型的多尺度检测头进行改进,选取两个大尺度检测头对小目标进行检测。最后该算法对CIOU损失函数进行改进,增强算法对小目标的感知能力,同时提高网络的训练效率。将改进后的模型在两个开源的公共数据集上进行实验,实验结果表明,该方法在TT100K和CCTSDB2021交通标志数据集上对交通标志小目标的检测精度均有提高,在两个数据集的测试集上mAP分别达到84.8%、83.6%的检测精度,较基准算法分别提升了3%、3.6%,具有更高的检测性能和特征提取能力,且满足实时检测的需求。
  • 王玥, 颉满刚, 王雅萍
    录用日期: 2024-06-26
    信息年龄(AoI)和能量消耗(EC)是物联网实时状态更新系统的两个重要性能指标,分别用来表征信息新鲜度和能量效率。本文面向短包传输的车载网络系统,利用便车码实现负载数据和额外数据的同步传输。随机编码的额外数据叠加在低密度奇偶校验码的负载数据上实现异构数据的一步式传输,不仅不需要额外的发射功率,还不需要额外的带宽资源。在此方案下,结合截断自动请求重传协议,考虑了抢占和非抢占式传输两种策略,分别推导了各自平均AoI和EC的表达式。数值仿真结果表明,便车码在不影响负载数据AoI的条件下降低了额外数据的AoI,同时不需要额外的EC。此外,与非抢占方案的比较表明,抢占方案的平均AoI较小,但平均EC较大。
  • 王桂兰, 张成, 周国亮
    录用日期: 2024-06-26
    随着分布式能源的高比例渗透、大量储能单元以及柔性负荷的加入,主动配电网的优化调度也变得更加具有挑战性。现有经济调度较少考虑柔性负荷和储能单元的接入、收敛速度较慢,同时结合国家“双碳目标”,本文提出了FISCO BCOS平台下结合通信拓扑优化一致性算法的配电网多目标经济调度策略。该策略综合考虑发电机发电成本、污染气体排放、储能成本和柔性负荷用电效益,利用通信拓扑优化的一致性算法提高系统收敛速度,结合FISCO BCOS联盟链的存储和rPBFT共识机制优化节点间的信息共享、降低领导节点的中心性、防止部分节点作恶,实现配电网多目标最优功率分配。仿真结果表明,本文的配电网多目标调度经济调度策略收敛速度快,在领导节点切换、不同阶段时节点退出与加入及功率交换指令变化、收敛系数变动场景下仍能较快收敛,具有良好的鲁棒性和稳定性;且收敛速度优于快速一致性算法,目标权重系数选取恰当,经济与环境结果均优于多目标NSGA-II算法。
  • 逯暄, 景路琪, 彭甫镕
    录用日期: 2024-06-26
    结直肠内窥镜图像在设备之间的特征分布不同,导致训练模型在新设备上的分割性能降低。为缓解模型对新设备的适应性问题,提出一种基于增量学习的微调方法,以及一种改进的结直肠息肉分割网络CPSegNet。增量学习方法包含预训练和新设备微调两个阶段,预训练使用旧设备的数据对息肉分割网络进行充分训练,微调阶段同时使用新旧设备样本进行训练,并通过采样率和正则化损失函数防止灾难性遗忘。CPSegNet网络采用MiT的预训练模型作为骨干网络、MLP作为解码模块、不确定注意力机制作为细化模块,对边界模糊区域进行优化。为了验证学习策略对新设备的适应能力,采用Kvasir-SEG、CVC-ClinicDB、CVC-300、CVC-ColonDB、Kvasir-Sessile和ETIS-LaribPolypDB共6个数据集进行实验,其中前2个数据集为训练集,其余4个为新设备的模拟数据。以Dice相似系数和交并比作为评价指标,实验结果表明,在无增量学习情况下CPSegNet在新设备上的性能优于主流的算法,尤其是在较难分割的ETIS-LaribPolypDB数据集上,与ColonFormer算法相比,Dice相似系数分别提升了3和6个百分点;使用增量学习后CPSegNet和主流算法都能在新设备上获得性能提升,同时保持在旧设备上的分割精度。
  • 刘烨, 刘锡祥, 徐浩
    录用日期: 2024-06-26
    针对传统相机视场角狭窄所导致的鲁棒性差,而现有全景SLAM受限于图像畸变的问题,本文提出了一种基于球面映射的全景视觉SLAM(Simultaneous Localization and Mapping)技术。通过戈德堡多面体建立球面网格,建立全景二维图像像素与球面像素的映射关系,实现了在球面网格上进行特征提取与匹配。引入极弧线方程约束位姿求解,进而求解三维点坐标,并推导优化变量的雅各比矩阵,实现了全景SLAM。该方法充分利用了全景相机的几何特性,充分提取全景图像的信息,减小了畸变产生的影响。实验结果显示,该算法可以提升全景图像特征的信息提取能力,提高特征匹配的数量和准确率,同时保证了SLAM算法的轨迹精度。相较于现有的OpenvSLAM,本文提出的方法具有更高的定位精度和稳定性。
  • 马满福, 陈嘉豪, 李勇, 张聪
    录用日期: 2024-06-26
    传统的图神经网络模型缺乏对节点之间复杂关系的建模能力,且对大规模图的处理能力较弱,无法有效地从大规模图中提取代表性的子图,由此导致训练和推理的精确率不高。提出一种基于改进图注意力网络的多特征融合谣言检测模型MFLAN。首先,MFLAN通过加入注意力机制的特征融合方法,将每个特征赋予不同的权重,对原始特征进行加权和操作,获得融合后的特征向量;其次,加入正值位置编码,使模型可以获取位置信息表示;然后,引入可学习的参数矩阵,模型在训练过程中自动地学习和优化参数值。最后,对注意力分数进行稀疏化,将大规模图中部分不重要节点的注意力置为零,以此实现了MFLAN模型。实验结果表明,MFLAN模型在Ma-Weibo和Weibo23上的准确率分别达到了97.71%和97.10%,相较于Dir-GNN模型分别提升了1.07%和1.12%,与其他谣言检测模型相比,各项性能指标均有提升。
  • 庄紫薇, 朱俊国
    录用日期: 2024-06-26
    文本检错是自然语言处理的研究方向之一,目标是自动检测输入文本中错误单词的位置和类型,该任务不仅在文本处理的各种下游环节中应用广泛,而且关系到日常生活中方方面面。针对英文、中文的文本检错模型已经能够达到较高的准确率,然而,越南语语料资源稀缺、人工标注数据不足,面向越南语的文本检错任务深受训练样本匮乏和低质量的困扰。此外,还存在不同场景来源的文本包含错误类型不同,以及错误类型数量不均衡的情况,通用文本检错模型无法学习到特定错误类型的检测方法,检错能力较低。基于上述问题,提出一种面向多源文本的越南语文本检错语料库构建方法,利用越南语光学字符识别、越南语语音识别和越南语-英语翻译数据集构建初始语料库,并根据多源越南语检错语料生成方法得到错误语料,通过检错语料自动标注算法获得带标签的训练数据。其次,提出了融入多源信息特征的越南语文本检错序列标注模型,在多语言BERT编码端融入场景特征,使模型能够根据当前输入文本场景适应错误类型。实验表明该方法相比基线模型提升了1.91%和1.80%的 和 得分,并进一步验证了模型各组件的必要性以及数据集构建方法的有效性。
  • 王帅, 史艳翠
    录用日期: 2024-06-26
    序列推荐算法旨在根据用户历史行为建模其不断变化的兴趣,并预测其可能感兴趣的下一项内容。为了有效缓解数据稀疏性问题,研究了对比式自监督学习在序列推荐中的应用。首先,针对随机数据增强易引入数据噪声的问题,提出了融合用户偏好的个性化数据增强方法,通过用户评分引导增强过程,同时对长短序列使用不同的增强方法组合,生成符合用户偏好的增强序列;其次,为了解决训练中出现的数据特征学习不平衡问题,设计了一种混合增强训练法,在训练前期,通过随机选择增强方法生成增强序列,提高模型的性能和泛化能力,在训练后期,选择与原始序列相似度较高的增强序列,使模型全面地学习用户的实际偏好和行为模式;最后,将传统的序列预测目标与自监督学习目标相结合,推断出用户的表示。在数据集Beauty、Toys和Sports上进行了实验验证,相较于基线模型中的最好结果,指标HR@5分别提升了6.61%、3.11%和3.76%,指标NDCG@5分别提升了11.40%、3.50%和2.16%,上述实验结果验证了该模型的合理性和有效性。
  • 甘 楠, 付晓东, 冯 艳
    录用日期: 2024-06-26
    现有边缘计算动态定价算法普遍基于博弈论模型与拍卖机制提出。以最大化服务提供商总收益为优化目标,现有定价算法在事先获取用户效用信息方面存在难度,并且多数拍卖机制在选取价格时倾向于局部最优而非全局最优。针对上述问题,提出一种基于上下文多臂机的边缘计算任务卸载动态定价算法。首先,将边缘计算动态定价问题建模为上下文多臂机模型,然后设计一种基于汤姆森采样的任务卸载动态定价算法,运用贝叶斯后验来诱导服务提供商进行价格选取,通过每一轮的奖励收益更新对应参数,有效减少了动态定价过程中总收益的亏损值。最后,模拟真实的边缘环境进行实验,验证了定价算法的有效性。仿真实验表明该定价算法在期望累积遗憾值与期望累积收益值方面都优于现有多臂机算法和定价算法。
  • 曾碧卿, 姚勇涛, 谢梁琦, 陈鹏飞, 邓会敏, 王瑞棠
    录用日期: 2024-06-25
    多模态方面级情感分析旨在从文本和图像对中分析方面词的情感极性。现有的方法致力于抽取图像与文本的情感特征。然而,图像与文本的各个特征不一定对最终的情感分析是有效的,图像和文本通常在方面词情感相关的区域外含有大量的冗余信息与噪音信息,并且图像和文本的不同区域可能与不同的方面词有关,粗略地建立图像文本特征抽取的过程中,将会向多模态方面级情感分析任务引入噪声。此外,图片和文本的方面词相关的情感极性可能还是对立的,即两者存在交互信息。为了解决上述问题,本文提出了结合局部感知与多层次注意力的多模态方面级情感分析模型(Combining Local Perception and Multi-Level Attention, CLP-MLA)。具体地,局部感知模块被设计为同时选择与方面词在语义上相关的文本内容和图像区域;紧接着,为了准确地聚合情感信息,本研究在模型中引入多层次注意力模块,其使用注意力瓶颈机制来进行模态交互信息的提取。大量的实验证明了本研究的模型相对于现有方法的优越性。
  • 田银花, 杨立飞, 韩咚, 杜玉越
    录用日期: 2024-06-25
    业务流程合规性检查可以帮助企业及早发现潜在问题,保证业务流程的正常运行和安全性。为此,本文提出一种基于改进BERT和轻量化CNN的业务流程合规性检查方法。首先,根据历史事件日志中轨迹提取轨迹前缀,构造带拟合情况标记的数据集;其次,使用融合相对上下文关系的BERT模型完成轨迹特征向量的表示;最后,使用轻量化CNN模型构建合规性检查分类器,并完成在线业务流程合规性检查,有效提高合规性检查的准确率。在5个真实事件日志数据集上进行实验,结果表明本文提出的预测模型比Word2Vec+CNN模型、Transformer模型、BERT分类模型在准确率方面有较大提升,且与传统BERT+CNN相比,最高可提升2.61%。
  • 刘春霞, 孟吉星, 潘理虎, 龚大立
    录用日期: 2024-06-25
    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法BFMYOLO。设计了像素级的RGB和红外(IR)图像融合模块BFM,充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块AA,解决特征融合过程中的多目标信息冲突问题,结合CARAFE上采样算子并进一步融入浅层特征,加强非相邻层间融合效果的同时增强小目标的空间信息;设计了改进的任务解耦检测头IDHead,将分类和回归任务分开处理,降低不同任务的相互干扰,融合学习深层语义特征,进一步提升模型的检测性能。采用NWD损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的mAP50分别达到78.6%、95.5%和73.3%,优于其他先进模型。在遥感小目标检测中表现出良好的性能,验证了其有效性。
  • 艾传鲜, 郭军军, 尹兆良
    录用日期: 2024-06-25
    事件方面类别检测旨在识别出给定事件文本中的方面类别。相关研究可以辅助获取不同领域和事件文本中的关键信息,特别是在社交媒体舆情研究中具有实用价值。在社交媒体舆情事件发展前期,事件文本标记数据稀缺,如何基于少量标记数据实现准确的事件方面检测是一个亟待解决的问题。论文提出一种基于预训练模型的多层级软提示交互融合少样本事件方面类别检测方法,基于预训练构建多层次的软提示模板,分别与预训练模型进行层级语义表征和交互融合,并自适应的融合多层次的提示表征,从而提升少样本事件方面类别检测的效果。论文在自构建中文社交媒体少样本数据集和英文数据集上进行实验,实验结果证明论文所提方法明显优于其他基线方法,进一步的消融及可视化证明了论文所提多层次提示交互融合模块的有效性。
  • 张佳承, 韦锦, 陈义时
    录用日期: 2024-06-25
    针对道路两侧绿篱修剪的目标检测过程中对算法实时性、轻量化的要求以及算法在实际检测中的精度和光照鲁棒性问题,提出了一种基于YOLOv8n的算法MGW-YOLO。提出一种新的C2f_ModuGhost+模块替换主干网络中的C2f模块,其中设计的调制可变形卷积增加了偏移量特征通道数,加速了模型的推理,增强了算法实时性。在颈部网络中引入GSConv轻量级卷积技术和slim-neck设计范式,融合了标准卷积、深度可分离卷积和shuffle模块的思想,降低了模型的参数量,实现了模型的轻量化。设计了一种具有双重加权机制的Focal-WIoU损失函数,WIoU中的双层交叉注意力机制有效降低了多个绿篱相连和遮挡时的误检率,并且利用Focal Loss权重因子提升了对特殊形状绿篱等难分类样本的检测精度。另外采用了TRADES的对抗训练策略,在分类问题鲁棒性与精度之间进行了有效权衡。与基线YOLOv8n的对比实验表明,MGW-YOLO相较于原始算法的mAP@0.5和mAP@0.5-0.95分别获得了3.29%和2.87%的提升,在无人驾驶底盘上的实验表明,MGW-YOLO相较于原始算法的预处理时间、每帧平均推理时间和每帧后处理时间分别降低了0.7ms、10.7ms和0.7ms,FPS获得了15.7的提升,适用于绿篱修剪机在道路两侧实时性作业的需求。
  • 杨润, 陈艳平, 闫家鑫, 秦永彬
    录用日期: 2024-06-24
    图神经网络能够有效地聚合节点间的信息、编码句子的结构信息,因此被广泛应用在关系抽取任务。然而,目前基于图神经网络的关系抽取方法常需借助外部解析工具构建依赖树,这一过程可能会产生误差,导致错误的信息传递。为了解决上述问题,本文提出了一种基于关联邻接矩阵的图卷积神经网络模型用于关系抽取。该模型首先通过RoBERTa预训练语言模型将每个词转换为向量表示,并通过点乘计算词向量之间的关联度。然后,基于词之间的关联度和相对实体位置特征构建关联邻接矩阵,并利用图卷积神经网络提取句子的语义结构特征。最后,利用残差连接缓解模型训练过程中的梯度消失问题,并通过融合句子表示和实体表示得到最终的分类表示。该模型避免了使用外部解析工具可能引起的误差传播,实验结果表明,与现有基于图卷积的模型相比,本文模型在TACRED和Re-TACRED数据集的关系抽取任务上取得了良好的性能,分别获得了68.8%、77.5%、72.8%和90.5%、91.3%、90.9%的P、R、F1值,验证了该模型的有效性和可行性。
  • 施永辉, 代琪, 陈丽芳, 韩 阳
    录用日期: 2024-06-21
    联邦学习框架在保护本地数据隐私的同时,面临着来自攻击者污染客户端数据的挑战,可能导致全局模型性能下降。目前主流联邦学习框架设计时通常假设客户端本地数据是干净的,但实际情况中攻击者可通过数据污染手段破坏模型准确性。为此,研究者提出了一种基于自然最近邻的联邦聚合算法。与其他传统联邦防御算法不同,该算法为非独立同分布的条件下的联邦学习框架,能够防御有目标的攻击。该算法引入自然最近邻的搜索过程,通过此过程赋予模型异常度,有效区分异常模型。选取其中异常度较小的节点参与训练,确保正常节点参与训练次数远大于恶意节点次数。实验证明,非独立同分布的条件下,该算法在标签翻转和后门攻击等有目标攻击的场景下,能保持模型准确率,增强了联邦学习框架的鲁棒性。即使受到恶意攻击,该算法有效维护全局模型性能和可靠性。这一基于自然最近邻的联邦聚合算法为解决客户端数据污染问题提供了有效途径,为联邦学习框架安全性和稳定性提供新思路。
  • 王湛, 张鹏程, 金惠颖, 吉顺慧
    录用日期: 2024-06-21
    随着云网融合技术以及空天地一体化网络的快速发展,越来越多的服务开始在云网融合环境下运行,在云网融合环境下,用户呈现移动性特征,导致服务组合过程变得愈发复杂。因此,服务组合的验证在云网融合环境下变得尤为关键。与此同时,在云网融合环境下用户要求服务组合不仅在当前时间段内运行稳定,还需要在未来时间段内持续满足用户需求。为了解决以上问题,提出一种云网融合环境下服务组合的未来属性验证方法。该方法首先对云网融合中的服务组合过程进行形式化建模,同时考虑了用户移动导致的云网环境下服务场景的转换关系。然后,为了准确描述用户需求,对云网融合场景下的用户需求进行形式化描述。最后,为了解决云网融合环境下用户对服务组合未来时间段内的验证需求,对服务组合未来时间段的服务属性进行了预测,利用PRISM模型检验工具来进行云网融合环境下的服务组合验证,以确保在未来时间段内仍然满足性能和可用性要求。最后实验结果表明,在云网融合环境下服务数量达到1000时的验证模型构建时间以及模型检查分别为3.372s和0.075s,并且通过云网融合环境下服务组合案例说明了该方法的有效性与可行性。
  • 宋 杰, 徐慧英, 朱信忠, 黄 晓, 陈 晨, 王泽宇
    录用日期: 2024-06-20
    在室内场景中,由于角度、光线变化等因素导致现有的目标检测算法检测跌倒事件时存在检测精度低和实时性差的问题。针对这一挑战,本研究提出了一种基于YOLOv8改进的跌倒检测算法:OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块,优化了核空间的四个维度以增强特征提取能力,而且有效减少了计算负担;同时,为了捕获更细粒度的特征,在颈部网络中引入Efficient Multi-Scale Attention Module(EMA)注意力模块,进一步聚合像素级特征,提高网络在跌倒场景中的处理能力;在CIoU损失函数中融入Focal Loss思想,使模型对难分类样本给予更多关注,优化模型整体性能。实验结果表明,相比于YOLOv8n,OEF-YOLO跌倒检测算法精度在mAP@0.5指标上提升了1.5%,mAP@0.5:0.95指标上提升了1.4%,仅有3.1M的参数量和6.5的GFLOPs,在GPU上FPS提高了44帧每秒,做到了高精度检测跌倒事件的同时,兼顾低算力场景下的部署要求。
  • 李毅, 徐慧英, 朱信忠, 黄晓, 王舒梦, 李悉钰
    录用日期: 2024-06-20
    口罩作为基础的个人防护物品,在公共卫生领域发挥着越来越重要的作用。针对复杂场景下口罩检测精确度低的问题,为了进一步提高口罩检测精确度和模型训练的稳定性,本文提出了一种基于YOLOv5n改进的轻量级口罩检测算法Mask-YOLO,具体为:在特征提取阶段中的卷积模块组采用Softplus激活函数提升模型非线性映射效率加快模型的收敛速度;在主干特征提取深层网络中添加Coordinate Attention,通过嵌入位置信息到通道注意力,使网络获取更大的物体区域信息和通道目标特征,同时避免较大的内存开销;与此同时在深层网络将SPPF模块替换为RFB模块,借助不同的膨胀率来扩大卷积特征采样的感受野,获取到高层网络中丰富的物体语义信息;在多尺度特征融合网络PANet结构的基础上,添加BiFPN跨阶段多尺度特征融合设计,使得具有不同尺度空间信息和语义信息的目标特征充分融合交互,进一步提升小目标检测精度;采用DIoU作为边界框损失函数,用以解决边界框回归不稳定和目标漏检的问题;最后,采用Soft-NMS的方法通过降低重叠检测框置信度得分的方式,进一步提升检测效率。实验结果表明,改进后的口罩检测算法Mask-YOLO与基准模型YOLOv5n相比在mAP@0.5-0.95综合评价指标性能提升8.58%,解决了原始YOLOv5n算法在口罩检测中小目标检测精度低、边界框回归不稳定和模型训练收敛慢等问题,实现了高效的口罩检测。