近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能, 多模态学习的重要性和必要性逐渐展现出来, 其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于预训练模型强大的泛化性能, 使用视觉-语言预训练模型不仅能提高零样本识别任务的准确率, 而且能够解决部分传统方法无法解决的零样本下游任务问题。对基于视觉-语言预训练模型的ZST方法进行概述, 首先介绍了零样本学习(FSL)的传统方法, 并对其主要形式加以总结; 然后阐述了基于视觉-语言预训练模型的ZST和FSL的区别及其可以解决的新任务; 其次介绍了基于视觉-语言预训练模型的ZST方法在样本识别、目标检测、语义分割、跨模态生成等下游任务中的应用情况; 最后对现有的基于视觉-语言预训练模型的ZST方法存在的问题进行分析并对未来的研究方向进行展望。
图像匹配的目标是从两个或多个图像中找到相似结构之间的对应关系, 是计算机视觉技术的重要基础, 在机器人、遥感、自动驾驶等领域具有广泛应用。近年来随着深度学习技术的发展, 基于深度学习的二维(2D)图像匹配算法在特征提取、特征描述、特征匹配3个方面不断进行改进, 其性能在匹配精度、鲁棒性等方面远超传统算法, 取得了重大突破。首先, 总结近10年基于深度学习特征的2D图像匹配算法, 将其分为基于局部特征的双阶段图像匹配、联合特征检测和描述的图像匹配、无特征检测的图像匹配3类算法, 阐述这3类算法的发展过程、分类方法、性能评价指标并归纳其优点及局限性。然后, 介绍2D图像匹配算法的典型应用场景, 分析2D图像匹配算法的研究进展对其应用领域的影响。最后, 总结并展望2D图像匹配算法的发展趋势。
阿尔茨海默病(AD)是一种不可逆的神经退行性疾病, 会导致认知能力的逐渐下降。AD症状的演变过程可能很长, 在不同的神经成像模式中可检测到脑区生物标志物的细微变化, 但其早期检测具有挑战性。由于神经成像数据的高度复杂性和大脑网络的不规则性, 传统的机器学习和深度神经网络模型存在许多不足, 开发基于图神经网络(GNN)的计算机辅助诊断(CAD)模型可以为分析非欧几里得空间的神经影像模式以及探究生物标志物提供极大帮助。首先, 对基于GNN分类方法的AD预测进行详细的调研和概述。然后, 从基于单模态数据和基于多模态数据两个视角进行梳理, 重点介绍和分析这些方法在单模态和多模态数据应用场景中的数据提取、脑网络建模、特征学习、信息融合等过程, 并评述部分方法的性能。最后, 针对GNN应用于AD诊断的主要挑战和未来研究方向进行了展望, 为AD辅助诊断的进一步研究提供有益的建议。
传统的目标检测算法通常预设许多候选的目标边界框(“锚框”)穷举待检测目标的潜在位置, 在对边界框进行置信度计算后筛除冗余边界框确定人物位置, 此类检测方法需要复杂的后处理程序, 检测效率低。针对待检测的人物目标, 提出基于热力图预测的免“锚框”目标检测算法, 将人物目标的检测转化为对人物热力图的最大值, 即目标中心点的检测。通过中心点进行目标尺寸的回归, 最终确定目标位置, 免除对“锚框”的依赖和计算, 从而有效降低计算成本, 大幅提高目标检测的速度。实验结果表明: 与传统基于“锚框”的检测算法Faster R-CNN和SSD相比, 所提算法目标检测速度大幅提升, 达到45帧/s, 同时检测精度相较前两者在不同数据集上均有所改善。在现实场景测试中, 即使视频中存在人物交叉遮挡情况, 该算法也能实时跟踪和精准检测人物位置, 达到实时检测的目的。
跨链桥作为一种新型区块链基本服务, 实现了区块链间的资产和数据流通, 极大地促进了区块链去中心化金融(DeFi)的建设。然而在实际应用过程中, 由于跨链桥的交易不透明与资产难追踪问题, 许多犯罪分子开始将跨链技术作为一种洗钱手段, 在链间进行非法资产的转移。因此, 跨链交易追踪问题正逐渐成为学术界与相关监管部门关注的焦点。现有方法主要通过规则匹配的启发式算法来实现跨链交易的关联, 这种方法虽能有效匹配特定区块链间的交易, 但仅面向中心化金融(CeFi)跨链桥服务, 且高度依赖于中心化的内部应用程序编程接口(API), 难以广泛支持多种跨链桥的交易关联。为解决以上问题, 提出一种面向DeFi跨链桥服务的交易关联方法。根据跨链桥消息传递机制获取源链的存款事件日志, 并基于专家规则提取关键跨链信息, 利用数据爬取技术构造目标链交易搜索空间。在此基础上, 通过多种业务规则实现跨链交易的关联。实验结果表明, 该方法在Celer cBridge、Multichain和Poly Network这3座跨链桥的真实交易数据集(以太坊为源链, 币安智能链为目标链)上准确率分别达到93.6%、95.3%和91.6%, 具有较好的关联效果。
多无人机在现代化作战中的运用日渐增多, 无人机任务规划在无人机智能作战中至关重要。针对子系统能力约束下的无人机任务分配问题, 提出一种Levy Flight(LF)优化下基于拍卖机制的混沌反向学习狼群优化算法CRL-AMIWPA。首先, 定义无人机能力矩阵和任务场景, 对无人机异构性、任务执行能力、执行任务能力最低需求建立同一矩阵描述, 根据距离油耗和最迟任务完成时间的加权和建立目标函数, 建立子系统约束下的任务分配模型; 然后, 设计狼群个体编码, 每个编码方案包含一种任务分配策略, 针对未达到任务需求最低能力的解, 采用基于合同网的拍卖策略予以修正。另外, 在狼群初始化阶段, 采用Tent混沌算子和反向学习策略, 将狼群个体均匀地分布在解空间中, 以提高初始种群的多样性, 最后, 利用LF策略优化寻优过程, 提高跳出局部最优解的能力。仿真实验结果表明, 所提算法能有效解决在子系统约束场景下无人机任务分配问题, 相比其他群智能算法和狼群算法, 具有更优的寻优性和收敛速度。
知识图谱补全是通过预测知识图谱中缺失的事实进行填补, 以解决知识图谱中的数据稀疏问题。CapsE、QuatE等用于知识图谱嵌入的模型在链接预测方面已经取得了较好的表现, 但是, CapsE模型因其在复数空间进行链接预测与数据挖掘, 会受限于其数据维度, 使得数据挖掘不够深入, QuatE采用四元数构造超复数平面进行逻辑旋转, 但其方法简单, 无法有效地构建复杂关系。为此, 提出一种改进的胶囊网络补全方法No-CapsE, 在超复数平面构建胶囊网络。将数据用四元数进行表示并输入到四元数卷积网络中, 输出的特征向量作为胶囊网络的输入, 通过点积操作进行评分并依据评分判定三元组的正确性。此外, 为了提高模型的训练速度, 提出节点共现的思想, 将实体和关系都视作节点。在公开数据集FB15K-237与WN18RR上进行链接预测实验, 同时为了进一步探究所提模型的性能与效果, 进行消融实验。实验结果均表明, 相较于对比模型, No-CapsE的知识图谱补全效果更好, 可以应用于大规模链接预测任务。
为解决传统伪装目标检测(COD)出现的空间信息不完整和目标边界模糊的问题, 提出一种基于深度纹理特征的伪装目标边缘细化检测算法。该算法针对目标的纹理差异和边缘细节设计上下文纹理差异放大模块(CTDAM)、特征边界搜寻模块(FBSM)和边界推理模块(BIM)。CTDAM利用全局感受野覆盖和并行多分支混合卷积方式突出被遮挡的伪装目标的纹理差异; 在注意力特征融合模块(AFFM)中引入局部注意力和位置通道感知并行注意力指导特征跨层融合, 达到平衡局部信息和增强全局上下文语义信息的效果; FBSM利用自注意力机制将低层与高层特征相结合, 处理不同边界像素点之间的依赖关系; BIM利用FBSM所提供的边界指导因子, 指导融合后的特征推断出真实目标并细化边缘细节。在CAMO、CHAMELEON和COD 10K数据集上利用4个客观评估指标进行定量和定性实验, 结果表明, 该算法的检测性能优于对比的8种先进算法, 在COD 10K数据集上, 其平均绝对误差(MAE)达到了0.034。
为了降低深度伪造技术滥用带来的社会风险, 提出一种基于生成对抗网络的主动防御深度伪造方法, 通过在原始图像上增加微弱扰动制作对抗样本, 使多个伪造模型输出产生明显失真。提出模型由对抗样本生成模块和对抗样本优化模块组成。对抗样本生成模块包括生成器和鉴别器, 生成器在接收原始图像生成扰动后, 通过对抗训练约束扰动的空间分布, 降低扰动的视觉感知, 提高对抗样本的真实性; 对抗样本优化模块由基础对抗水印、深度伪造模型和鉴别器等组成, 通过模拟黑盒场景攻击多个深度伪造模型, 提高对抗样本的攻击性和迁移性。在常用深度伪造数据集CelebA和LFW上进行训练和测试, 实验结果表明, 相比现有主动防御方法, 提出方法在实现跨模型主动防御的基础上, 防御成功率达到85%以上, 并且对抗样本生成效率比传统算法提高20~30倍。
信息技术的发展与进步促使“互联网+教育”成为目前教育领域的研究热点, 教育教学的各个环节都在向智能化的方向发展。中学数学的命名实体识别(NER)任务的研究, 可为后续构建中学数学学科知识图谱及自动问答等任务奠定基础, 进而满足中学生个性化知识获取的需求, 助力新型智能化教育体系的构建。目前中学数学知识语义复杂, 其NER和研究数据较少, 且在当前主流模型特征提取任务中容易忽略掉部分局部特征。为解决该领域的实体识别困难问题, 以自建的中学数学知识语料库为研究对象, 提出一种融合多头注意力的多维度特征NER方法。该方法首先采用BERT进行文本表征预训练得到词向量, 接着引入对抗训练对每个嵌入向量进行扰动, 将得到的对抗样本和嵌入向量传送到多维度特征提取层进行特征提取, 再将输出的特征进行拼接, 通过多头注意力机制进行动态融合, 最终经过条件随机场(CRF)修正后输出。实验结果表明, 该方法在自建Educ数据集上的识别准确率、召回率以及F1值分别达到96.68%、97.71%和97.19%, 证明了该方法在中学数学知识实体识别上的有效性。
针对蜣螂优化算法(DBO)搜索精度较差、全局搜索能力不足、容易陷入局部最优等问题, 提出一种多策略改进的蜣螂优化算法。选用混沌反向学习策略初始化蜣螂种群, 使得蜣螂个体在解空间内分布均匀, 提升种群多样性; 引入带非线性权重的黄金正弦策略改进滚球行为, 协调算法的全局搜索与局部挖掘能力; 借鉴麻雀搜索算法的加入者位置更新策略改进觅食行为, 促使种群向最优位置靠近, 提高算法收敛速度与收敛精度; 以分段函数形式改进偷窃行为, 利于种群在迭代前期对全局充分探索, 避免算法过早收敛; 采用非线性权重的柯西-高斯变异策略对当前最优位置进行随机扰动, 引导算法跳出局部最优位置。将所提算法与5种优化算法在23个基准函数、12个CEC2022测试函数及2个工程优化问题上进行实验对比, 结果表明, 所提算法至少在21个基准函数、10个CEC2022测试函数及2个工程优化问题上的性能指标优于其他算法, 且排名第1, 相比于原始蜣螂优化算法, 在收敛精度、收敛速度、全局搜索能力以及稳定性上都有较大提升。
针对谓语中心词识别模型中存在缺失跨度长度信息和多尺度跨度关联信息等问题, 提出一种融合多尺度跨度特征的汉语谓语中心词识别模型。首先, 使用ChineseBERT预训练语言模型和双向长短期记忆(BiLSTM)网络提取文本中包含上下文信息的字符向量序列; 其次, 利用线性神经网络对字符向量进行初步识别, 形成跨度遮蔽矩阵; 然后, 将字符向量序列二维化表示为跨度信息矩阵, 使用多尺度卷积神经网络(MSCNN)对跨度信息矩阵进行运算, 提取跨度的多尺度关联信息; 最后, 采用特征嵌入神经网络嵌入跨度的长度信息, 丰富跨度的特征向量以识别谓语中心词。实验结果表明, 该模型能够有效融合跨度的多尺度关联信息和长度信息, 提升谓语中心词识别的性能, 相比于同类模型中性能最优的谓语中心词识别模型的F1值提升了0.43个百分点。
命名实体识别是自然语言处理领域的重要基础任务, 为关系抽取、构建知识图谱等众多下游任务提供有价值的数据支撑。针对中文命名实体识别存在分词错误、实体边界模糊和上下文依赖的难点, 以及现有方法不能充分利用词汇信息和有效提取文本内部特征等问题, 提出一种基于词汇融合和依存关系的中文命名实体识别模型。首先, 获取输入文本中每个字符的自匹配词生成词汇特征向量, 并根据字符在它的自匹配词上的位置得到词边界信息, 利用双仿射注意力机制将字符向量与词汇特征向量进行融合, 将词汇信息和词边界信息融入模型的编码过程, 从而使模型获得良好的实体识别能力; 然后, 根据依存句法建立输入文本的依存图结构, 利用图注意力网络(GAT)捕获输入文本内部依存关系特征, 增强文本内部的语义依赖信息, 同时有利于区分实体边界; 最后, 使用条件随机场(CRF)计算文本的标签。实验结果表明, 该模型在CCKS2017、OntoNote4.0和MSRA数据集上分别获得了92.10%、80.76%和95.66%的F1值, 优于对比模型。
协同过滤推荐通常面临用户-项目交互数据稀疏的挑战, 社交推荐引入用户社交关系来缓解数据稀疏性问题。多数基于图神经网络(GNN)的社交推荐系统在消息传递过程中无法根据用户偏好聚合高阶邻居信息, 造成嵌入表示过平滑和噪声问题。针对上述问题, 提出一种基于偏好感知的去噪图卷积网络的社交推荐模型PD-GCN。使用无监督学习将具有相似偏好的用户分配到用户-项目交互子图和社交子图, 在子图中进行更高阶的图卷积运算, 缓解了现有模型的过平滑问题。从全局和局部的角度出发, 通过考虑相同偏好用户节点的特征相似度和邻域节点偏好分布多样性识别并去除噪声节点, 增强模型对用户-项目交互和社交关系噪声的鲁棒性。在LastFM、Ciao、Yelp 3个公共数据集上的实验结果表明, PD-GCN模型在召回率和归一化折损累计增益两个指标上相较于其他主流模型表现出更优的性能, 验证了PD-GCN模型的有效性。
文档级关系抽取是指在非结构性文本中抽取实体对之间的关系。针对当前文档级关系抽取方法未能充分利用文档语义信息且难以处理文档的噪声干扰问题, 提出一种基于双粒度文档图的关系抽取模型, 采用一种新型的构图思路以及降噪方法, 分别在句间和句内两个层面进行设计。首先, 在句间层面使用修辞语篇关系实体提及关系构建修辞语篇关系图RST-graph, 采用异步降噪方式生成粗粒度文档图(CGD-graph), 缓解了因实体对的句间关系路径长于句内关系路径造成的结构性误剪枝问题。然后, 在句内层面采用依存句法关系对文档中的句子进行解析, 构造依存句法树(SDT), 增强句内语义信息。最后, 将SDT和CGD-graph中存在的公共锚点相连接, 构造细粒度文档图(FGD-graph)。实验结果表明, 与去噪图推理(DGI)模型相比, 该模型的lgn F1值和F1值分别提升了0.40和0.51个百分点, 并且在实体对的多标签关系上随着标签数量的增多抽取效果提升较为显著。
为了高效且快速地识别自然环境中的鸟鸣声, 提出一种基于轻量级逐点深度的多感受野注意力残差网络(LPDMR-NET)模型。首先, 通过Mel滤波器生成Mel频谱图。接着, 采用basicblock和downblock连接生成两层残差网络DBNet, 堆叠DBNet作为鸟鸣声识别的主干网络, 以提高训练速度。然后, 利用逐点深度卷积网络(PDNet)提取频谱图特征信息, 替代主干网络下采样模块, 将两个残差模块的basicblock中的3×3卷积替换为分离分支块(DBB), 引入不同的感受野, 在复杂多分支结构下显著提高网络的识别性能。最后, 在两个残差模块间嵌入轻量级高效置换注意力(SA)模块用于传递两层残差模块间的有效信息, 增强频谱图波纹特征, 进一步提高网络识别性能。在自建的30类鸟鸣声数据集Birdselfdata上的实验结果表明, 该模型的识别准确率为96.82%、F1值为96.73%, 在识别效率和准确性方面超越了对比模型。
现有人脸伪造检测方法往往在已知伪造类型上表现良好, 但面对未知数据时检测性能有所下降, 模型易受到过拟合的影响, 检测泛化性不足。针对此问题, 提出一种基于帧内-帧间自融合的双流泛化人脸伪造检测方法, 从数据增强和检测器改进2个方面提高检测泛化性。设计帧内-帧间自融合模块, 分别利用同帧人脸、帧间人脸进行数据增强: 帧内自融合子模块利用同帧人脸生成训练数据, 从而避免人脸图像身份信息干扰; 帧间自融合子模块利用伪造视频的帧间不一致性, 进一步构造多样性丰富、逼真的训练数据集, 从而有效防止模型的过拟合, 确保检测模型的泛化能力。此外, 设计基于通道注意力机制的双流特征融合网络, 在网络的浅层提取RGB特征、高频特征并进行融合来挖掘伪造信息, 在提升模型性能的同时缓解网络的参数增长。将模型在4个数据集上与9种主流检测方法进行对比实验, 结果表明: 在跨数据集实验中, 所提方法较次优方法AUC均值提高1.52个百分点, EER均值降低1.5个百分点; 在跨伪造方法实验中, 所提方法在4种伪造方法子数据集上均取得最优或次优效果。实验结果验证了该方法优秀的泛化能力。
在智能合约安全问题中, 利用重入漏洞是最具破坏性的攻击之一。针对目前相关检测工作漏报率和误报率高的问题, 提出一种基于符号执行的重入漏洞检测方法。该方法基于静态符号执行技术, 在模拟以太坊虚拟机指令执行过程中, 通过将可能被外部合约多次调用的公有函数控制流子图连接到被调用合约的控制流图, 构建出能够模拟重入攻击的完全控制流图, 再结合合约状态一致性检测, 实现同函数、跨函数和跨合约等3种不同类型的重入漏洞检测。基于该方法设计的检测工具Lucifer与相关工作Oyente、Securify、DefectChecker、Sailfish在已知标签数据集、漏洞注入数据集、自定义数据集和以太坊智能合约真实数据集上进行对比, 实验结果表明, Lucifer在误报率、漏报率和容错性上均分别获得第一或者第二的成绩, 部分检测情形准确率达到100%, 由综合评价指标可以看出, Lucifer的检测率优于现有检测工具, 在对于部分特定重入合约的情形尤其在与互斥锁和函数修饰符有关的重入漏洞的识别中有较好的识别能力, 在检测时长上, Lucifer的检测时间较久但也在可控范围, 并未出现检测超时。
针对车联网中车辆的隐私泄露和恶意车辆提供虚假信息的问题, 提出一种适用于车联网环境的多接收者匿名签密方案。该方案使车辆能够向一组路侧单元(RSU)发送秘密信息。利用可信中心生成的长期伪身份和自己生成的短期伪身份保证车辆的强匿名性来提供有条件的隐私, 并避免造成发送者车辆的身份泄露。在签密的过程中将指定的一组接收者RSU的身份信息采用模多项式计算后添加到密文当中实现RSU之间的匿名。此外, 如果发现车辆有篡改和拦截消息等恶意行为, 它会被可信中心跟踪并撤销身份。在椭圆曲线离散对数问题和计算性Diffie-Hellman的基础上证明了所提方案在ROM下满足消息保密性、不可伪造性、匿名性、可撤销性等安全要求, 安全性证明和效率分析表明该方案具有较高的安全性。实验结果表明, 与对比方案相比, 该方案在车辆对消息进行签密的阶段中所用时间减少了36.4%~54.7%, 总时间减少了47.3%~56.7%, 同时, 该方案在解签密阶段是恒定数值, 具有较高的计算效率和实用性。
区别于常规的分布式拒绝服务攻击, 利用僵尸网络发动的Crossfire攻击具有低速率不可区分的特性, 这导致常规入侵检测系统难以防御此类攻击。针对该问题, 设计一种检测防御Crossfire攻击的方法。该方法基于软件定义网络(SDN), 首先利用网络瓶颈选择算法筛选出易受攻击的网络瓶颈节点与链路, 在此基础上部署虚拟节点预防Crossfire攻击, 虚拟节点应答可疑探测流, 扰乱攻击者的攻击视图从而隐藏物理拓扑的网络瓶颈, 并基于随机森林和双阈值自编码器检测僵尸网络, 最后通过慢开始防御策略和局部快速重路由方法达到防御Crossfire攻击的目的。实验在SDN环境下进行, 虚拟节点的部署能够使得瓶颈节点指标明显降低, 构建的僵尸网络检测模型在精度、召回率、F1值等方面相较于传统随机森林分类模型提高近5个百分点, 防御方法能够在10 s内达到缓解Crossfire攻击的效果。实验结果表明, 相对其他方法, 所提方法能有效检测并缓解此类攻击, 且在此过程中基本不会影响到合法流量在物理拓扑中的正常转发。
基于深度学习的指纹室内定位系统因其能够有效抽取接收信号强度(RSS)指纹数据的深层特征而大幅提高了室内定位性能, 但该类方法需要大量多样化的RSS指纹数据训练模型, 并且目前对其安全漏洞也缺乏充分的研究, 这些安全漏洞源于无线Wi-Fi媒体的开放性和分类器的固有缺陷(如易遭受对抗性攻击等)。为此, 对基于深度学习的RSS指纹室内定位系统的对抗性攻击进行研究, 提出一种基于Wi-Fi指纹室内定位的对抗样本攻击框架, 并利用该框架研究对抗攻击对基于深度学习的RSS指纹室内定位模型性能的影响。该框架包含离线训练和在线定位两个阶段。在离线训练阶段, 设计适用于增广Wi-Fi RSS指纹数据的条件生成对抗网络(CGAN)来生成大量多样化的RSS指纹数据训练高鲁棒的室内定位深度学习模型; 在线定位阶段, 构造最强的一阶攻击策略来生成针对Wi-Fi RSS指纹室内定位系统的有效RSS对抗样本, 研究对抗攻击对不同室内定位深度学习模型性能的影响。实验结果显示: 在公开UJIIndoorLoc数据集上, 由所提框架生成的RSS指纹对抗样本对卷积神经网络(CNN)、深度神经网络(DNN)、多层感知机(MLP)、pixeldp_CNN指纹室内定位模型的攻击成功率分别达到94.1%、63.75%、43.45%、72.5%;对由CGAN增广数据训练的上述4种指纹室内定位模型的攻击成功率分别达到84.95%、44.8%、15.7%、11.5%。由此表明, 现有的基于深度学习的指纹室内定位模型易遭受对抗样本攻击的影响, 由真实数据和增广数据混合训练的室内定位模型在面临对抗样本攻击时具有更好的鲁棒性。
随着“大云物移智链”等数字化技术在能源电力领域迅猛发展, 大量新兴技术快速地在电网业务系统中进行创新应用, 导致用电信息采集系统中数据交互更加频繁, 从而出现数据经过流转后发生缺失、损坏等问题, 进而导致业务数据公信力下降, 且流转过程不清晰不透明, 难以进行数据追溯溯源。针对用电信息采集系统数据可信度低、溯源难等问题, 分析了区块链技术在用电信息采集系统应用情况, 设计了区块链-用电信息采集系统三元结构模型, 提出了一种采用区块链-用电信息采集系统三元结构的基于改进模型的实用型哈希算法的结构防篡改加密算法。仿真结果表明, 区块链-用电信息采集系统三元结构的防篡改加密算法可提升数据质量进而提升业务数据公信力, 同时通过该结构增强了数据的溯源能力, 极大提升了用电信息采集系统数据在交互和使用过程的安全性。
随着安全性攸关系统的智能化、自动化发展, 系统规模和复杂度急剧增加, 传统基于链式/树式安全性因果模型的安全性分析方法在非线性致危因素、非失效致危因素分析方面存在很大的局限性, 现代基于系统理论的安全性因果模型虽然在航空航天、核电能源等多个领域得到有效性验证, 但目前该类方法尚缺乏严格统一的分析步骤和自动化分析工具。为此, 提出复杂系统控制过程的建模工具——控制逻辑Petri网(CLPN), 对控制过程中的活动及其之间的交互影响关系进行形式化描述, 并对系统CLPN模型的可达图进行失效扩展, 在不影响安全性分析的前提下尽量避免因失效事件建模造成的分析模型规模激增。基于CLPN模型, 以系统理论事故模型与过程(STAMP)系统安全性因果模型危险因素分类为标准, 在可达性分析的基础上对作为系统致危因素的危险控制活动进行探索, 实现系统安全性的自动化分析。最后, 通过实例分析和方法对比, 对所提方法的可用性和有效性进行验证。实验结果表明, 基于CLPN的系统安全性分析方法在结果完备性和分析效率方面具有较大的优势。
边缘计算(EC)在靠近用户的网络边缘部署边缘服务器(ES), 并将服务放置在ES上, 从而可以满足用户的服务需求。独立研究ES部署和服务放置问题的成果已有很多, 但两者存在高度耦合关系。考虑到EC系统的收益, 有必要提供付费服务, 使得EC系统处理用户服务请求时会获得相应收入。同时, EC系统处理用户服务请求时会产生时延和能耗成本, 为了最大化EC系统的收益, 在用户服务请求和服务价格不同的约束下, 需要合适的服务放置方案来提高EC系统的收益。为此, 在ES与基站之间的位置关系、ES部署和服务放置之间的耦合关系、服务副本数和服务价格等约束下, 提出一种包括改进的k-means算法和多智能体强化学习算法的两步方法, 使EC系统的收益最大化。首先, 构建一个联合ES部署和服务放置模型, 其中ES部署明确考虑了基站之间的位置关系, 服务放置明确考虑了ES部署的位置, 以及不同的服务请求和价格; 然后, 基于基站的位置关系和基站的服务请求负载, 通过带约束的k-means算法, 在不同约束条件下分别确定最佳的ES部署位置以及ES的协作域; 最后, 以最大化EC系统收益为目标, 通过多智能体强化学习算法在ES上放置服务。实验结果表明, 与对比方法相比, 所提方法能够提高收益7%~23%。
针对频谱资源干扰管理的智能化需求, 提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法, 旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化, 帮助次级用户(SU)在受到干扰影响时做出最优的决策, 从而改善通信质量和系统性能。在该算法中, 当SU遭受干扰影响通信质量时, 智能体通过学习和优化, 使SU能够根据当前的位置信息、发射功率、接收功率以及干扰程度选择最低干扰程度的行动, 并执行该行动后获得的奖励。智能体通过尝试不同减少干扰的行动, 并根据奖励的反馈调整策略, 达到最大化定义干扰程度指标和信号质量指标的奖励函数的目的, 从而最大程度地减少干扰对通信质量的影响。实验结果表明, 与传统k-means算法以及深度递归Q网络(DRQN)和深度Q网络(DQN)优化算法相比, 基于A3C的干扰消除算法具有更短的收敛时间、更高的执行效率以及更高的系统吞吐量, 较3种基准方法在吞吐量性能上至少提高7%, 能够有效地减少干扰对通信质量的不利影响。
面对信息化网络环境中大量时延敏感型和计算密集型任务的计算需求, 移动边缘计算(MEC)及其计算卸载技术提供了一种行之有效的解决方案。针对资源受限移动边缘系统的任务卸载策略, 设计一种成本最优化算法。首先, 结合系统的基本数据构建多用户多服务器网络场景, 并根据时延、能耗等待优化指标建立一种包含惩罚项的最小化成本优化模型; 然后, 提出一种改进人工蜂鸟算法(IAHA), 通过对原算法的寻优方式与算法结构进行适应性地调整和优化, 并引入一种紧急避险策略, 实现系统模型与算法映射的高度契合以及对模型问题快速精确求解, 进而得到系统的最优卸载策略; 最后, 应用策略进行部署以降低系统的成本支出和提升用户的服务体验。仿真实验结果表明, 所提改进算法能够有效降低系统成本, 并且在针对高维复杂模型求解时具有更突出的收敛性能和寻优精度, 在特定实验条件下, 所提改进算法相较于部分经典的元启发式算法和典型的新型群智能算法, 系统成本减少20.79%~65.39%, 所提任务卸载算法相对于本地计算策略的平均系统成本能够降低66.98%。
为缩短未知环境下移动边缘计算(MEC)系统服务用户所需的平均时延, 提高MEC系统服务质量(QoS), 设计了一种基于多无人机(UAV)的MEC系统, 并针对UAV数量大量增加、因用户平均时延减少呈现边际效应递减所带来的资源浪费问题, 设计一种可变UAV数量的节时部署算法。MEC系统首先将UAV部署问题分解为一个双层嵌套问题, 外层为最大覆盖问题(MCLP), 内层为基于广义指派问题(GAP)的任务卸载问题, 并将人为设置的惩罚项加入待优化目标中, 在优化过程中使MEC系统UAV数量和用户所需平均时延之间达到平衡。部署算法设计了一种混合算法来针对嵌套问题进行求解, 外层使用基于差分进化-蛇优化算法(DE-SO)的联合优化算法来解决UAV的部署覆盖问题, 内层使用贪心算法来解决任务卸载问题。仿真实验结果表明, 在多种UE分布环境下, 相较于CS-G、SAO-G等算法, 该算法在适应度、覆盖率等性能上取得了最优表现, 相比寻优精度最高的对比算法, DE-SO-G在寻优精度上平均提升5.67%。
水下环境复杂, 遮挡目标信息缺失严重而难以提取到足够的特征信息, 导致水下遮挡目标易被漏检。为解决该问题, 提出一种基于对抗注意力机制的水下目标检测算法。以Faster R-CNN算法为框架, 提出基于空间注意力机制的对抗生成遮挡样本网络(AOGN)。AOGN与Faster R-CNN网络相互竞争, 通过三阶段训练过程, 在不增加推理负担的情况下学习生成检测网络难以正确区分的样本, 提高Faster R-CNN网络对水下遮挡目标的检测精度。使用Focal loss增加困难样本的损失比重, 解决水下数据集难易样本不平衡的问题。在此基础上, 为获得更丰富的水下目标特征信息, 使用SE-ResNet50代替VGG16作为骨干网络, 通过残差网络和SE模块的结合获得更有效、更丰富的水下目标信息, 提高对检测目标的特征提取能力, 同时加入多条ROIpooling支路实现多尺度特征融合, 增加特征的丰富性。实验结果表明, 该算法在URPC数据集和水下垃圾数据集上分别取得了73.76%和86.85%的平均精度均值(mAP), 遮挡目标漏检率分别达到2%和7%, 相较于其他检测算法能够有效提升检测性能。
交叉熵损失是分类任务中常见的损失函数, 然而现有深度分类方法往往使用单模型的交叉熵设计, 存在分类泛化能力低、鲁棒性差等问题。受到多视图表征学习的启发, 提出一种深度集成的交叉熵损失方法, 以提高模型的泛化能力和鲁棒性。通过构建多样化子网络, 学习单一图像数据下多个深度视角的不同表征, 最终通过集成化交叉熵设计, 将图像数据的多视角表征进行集成分类。该方法可以充分利用多视角深度网络的多样化表征进行图像的鲁棒分类, 即将多个视图的交叉熵损失统一到整体的集成空间中进行分类, 从而提升传统单一模型交叉熵设计下的图像分类性能。在SVHN、CIFAR等图像数据集上的实验结果表明, 相比于现有的MEAL、CEN等图像分类方法, 该方法在识别准确率上获得了明显提升。
在计算机视觉领域, 神经辐射场(NeRF)是以空间坐标或者时间、相机位姿等其他维度作为输入, 通过多层感知机(MLP)网络模拟目标函数, 生成颜色、深度等目标标量的过程。NeRF的应用包括对三维场景进行高质量的重建, 而其在处理不同分辨率的场景时会产生过度模糊或者伪影的渲染效果, 且存在训练耗时较长的问题。为了解决上述问题, 提出基于锥形追踪和网络分解的NeRF三维重建方法。使用锥形追踪的方法, 为每个像素投射一个圆锥体, 并将投射的圆锥体切割成一系列的圆锥台, 沿着该圆锥体进行特征化, 通过高效渲染抗锯齿的圆锥台来降低模糊或者伪影效果。为了缩短训练时间, 使用网络分解的方法, 将原始NeRF接收5维数据的神经网络分解为两个网络, 有效地缩短训练时间。实验结果表明, 在NeRF_Synthetic、LLFF和Multiresolution数据集中, 相比于NeRF、F2-NeRF等方法, 所提方法的峰值信噪比(PSNR)提升了14.4%~24.6%, 能够重建出更丰富的细节特征, 视觉效果更好, 且训练时间大幅降低。
在工业质检过程中, 冲压件缺陷图像分割作为缺陷检测的重要环节, 直接影响缺陷检测效果。而传统的模糊C均值(FCM)聚类算法未考虑到空间邻域信息, 对于噪声干扰较为敏感, 导致分割精度较差, 且其整体易受初始值的影响, 造成收敛速度变慢。针对上述问题, 提出一种改进的FCM算法。采用内核诱导距离中的简单两项代替传统的欧氏距离, 将原有的空间像素映射到高维特征空间, 提高线性可分概率和计算速度; 利用图像像素之间的空间相关性, 通过引入改进的马尔可夫随机场对FCM目标函数进行修正, 提高算法的抗噪能力以及分割精度; 采用秃鹰搜索(BES)算法确定FCM的初始聚类中心, 提高算法的收敛速度, 同时避免算法陷入局部极值的情况。为验证改进FCM算法的性能, 选取划分熵、划分系数、Xie_Beni系数以及迭代次数作为评价指标, 并与近年来先进的图像分割算法进行对比。实验结果表明, 改进FCM算法具有更好的抗噪能力, 能得到更好的缺陷分割效果, 对工业生产中的冲压件缺陷检测有一定的应用价值。
在低光环境下的检测任务中, 由于低亮度、低对比度以及噪声等不利因素影响, 会存在对目标的漏检、错检等现象。针对此问题, 提出基于图像自适应增强的低照度目标检测算法。将传统图像处理方法与深度学习相结合, 设计图像自适应增强网络, 使用多个可调滤波器通过级联的方式进行结合, 对输入的低光图像进行逐步增强, 各滤波器的调节参数由卷积神经网络根据输入图像的全局信息进行预测。将图像自适应增强网络与YOLOv5目标检测网络相结合进行端到端的联合训练, 使图像增强效果更有利于目标检测。由于在低光目标检测过程中易出现漏检现象, 对通道注意力机制SE-Net进行改进, 设计特征增强网络, 并嵌入到YOLOv5网络中Neck部分的末端, 以减少网络特征融合过程中造成潜在目标特征的信息损失。实验结果表明, 所提算法在真实低光数据集ExDark上的检测精度达到了77.3%, 相较于原始YOLOv5目标检测网络提高了2.1个百分点, 检测速度达到79帧/s, 能够实现实时检测的效果。
软件预取作为提升数据存取性能的一种重要技术, 得到了广泛的关注和应用。在软件预取的研究中, 往往需要使用访存轨迹分析结合采样算法来筛选出存在缓存未命中的访存指令作为预取目标。然而, 传统的迸发采样算法无法区分不同类型的轨迹信息, 且容易遗漏访问次数较少的指令。针对以上问题, 提出一种基于单遍聚类和分层采样的访存轨迹采样算法。首先提取访存轨迹信息特征; 然后利用单遍聚类方法并依据特征相似程度进行访存信息聚类; 最后以聚类为基础进行分层采样, 根据缓存未命中率对轨迹中不同的部分合理分配注意力来调整采样比, 有效缓解了规模较小类别的采样遗漏情况。实验结果显示, 在选择的8个测试程序上, 相比于传统迸发采样算法, 所提算法可平均多覆盖15.70%的缓存未命中指令, 基于所提算法的预取平均可额外减少20.76%的缓存未命中数和3.51%的程序运行时间。
自动化集装箱码头的装卸作业中经常发生集装箱与卡车同时被吊起的安全事故, 导致人员伤亡及货品、车辆的损坏。为解决该问题, 提出一种基于电机数据图像化处理的多时序变量间接卡车误吊起检测方法(MEIN)。该方法通过神经网络分析异步电机在吊起集装箱和卡车的过程中产生的电流和电压异常, 从而判断是否发生了误吊起事故。采集吊机的三相电流和电压数据, 并基于物理公式进行特征工程计算出多个相关时序物理量, 采用滑动窗口、SMOTE-Tomek综合采样的方式扩大样本总数并平衡类别数量, 最后将多时序变量转换为图像的形式以EfficientNet进行分类。实验结果表明, 该方法能在复杂的环境下(例如雨雾天气或轮胎被遮挡)保持稳定的检测性能, 各测试地区的AUC均在0.997以上。相较于传统的基于激光雷达和计算机视觉的检测方法, MEIN方法具有成本低、精度高、计算量小并且抗环境干扰能力强等优点。该方法已在武汉、青岛、钦州、梅山等多地部署, 为提高自动化集装箱码头的作业安全提供一种有效的解决方案。
交通标志检测在自动驾驶领域具有重要的应用价值, 及时准确地检测交通目标对提高驾驶安全性和预防交通事故具有重要意义。针对交通标志尺寸小, 易受遮挡, 在复杂环境下容易出现漏检、错检等问题, 在YOLOv8的结构基础上提出一种结合轻量化与多尺度融合的交通标志检测网络架构M-YOLO, 构建M-YOLOs模型来应对高精度需求的检测任务, 并调整网络深度得到更轻量化的M-YOLOn模型来解决不同环境下的检测需求。首先针对交通标志目标尺寸小、图像特征流失的问题, 通过增加小目标检测层, 保留更多的特征信息, 提高网络对于小目标的特征学习能力。提出高效多尺度特征金字塔融合网络MPANet, 将浅层特征图进行降维与跳跃连接, 从而融合更多的图像特征信息。然后提出融合稀疏注意力和空间注意力的BRSA注意力模块, 有效提取全局和局部的位置信息, 减少复杂背景下对于关键信息的干扰。最后设计两种轻量高效的BBot模块和C2fGhost模块, 以提高模型运算速度并减少参数量。实验结果表明, M-YOLO相较于YOLOv8, 参数量降低约1/3。在TT100K数据集和GTSDB数据集上, M-YOLOs检测精度分别提升了9.7和2.1个百分点, M-YOLOn检测精度分别提升了14.5和2.6个百分点, 在轻量化的同时具备更高的检测效果。M-YOLO架构解决了浅层特征图在特征提取过程中信息丢失的问题, 并显著降低模型特征提取过程中冗余的计算开销, 在实景采集的数据集上证实效果有效, 表明在交通标志检测任务中具有应用价值。
随着多式联运和绿色港口的发展, 提高海铁联运效率和降低能源消耗成为码头亟需解决的问题。针对集装箱码头铁路作业区与码头作业区共堆场布局下设备利用率低与作业能耗高的问题, 构建混合装卸作业下轨道吊、自动导向车(AGV)及场桥的协同调度优化模型, 旨在实现作业完工时间最短、轨道吊和AGV的作业能耗最优, 以及提高轨道吊协同作业的利用率。该模型综合考虑轨道吊间相互干涉、AGV伴侣容量限制以及AGV和轨道吊装卸过程中的重载、空载与等待状态下的不同能耗等约束, 并针对轨道吊的干涉约束引入轨道吊任务分配策略。同时, 采用改进的混合灰狼遗传算法对模型进行求解, 具体改进策略包括引入灰狼算法位置更新策略优化遗传算法的交叉方式以提高最优解搜索效率, 以及在遗传算法的选择步骤前引入基于奖励机制的评估器增强算法的局部搜索能力。实验结果表明, 与轨道吊作业范围已知相比, 考虑轨道吊任务分配使轨道吊的平均利用率提升了3%~8%。与自适应混沌遗传算法、遗传算法相比, 改进混合灰狼遗传算法能在较短的作业完工时间内节约更多的能耗。
在推荐系统中, 现有的点击率预估模型通常采用用户近期点击过的行为序列作为模型的输入, 这将使模型难以得到全面的用户兴趣表示, 导致模型无法获得最优的精度。为了解决这个问题, 引入一个基于用户多类型反馈行为序列的点击率预估模型(UMFB)。该模型中多种类型的用户行为序列包括隐式反馈序列和显式反馈序列, 并且能够对不同的用户兴趣偏好进行建模。鉴于隐式反馈序列中包含大量的噪声, 结合基于傅里叶变换的兴趣去噪层来减轻干扰。此外, 为了解决显式反馈序列数据的稀疏性问题, 部署基于对比学习的兴趣增强层来提高建模效果。最后采用个性化兴趣融合层对用户的偏好进行建模。为了验证UMFB模型的有效性, 在短视频推荐领域的KuaiRand-Pure和KuaiRand-1K数据集上进行了对比实验, 结果表明, 与DMT基线模型相比, UMFB模型的AUC分别提高了1.07和0.91个百分点。
电动汽车可以在聚合商的集中式管理下形成规模化灵活可调资源, 从而在能源市场上套利并为电网提供辅助服务。为此, 提出一种基于混合动作强化学习的电动汽车聚合商决策优化算法。该算法利用连续动作优化市场投标决策, 根据离散动作控制不同功率分解策略的动态切换, 从而实现市场投标与功率分解决策的联合优化。此外, 还提出了一种考虑单位灵活性价值的电动汽车聚合灵活性建模方法, 在最大化日总灵活性价值的同时确保每台汽车的充电需求得到满足。仿真实验结果表明, 动态策略切换能够充分利用优先级分解策略和比例分解策略在延缓电池衰减、维持电池双向调节灵活性方面的各自优势, 与仅考虑投标决策优化的算法相比, 所提算法可以进一步提升电动汽车充电站的运行经济性。