区块链已逐渐发展成支撑数字经济的重要基础设施, 但其匿名性、跨链互操作性、多方参与等特征, 导致诈骗、洗钱与攻击等安全事件频发, 严重威胁生态系统的稳定与合规。尽管现有分析工具与方法在区块链服务安全领域取得了一定进展, 但仍普遍存在泛化能力不足、推理能力有限、难以适应复杂业务逻辑演化等问题。与此同时, 生成式大语言模型(LLM)的快速发展正在深刻重塑服务计算范式, 其在自然语言理解、知识推理与多模态融合等方面的优势, 为区块链服务安全研究提供了新的思路与技术路径。系统梳理LLM在事前智能合约审计、事中异常行为检测、事后多链行为关联任务中的应用进展, 归纳其优势与局限, 总结LLM赋能区块链服务安全的典型实践。最后, 展望LLM赋能区块链服务安全面临的开放科学问题与未来研究方向, 为构建可信、可解释、高效的区块链服务计算与治理体系提供参考。
基于大语言模型(LLM)的多智能体系统(MAS)虽在处理复杂任务方面展现出巨大潜力, 但其分布式特性与交互不确定性易引发多样化异常, 威胁系统可靠性。为系统化识别并分类此种异常, 进行全面综述。研究选取7个代表性MAS及相应数据集, 收集13 418段运行轨迹, 采用LLM初步分析与专家人工校验相结合的方法进行数据分析。构建一个涵盖模型理解感知异常、智能体交互异常、任务执行异常和外部环境异常4个层级的细粒度异常分类框架, 并结合典型案例揭示各类异常产生的内在逻辑与外部诱因。统计分析显示: 模型理解感知异常占比最高, 其中"上下文幻觉"和"任务指令误解"是主要问题; 智能体交互异常占16.8%, "信息隐瞒"是主因; 任务执行异常占27.1%, 主要表现为"决策重复出错"; 外部环境异常占18.3%, 以"记忆冲突"为主。此外, 模型理解感知异常作为根源性诱因, 引发其他层级的异常, 凸显了提升模型基础能力的重要性。此分类和根源分析旨在为构建高可靠的基于LLM的MAS提供理论支撑与实践参考。
后训练量化(PTQ)是一种高效的模型压缩方法, 它无需重新训练模型, 只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时能够最大限度地保留原始模型的推理精度, 因而受到学术界与工业界的广泛关注。从PTQ的量化步骤、方法分类、工具生态、应用进展4个维度, 系统总结PTQ的研究进展。首先, 构建了量化流程框架, 涵盖动态范围统计、量化参数计算、权重与激活量化、误差优化和模型生成等步骤; 其次, 提出一个完整的量化方法分类体系, 从量化粒度、位宽、校准方法到结构导向量化; 再次, 分析了支持PTQ规模化应用的工具生态, 探讨了其在硬件适配和工程部署中的应用价值; 最后, 总结了PTQ方法的融合与应用进展, 并指出PTQ方法在实践中面临的挑战, 尤其是跨模态一致性、极低比特语义崩塌与硬件适配等难题。这些实践挑战的总结不仅揭示了当前技术的局限性, 也为未来研究提供了重要方向。本综述为学术界与工业界提供了PTQ方法的参考框架, 助力推动人工智能在资源受限场景中的广泛应用。
随着互联网、云计算和人工智能的不断发展, 服务推荐作为服务计算中的关键技术, 在帮助用户快速精准地发现目标服务、提升资源利用率和改善用户体验方面发挥着越来越重要的作用。针对服务推荐的研究问题与发展趋势, 对现有研究成果进行了系统梳理和全面概述。首先, 总结了服务推荐的研究现状, 包括基于传统方法的服务推荐、基于上下文感知的服务推荐以及基于神经网络的服务推荐, 系统分析了各类方法的基本原理、代表性工作及其优缺点, 并对比了它们在不同应用场景中的适用性与表现。其次, 深入探讨了服务推荐在实际应用中所面临的核心挑战, 涵盖数据稀疏与冷启动、服务质量(QoS)数据不完整与含噪声、服务动态性与上下文变化、推荐结果的可解释性, 以及系统的实时性、可扩展性、隐私与安全等问题。最后, 对服务推荐技术进行回顾与总结, 概述了当前研究中的局限性与主要问题, 并结合大数据、知识图谱(KG)、深度学习、大语言模型(LLM)与强化学习等新兴技术的发展, 探讨了服务推荐未来的发展方向与研究前景。本研究有助于加深对服务推荐领域的整体理解, 并为后续研究和应用实践提供参考。
Web3作为"去中心化的下一代互联网"范式, 依托区块链技术, 成为数智服务生态中极具潜力的新兴领域。然而, Web3钓鱼网站对生态健康构成了严重威胁, 钓鱼者精心设计域名作为主要诱饵, 诱导用户访问并进行高风险操作以窃取数字资产。目前, Web3反钓鱼工作主要集中在钓鱼账户检测、钓鱼交易检测和钓鱼团伙挖掘, 而现有钓鱼网站域名检测工作主要面向传统钓鱼网站, 存在适应性不足、缺乏系统性分析等局限性。为此, 提出一种针对Web3钓鱼网站域名的检测方法WPWHunter, 对检测到的真实Web3钓鱼网站进行多维度分析, 并探究大语言模型(LLM)在网页分析方面的应用潜力。WPWHunter检测算法对Web3钓鱼网站域名中的诱导词、视觉欺骗、项目名模仿3种特征进行检测, 实验结果表明, WPWHunter能够有效检测出可疑的Web3钓鱼域名, 在测试集上G-means指标达到0.769, 相比表现最佳的基线方法提升了0.048。此外, 作为补充的探索实验, 使用3个通用LLM对WPWHunter未能成功检测的Web3钓鱼网页内容进行分析, 总结LLM判定Web3钓鱼网站时的依据。
意图驱动的人工智能系统在面对复杂多变的环境时, 须具备对意图(Purpose)的自适应感知、动态调整与多层反馈能力。传统人工智能模型普遍缺乏统一的意图生命周期建模机制, 导致系统行为难以追踪、调控与优化, 进而影响其可解释性与长期效能。基于数据-信息-知识-智慧-意图(DIKWP)五层语义空间模型, 构建一套面向认知演化路径的意图生命周期管理机制。该机制以语义传导为核心, 涵盖数据层的动态校验、信息层的迁移响应、知识层的逻辑重构、智慧层的价值演化、意图层的目标闭环与冲突调节5个阶段, 形成多层次、多目标、多反馈路径的语义治理体系。通过引入多层图谱建模与认知空间区分(如概念空间与语义空间), 实现意图生成、更新与调优的结构化与可视化建模。进一步结合人工意识系统的"体验-叙事"双循环结构, 强化系统在多轮互动中的意图稳定性与环境适应能力。在智能家居与智慧城市典型应用场景中对该机制进行理论推演与语义验证, 结果表明, 该机制具备良好的通用性、可扩展性与鲁棒性, 为主权人工智能系统中的价值对齐、语义主权与自主演化提供了理论支撑与工程参考。
链接预测是图机器学习中的重要任务, 旨在填补图中缺失的边或预测未来节点间可能的连接。链接预测在不同的图数据类型下有不同的应用场景, 例如社交网络下的好友推荐、用户-商品二部图上的推荐系统以及知识图谱的补全等。随着图神经网络(GNN)的研究与发展, 基于GNN的方法在链接预测中扮演着越来越重要的角色, 基于GNN的链接预测方法主要分为基于节点和基于子图两类, 相较于基于节点的方法, 基于子图的方法能够更好地捕捉节点间的拓扑结构信息, 避免节点同构问题。目前基于子图的方法通常使用包含目标节点及其1阶或2阶邻居的闭包图, 然而闭包图规模过大且易受中枢节点的影响。为解决这一问题, 提出在简单路径图上进行链接预测的方法, 并通过理论证明了在一定阶数的限制下简单路径图作为闭包图的子图能有效减小子图规模。此外, 在放宽阶数的限制下, 即使简单路径图不再是闭包图的子图, 通过实验验证了其规模依然小于闭包图。对比实验结果表明, 基于简单路径图的方法在无节点特征和有节点特征的数据集上总体优于其他方法, 链接预测性能更好。
语音识别旨在通过先进的算法与信号处理技术, 赋予机器理解人类语音的能力, 使得人与机器之间的交流更加便捷、顺畅。目前, 大多数端到端语音识别的研究工作主要围绕Conformer模型进行优化。针对Conformer编码器对语音细粒度局部特征提取能力不足的问题, 提出一种融合最大池化(MP)的Conformer中文语音识别模型。首先, 将编码器卷积模块中门控线性单元的输出在时间维度上进行MP, 以提取多帧语音信号对应一个字符的细粒度局部特征。然后, 将池化后的特征与逐通道卷积(DWC)提取的粗粒度局部特征以逐元素相加的方式进行融合, 以增加语音局部特征的信息量, 从而提高Conformer模型的语音识别准确率。最后, 在公开的中文数据集Aishell-1上的实验结果表明: 采用贪心搜索方式进行解码, 所提模型可以将基线模型的字错误率(CER)从5.58%降低至5.32%;采用注意力重打分方式进行解码, 所提模型可以将基线模型的CER从5.06%降低至4.92%。
无监督领域自适应(UDA)的目的是将知识从带有标记样本的源域转移到没有标记样本的目标域, 其假设源域和目标域具有相同的类别, 但这一假设在现实世界场景下往往难以成立。目标域通常包含着源域未被发现的新类别样本, 这种设置称为开放集领域自适应(OSDA)。在OSDA中, 丰富的域特定特征使得学习域不变表示面临着巨大挑战。现有的OSDA方法往往忽略了域特定特征, 并将域差异直接进行最小化, 这可能导致类别之间的边界不清晰并削弱模型的泛化能力。为了解决这一问题, 提出一种基于过渡桥接机制的OSDA方法(OSTBM)。在特征提取器和域鉴别器上建立过渡桥接机制, 以减少域特定特征在整体传递过程中的干扰, 并提高域鉴别器的鉴别能力, 从而在特征对齐过程中更好地对源分布与目标已知分布进行对齐, 并将目标未知分布推离决策边界。实验结果表明, 所提方法在多个基准数据集上表现优于现有的OSDA方法, 展现了优越的性能。
图神经网络(GNN)在节点分类任务上表现优异, 但消息传递机制导致的邻域获取延迟问题限制了其在延迟敏感应用中的部署。尽管多层感知机(MLP)在节点分类任务上的准确性不及GNN, 但由于具有理想的推理效率, 因此其仍是实际工业应用的主要工具。鉴于GNN和MLP在各自优势与劣势上的互补性, 提出基于对抗训练与对比表示蒸馏的GNN推理优化方法, 以将GNN教师模型学到的知识传递给更高效的MLP学生模型。通过将快速梯度符号法(FGSM)生成的特征扰动与节点内容特征结合并作为学生模型的输入, 然后在真实标签与教师模型的Softmax概率分布的指导下, 对学生模型进行对抗训练, 以降低其对节点特征噪声的敏感性。此外, 设计对比表示蒸馏模块, 将学生和教师模型对同一节点输出的嵌入视为正样本对, 对不同节点输出的嵌入视为负样本对, 通过缩小正样本对的距离并扩大负样本对的距离, 使学生模型能够捕捉教师模型输出的节点嵌入之间的关系, 从而保留GNN的全局拓扑结构。在公共数据集上的实验结果表明, 当教师模型为GraphSAGE时, 采用该方法训练得到的MLP学生模型推理速度比GraphSAGE快89倍, 准确率相较于普通MLP和GraphSAGE分别平均提高14.12和2.02百分点, 且优于两种基线方法。
随着信息技术的飞速发展, 链路预测技术已经在多个领域得到了广泛的应用。目前的链路预测方法通常采用子图提取的方式, 其中一种基于线图转换(LGT)与图卷积神经网络(GCN)的模型在链路预测问题上取得了优异的效果, 但仍存在2个问题: 1)LGT的时间复杂度过高和转换后子图的规模过大导致其难以被广泛应用; 2)GCN忽略了节点间的高阶关系和局部聚类结构, 会对预测精度产生一定的影响。为解决上述问题, 提出一种基于超图卷积神经网络(HGCN)的链路预测方法HGLP。该方法使用对偶超图转换(DHT)替代LGT以做到在不损失任何结构信息的情况下提高系统的运行效率, 同时运用HGCN分别学习超图中超节点与超边的高阶特征以实现更高的预测精度。实验结果表明, 在曲线下面积(AUC)和平均准确率(AP)2个指标下, 所提出的方法在7种不同领域的真实图数据集中的表现不仅优于现有的链路预测方法, 而且内存占用更少、运行时间更短。
针对传统的萤火虫算法(FA)在处理优化问题时存在的收敛速度慢、易陷入局部最优解等问题, 提出一种动态的萤火虫算法, 并将该算法与邻域粗糙集相关理论相结合开展特征选择的研究, 从而实现对连续型数值的有效处理, 并且有效提高特征选择的性能。首先, 为了改进萤火虫算法的搜索策略, 引入POX(Precedence Operation Crossover)变异策略并采用阈值设置控制萤火虫交叉变异的概率, 便于陷入局部最优的个体及时跳出, 提出一种动态的萤火虫算法; 其次, 为了能够同时考虑到知识完备性和知识粒度大小, 将邻域粗糙集中的邻域知识粒度与条件熵有机结合, 提出一种新的信息熵模——邻域粒度条件熵; 最后, 提出一种基于邻域粒度条件熵与动态萤火虫算法的特征选择算法FS_NGHFAPOX, 该算法采用邻域粒度条件熵来构建适应度函数, 进而更好地评价特征子集。在UCI和scikit-learn机器学习库中的内置数据库中部分数据集上进行实验验证, 验证结果表明FS_NGHFAPOX算法分类性能最优且所选特征子集数量更少, 平均准确率达到0.83, 相较于其他特征选择算法最多提高了15%。
在现有基于U-Net的路面裂缝检测方法中, 编码器各层次特征间的交互未能得到充分考虑, 容易因下采样过程中的信息丢失而导致检测结果不完整或出现漏检。为此, 提出一种基于多层次特征融合的路面裂缝检测方法。首先, 在编码阶段, 提取裂缝在不同层次上的特征, 形成从浅层到深层的裂缝特征表示; 其次, 在跳跃连接部分, 采用基于改进通道交叉Transformer(CCT)的跨层次融合策略, 增强各层次特征间的互补性, 丰富裂缝特征的表达; 最后, 在解码阶段, 通过特征融合模块优化解码器对编码器特征的利用方式, 促进裂缝特征的传递, 提高对裂缝特征的感知能力。为验证所提方法的有效性, 在DeepCrack和CRACK500 2个公开数据集上进行一系列的对比和消融实验, 结果表明, 所提方法的综合表现优于DeepCrack、Swin-UNet等6种方法, 在DeepCrack数据集上的F1值相较DeepCrack、Swin-UNet分别提高了2.30和2.51百分点, 在CRACK500数据集上则分别提高了1.65和1.00百分点。
织物缺陷目标检测在纺织生产过程中是不可或缺的关键步骤。然而, 在实际情况下获取大量标注数据是十分困难的。无监督域自适应方法为该问题提供了有效的解决方案, 能够在没有目标域数据标注的情况下提升模型性能。然而, 现有的方法虽然在经典数据集上表现出色, 但在应用于更复杂、纹理更丰富的织物缺陷检测任务中时, 模型性能会明显下降。为了解决该问题, 提出一种基于纹理知识引导(TKG)的跨域织物缺陷检测方法, 旨在增强目标检测迁移模型在织物图像上的检测性能。TKG方法包含纹理增强模块、联合注意力模块和一致-对抗模块3个关键部分。纹理增强模块通过傅里叶变换来增强输入图像中的纹理信息, 使得模型能够更好地捕捉到复杂的纹理特征; 联合注意力模块引入一种注意力机制, 能够捕获更为全面的纹理和结构信息, 通过自适应地调整不同区域和通道的权重, 增强模型对关键纹理和缺陷区域的关注; 一致-对抗模块通过一致性训练和对抗性训练增强模型对目标域数据的适应性, 提升模型在目标域的检测性能。实验结果表明, 相较于对比方法, TKG方法在织物缺陷目标检测任务中表现出显著的优越性, 在斜纹到平纹的跨域检测实验中, TKG方法在mAP@0.5指标上实现了最高3.1百分点的性能提升, 体现了该方法在实际织物生产环境数据中优秀的跨域缺陷检测能力。
通用对抗扰动(UAP)的空域信息直观表示了扰动的视觉特征, 频域信息包含了扰动的结构和纹理, 联合分析扰动的空域和频域信息, 有助于理解UAP的生成机制及其对图像分类模型鲁棒性的影响。已有研究大多关注扰动空域信息的分布和变化, 忽略了频率分量的作用, 限制了UAP的泛化能力。针对此问题, 提出一种空频域联合优化的图像UAP生成方法, 使用对抗样本置信度损失、扰动空域距离损失和扰动频率引导损失, 从空域和频域角度训练模型, 生成具有高攻击性和迁移性的UAP。其中, 对抗样本置信度损失用于增强扰动的攻击性, 扰动空域距离损失优化扰动的空域大小, 扰动频率引导损失控制扰动中频率分量的比重。实验结果表明, UAP的低频分量对攻击效果影响较大, 在相同扰动空域内, 低频分量越多, 扰动攻击成功率越高; 与基线方法对比, 通过联合优化空域和频域生成的UAP具有较强的攻击性和迁移性, 在生成速度方面也有显著的优势。
一幅遥感图像通常包含多种地物, 具有多个语义信息。使用多标签学习方法对遥感图像进行分类, 能更好地理解图像语义。然而, 由于人工标注具有主观性以及遥感图像目标具有复杂性, 导致图像标注不准确, 从而引入噪声(加性噪声)或出现标签缺失现象(减性噪声), 这2类噪声统称为混合噪声, 它们的存在会误导算法训练过程, 降低分类性能。针对混合噪声问题, 提出一种遥感图像多标签分类算法。首先对图像分别进行强增强和弱增强变换, 并将2种增强图像分别送入2个具有相同结构的网络中进行协同学习; 接着, 通过在训练过程中约束2幅图像内的一致性和图像间以及对应标签的结构一致性, 并将2种约束与二元交叉熵(BCE)损失相结合, 以形成最终的损失函数; 最后, 基于预测标签定义排序误差, 识别和矫正损失函数中的噪声标签, 从而提高模型鲁棒性。为验证所提方法的性能, 在遥感图像多标签数据集AID、UCM和DFC15上进行混合噪声多标签分类实验, 并从图像分类指标和多标签分类指标2个方面将所提方法与多种多标签分类方法进行对比。结果表明, 在不同标签噪声比下所提方法的总体性能最优。
芯片产业是国家安全和经济发展的重要基础, 而集成电路(IC)反向工程(RE)作为分析芯片内部性能的手段, 是芯片产业链中的重要环节。RE包括从扫描电子显微镜(SEM)逐层采集芯片图像、识别器件、提取栅极网表、推断其功能等步骤, 而将电气元件和金属线从IC图像背景中分割出来是识别器件等步骤的前提。然而, 传统图像分割方法因为缺乏专家经验的学习, 不能适应IC图像复杂多变的电路情况。为此, 提出一种HE-UNet方法, 用于提取IC图像中的金属线与过孔。HE-UNet包含3个步骤: 首先, 利用U-M2网络提取芯片图像的含噪特征; 其次, 利用霍夫圆检测算法去除过孔周围的噪声; 最后, 利用边缘检测池化去除远离过孔的噪声。在尺寸为1 024×1 024像素的IC图像上进行实验, 结果表明, HE-UNet可以有效完成金属线和过孔的分割, 其平均交并比(mIoU)为98.24%, 平均像素准确率(MPA)为99.11%, 均优于对比方法。
得到广泛应用的跨界之星Transformer, 在人-物交互(HOI)检测领域同样取得了很好的效果。基于此, 提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙, 针对HOI检测的3个子任务: 预测人框, 预测物框与物体类别, 预测人物之间的交互动作, 构建基础多分支Transformer结构, 包含一个人体实例分支、一个物体实例分支和一个交互分支, 并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息, 预先生成物体类别和交互动词语义特征, 以及人物框的空间特征为不同的Transformer分支提供语义、空间线索, 进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络, 教师网络的解码器以预生成特征为解码器查询, 输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出, 构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度, 从而达到提升基础网络解码器性能的目的。实验结果表明, 在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%, 对比基线取得了最多4.65百分点的提升。
无监督行人重识别旨在挖掘无标注数据的判别性表示用于行人检索任务。基于伪标签进行训练的无监督行人重识别方法目前已经取得了瞩目的进展。然而在训练过程中引入的噪声和信息利用不完全问题限制了该任务的进一步发展。提出一种融合浅层空频信息的多粒度师生网络。首先, 同时考虑全局和局部特征并将其集成到聚类对比学习中, 丰富特征表示, 利用训练好的教师模型指导学生模型快速收敛, 减少噪声伪标签的干扰; 其次, 设计一个新颖的空频信息交互模块, 利用网络加深过程中丢失的浅层空间域、频域有用信息; 此外, 在学生网络的训练过程中采用一种重利用策略, 将以往方法中直接丢弃的部分未聚类实例作为难样本重新利用。在Market1501、DukeMTMC-reID和MSMT17 3个大型数据集上的均值平均精度(mAP)结果分别达到87.5%、74.8%和41.9%, 证明了该方法的优越性。
随着深度大模型技术的不断发展, 基于孪生网络的视频目标跟踪算法主干网络也不断深化, 参数量不断增多, 导致模型训练时间和成本的成倍增长, 对模型在边缘设备上的部署造成了困难。因此, 针对提升轻量级小模型对目标位置和语义信息提取能力的问题, 提出基于位置和语义分离注意力机制的轻量视频目标跟踪算法。首先对归一化注意力机制进行改进并结合水平和竖直方向卷积构建位置注意力, 嵌入到主干网络的浅层特征, 实现对目标位置信息的提取。然后联合通道方向归一化注意力与压缩-激励网络(SENet)注意力, 并将其与主干网络的深层特征进行融合实现对目标语义信息的提取。与之前的注意力机制不同, 分别利用网络中浅层特征有利于空间信息的提取和深层特征有利于语义特征提取的性质将位置注意力和语义注意力分离, 在不明显增加网络参数量的情况下, 提升算法对目标位置和语义信息的提取能力。在通用视频目标跟踪数据集上的实验结果表明, 所提算法能够提升基于轻量级孪生网络跟踪算法的精度和成功率。
人脸深度伪造技术的滥用给社会和个人带来了极大的安全隐患, 因此深度伪造检测技术已成为当今研究的热点。目前基于深度学习的伪造检测技术在高质量(HQ)数据集上效果较好, 但在低质量(LQ)数据集和跨数据集上的检测效果不佳。为提升深度伪造检测的泛化性, 提出一种基于多尺度双流网络(MSDSnet)的深度伪造检测方法。MSDSnet输入分为空域特征流和高频噪声特征流, 首先采用多尺度融合(MSF)模块捕获不同情况下图像在空域被篡改的粗粒度人脸特征和伪造图像的细粒度高频噪声特征信息, 然后通过MSF模块将空域流和高频噪声流的双流特征充分融合, 由多模态交互注意力(MIA)模块进一步交互以充分学习双流特征信息, 最后利用FcaNet(Frequency Channel Attention Network)获取伪造人脸特征的全局信息并完成检测分类。实验结果表明, 该方法在HQ数据集Celeb-DF v2上的准确率为98.54%, 在LQ数据集FaceForensics++上的准确率为93.11%, 同时在跨数据集上的实验效果也优于其他同类方法。
跨链是一种打破区块链网络"信息孤岛", 实现不同区块链网络之间互操作的重要技术。作为跨链实现的产物, 跨链桥已成为异构区块链之间实现资产转移和信息传递的重要解决方案。近几年, 针对跨链桥漏洞的攻击频繁发生, 攻击导致的跨链交易异常已造成高达数十亿的经济损失。然而, 目前对跨链桥的异常交易问题研究较少, 且仅有的一些检测工作高度依赖于人工总结的交易序列异常模式。针对这一问题, 提出一种基于BERT(Bidirectional Encoder Representations from Transformers)模型的跨链异常交易检测方法, 通过提供基于特征提取的2种检测模式, 克服现有检测方法对人工经验依赖的局限性。第1种模式旨在更精准地提取特征, 先根据交易状态从跨链原生交易数据中自动抽取具有关键特征的跨链交易序列, 再通过跨链交易序列文本数据微调BERT-Base-Uncased预训练模型适应异常交易检测任务; 第2种模式旨在弥补仅考虑关键跨链交易序列可能带来的特征不足, 直接通过具有全面特征的原始交易文本数据微调BERT-Base-Uncased预训练模型进而解决异常交易检测任务。实验使用现有工作的真实跨链数据评估所提检测方法, 结果表明, 2种检测模式均能有效检测出异常的跨链交易, 精确率、召回率及F1值均达到了100%。
深度神经网络在遥感图像的场景分类任务中取得巨大成功。然而, 由于对抗样本具有较强的可迁移性, 基于遥感图像的场景分类网络的脆弱性不容忽视。为了增强遥感图像场景分类网络的鲁棒性, 确保其在各种环境和条件下的可靠性和安全性, 有效提高其实际应用价值, 提出一种频域的量化对抗攻击(FDQ)方法。首先, 将输入图像进行离散余弦变换(DCT), 在频域中利用量化筛选器有效捕捉使图像正确分类的关键特征在频域中的突出区域; 然后, 提出一个基于类的注意力损失, 使得量化筛选器逐渐丢失这些使图像正确分类的关键特征, 模型的注意力逐渐偏离与原始类别毫不相干的特征和区域。所提方法利用模型的注意力分布实现特征层级的黑盒攻击, 通过找到不同网络中的共同防御漏洞, 实现针对遥感图像生成且具有通用性的对抗样本。实验结果表明, FDQ方法可在遥感图像场景分类任务中成功攻击大多数最先进的深度神经网络, 与目前最先进的基于遥感图像场景分类任务的攻击方法相比, FDQ在基准数据集UCM和AID上基于RegNetX-400MF架构的攻击成功率分别提高了35.43%和23.63%。实验表明FDQ具有良好的攻击性和可迁移性, 很难被防御系统抵御。
基于格的后量子密码算法在公钥密码领域具有广泛的应用前景, 多项式乘法的计算复杂性是其硬件实现的主要性能瓶颈。针对多项式乘法实现存在的面积效率低和内存映射冲突等问题, 提出一种基于部分数论变换(PNTT)和系数交叉运算(CCO)的多项式乘法结构。首先, 将数论变换(NTT)最后一轮、系数相乘和逆数论变换(INTT)第一轮融合成CCO, 减少2轮蝶形运算和50%的旋转因子存储空间, 降低内存访问开销; 其次, 采用轻量级硬件分别实现模加、模减、除2运算以及优化后的基于Barrett的模乘运算, 有效减少逻辑资源开销, 同时采用流水线、分时复用技术设计可重构运算单元(PE)阵列, 使得各运算单元可以在不同变换下进行高效重组连接; 此外, 在内存映射方案上引入系数分组存储和特殊内存映射方法, 利用地址映射规律对数据和旋转因子实现高效调度, 避免内存映射冲突问题, 以低成本实现内存访问; 最后, 采用先入先出(FIFO)结构实现数据重组, 提升数据访问效率。实验结果显示, 所提出的PM结构在Slices和数字信号处理器(DSP)的面积延时积(ATP)指标上相比于现有相关工作分别降低21.7%和61.1%以上, 具有更高的面积效率。
不经意传输(OT)协议是一种保护隐私的两方通信协议, 也是构建安全多方计算的重要模块。该协议通常基于RSA(Rivest—Shamir—Adleman)或DH(Diffie—Hellman)密码系统来交换对称密钥, 在消息的加密阶段使用对称密钥进行加密。然而, 在现有的OT协议中, 多对公私钥生成以及数据计算非常耗时。在同一密文域中, 采用双射函数对密文进行变换, 可以确保密文解密后的不可区分性, 同时减少计算量。在半诚实模型上, 提出一种基于密文混淆的OT协议框架, 并在该框架下基于RSA和DH实例化OT协议。相较基于RSA的加密方案, 所提协议只需要一对公私钥, 同时, 当公私钥减少为一对时, 接收方可以利用发送方数字证书中的公钥, 实现具有身份认证功能的OT协议。对比基于DH密钥交换的OT协议, 该协议具有数据传输量小、计算复杂度低的优势。实验结果表明, 与现有OT协议相比, 实例化的协议在密钥交换阶段的效率至少可提高30%。此外, 该协议还可以用于隐私集合求交、混淆电路和OT扩展协议中的基础协议。
随着海量数据的积累以及计算能力的不断提高, 深度神经网络(DNN)已广泛应用于图像识别、文本分类等各个领域。然而, 有研究表明, 基于DNN的文本分类模型经常受到攻击者恶意构造的对抗样本攻击, 攻击者可以通过删除和修改原始文本、插入混淆语句以及加入标点符号等方式使得模型分类结果发生改变。现有的对抗样本生成方法大多以牺牲隐蔽性为代价, 采用多类型替换池杂糅的方式来提高攻击准确率, 无法兼顾攻击成功率和对抗样本的隐蔽性。为解决此问题, 提出一种针对对抗样本隐蔽性进行设计的中文对抗样本生成方法WordReproduction, 通过汉字本身词性并结合字词级维度来计算汉字的显著性得分, 在关键字词替换模块中利用形近字向量空间、字形拆分候选池和词语倒置3种字形替换方法, 分别对关键字和词进行替换, 并根据汉字的形态特征设计字形相似度评估算法, 更好地量化对抗样本与原文之间的相似程度。实验结果表明, WordReproduction方法生成的对抗样本在攻击成功率和字形相似度上均优于基线方法, 在情感分类场景的Transformer模型上, 相比WordHandling方法, WordReproduction的攻击成功率和字形相似度得分分别提高了51.64百分点和0.53, 其生成的对抗样本不仅能够误导模型的分类结果, 而且具有较高的隐蔽性, 使得人类阅读者很难察觉。
相对于自然载体无载体信息隐藏, 非自然载体无载体信息隐藏不试图生成或利用自然载体来隐藏秘密信息, 可从根本上杜绝自然载体判别问题。但在现有的非自然载体无载体信息隐藏方法中, 水影画嵌密无法对秘密信息进行有效掩盖, 分形嵌密需满足整体与局部自相似的严苛数学约束。为对秘密信息进行有效掩盖并进一步提升视觉质量, 采用自然图像矢量化的方式, 提出一种结合三角剖分和贝塞尔曲线嵌密的石头画生成式信息隐藏方法。首先, 将前景区域三角剖分, 剔除不适合嵌密和不保持掩体前景特征的三角区域; 其次, 产生表征秘密比特且与给定三角区域相内切的石头轮廓, 并填充与三角区域、密钥、嵌密比特一致的随机颜色, 从而产生石头画; 最后, 基于密钥产生一致的三角区域, 提取秘密比特并进行颜色认证。理论和实验结果表明, 该方法可产生与掩体图像轮廓特征一致的富含语义的石头画, 且不暴露嵌密特征, 同时可对秘密信息进行有效掩盖, 特征提取严格依赖于密钥, 可对提取的秘密比特进行高精度的颜色认证, 未知密钥将无法获取秘密信息。
针对无线传感器网络(WSN)中节点故障或异常情况下的系统状态估计问题, 提出一种基于k-medoids信任的分布式H∞融合滤波方法, 旨在提高传感器故障下系统状态估计的鲁棒性和精确性。该方法的主要步骤为: 首先, 各传感器节点分别采集局部测量信息并执行分布式H∞滤波更新局部状态估计; 然后, 各近邻传感器节点之间交换局部状态估计后, 通过建立k-medoids信任机制将获取的局部状态估计分为信任估计和非信任估计, 舍弃非信任估计而保留信任估计; 最后, 设计一种分布式扩散融合策略, 该策略计算信任估计的自适应权重并实时融合更新局部状态估计。通过目标跟踪的仿真结果表明, 在测量干扰故障、数据重放故障、错误数据注入故障下, 所提方法比基于信任的分布式卡尔曼滤波算法对传感器节点故障或异常更具弹性, 验证了所提方法的有效性和优越性。
钢轨是铁路运输系统的重要基础设施, 其安全性对列车运行安全至关重要。定期检测钢轨的状态可以帮助及时发现潜在的缺陷和损坏。机器视觉检测近年来逐步运用到钢轨检测中。然而, 因为铁路上网络和计算资源的限制, 检测工作只能在普通列车非运行时间段开展, 不能进行实时检测。针对以上问题, 采用终端-边缘端-云端架构, 提出在列车上每隔一段距离装载高速摄像机, 并将列车收集到的检测图片任务合理卸载至提前缓存的预训练检测模型的终端、轨边的边缘服务器和云服务器进行处理。基于检测任务的组成是离散的, 考虑检测任务分配比例、CPU计算能力和任务优先级约束时延的约束条件, 以检测任务时延作为优化目标构建目标函数, 将任务卸载处理问题表述为最大最小化模型问题。最后通过遗传算法(GA)获取最优任务分配比例、最优CPU计算能力任务分配以及最优最小任务时延。实验结果表明, 在列车拍摄频率为200 Hz生成单个检测任务的情况下, GA的协同卸载比基于二进制云端、边缘端和本地的响应时延分别减少了1 287、515、875 ms; 在检测任务数为10个情况下, 基于GA的协同卸载比基于粒子群算法和蚁群算法的响应时延分别减少了2.440、3.520 s。该方法在不同卸载方案中具有明显的时延优化作用。
通过协同管理地面网络、卫星网络和近地无人机网络等, 空天地一体化算力融合网络有望实现全域连接和普适智能, 为我国数字经济发展提供有力支撑。而低轨道地球(LEO)卫星具备泛在连接和边缘计算能力, 为实现空天地一体化的高效计算体系提供了基础。通过将移动边缘计算(MEC)沉降至LEO卫星网络, 形成面向业务的"端-边-云"三级计算架构, 可将时延敏感型业务从终端卸载到LEO卫星侧, 以提升该业务的任务完成率。然而, 为LEO卫星边缘网络制定高效计算卸载和算力分配决策是一个亟待解决的问题。针对高动态性的卫星网络环境和离散-连续的混合动作空间, 提出一种基于生成扩散模型的混合近端策略优化(H-PPO)方法。首先, 对具有时变特性的无线信道进行建模, 并构建不同卸载决策下的服务时延、通信和计算模型。其次, 在卸载决策、剩余计算资源和功率控制的多约束条件下, 构建最大化平均任务完成率的长期优化问题。然后, 建立具有参数化动作的马尔可夫决策过程模型, 将生成扩散模型引入为离散动作策略, 增强传统深度强化学习(DRL)方法的采样效率和探索能力, 并利用所提算法联合优化计算卸载、算力分配和功率控制变量。仿真结果表明, 所提算法具有较好收敛性能, 并在任务完成率方面优于其他3种对比方法。
面向能量收集双传感器和一个目的地组成的无线传感器状态更新系统, 其中具有有限大小电池的传感器收集能量将感知到的状态更新传输到目标端。提出一种综合考虑感知数据和控制数据传输的两阶段通信策略, 以保证接收端数据信息的新鲜度。目标端使用选择组合的混合自动重传请求(HARQ)将控制数据传输给传感器, 而传感器在此触发下使用最大比例组合的截断HARQ同步感测并向目的地发送相应的状态更新。该系统不仅关注最新感测的数据, 而且关注稳定采集的能量。首先, 研究随机能量达到模型, 给出相应的能量转移矩阵及其稳态概率分布; 其次, 针对感知数据和控制数据分别采用最大比合并和选择合并重传技术, 考虑抢先和非抢先两种传输方案, 推导了信息年龄关于感知概率、能量到达概率和最大传输次数的显式表达; 最后, 数值仿真结果给出了不同网络参数对系统信息年龄的影响, 同时对比了抢先和非抢先传输方案的性能。研究结果表明, 抢先传输方案在一定程度上能够实现较低的信息年龄。
牵引逆变器是列车动力系统的核心装置, 其功率器件绝缘栅双极性晶体管(IGBT)在长期振动和复杂工况下容易出现随机的间歇开路现象, 该类故障往往在停机后消失, 难以及时被检测。首先, 建立包含牵引供电系统、逆变器及电机的仿真模型分析故障机理, 考虑多电机同步控制下的耦合特性, 对不同管子发生间歇开路时的电流波形进行分析得出: 低概率故障时电流波动幅度较小, 具有一定隐蔽性; 高概率故障表现为电流波形大幅畸变, 并可能引发相邻逆变器的异常, 呈现明显传播性。然后, 针对地铁列车牵引逆变器中IGBT间歇开路故障的隐蔽性和传播性, 提出一种内涵因果分析的故障诊断方法Causal-Res, 利用时间卷积网络(TCN)中的因果卷积机制, 从输出电流信号中提取因果特征向量, 再结合残差神经网络(ResNet)的深层特征学习能力, 对故障特征向量进行分类, 实现间歇开路故障的诊断与定位。最后, 依托基于地铁列车架控牵引系统拓扑结构搭建的小功率试验平台的试验结果表明, 提出的方法在IGBT低概率和高概率发生间歇开路故障的场景下定位故障IGBT的准确率分别为99.99%和99.95%, 试验结果也说明了因果关系的引入能有效提高诊断方法的准确率和稳定性。
放射治疗是肝癌的重要治疗方式。基于深度学习的图像语义分割技术能辅助医师勾画放射靶区, 提高放射治疗的精确性。然而, 现有的医疗图像语义分割模型结构较为复杂, 且参数量大, 难以部署在资源受限的设备上。分析视觉Transformer模型参数的重要性, 发现模型不同层次的重要性参数具有特殊分布规律。据此, 提出基于可变序列的跨层通道剪枝方法。依据重要性参数分布规律, 对多头自注意力(MSA)层和前馈网络(FFN)层, 测量其重要性权重并调节取值, 形成重要性权重值的层次序列, 再为序列设定对应的剪枝率, 形成随网络深度变化的可变剪枝率序列, 从而实现MSA层和FFN层的精细化剪枝。引入循环剪枝策略, 在每一轮次模型剪枝过程中迭代更新可变剪枝率序列, 以充分削减MSA层和FFN层的冗余结构。在公开肝脏分割数据集3D-IRCADb-01上进行训练和测试, 视觉Transformer模型经剪枝后, 图像分割准确率保持不变, 但浮点运算数(FLOPs)和参数量分别减少了60.26%和66.07%。实验结果表明, 所提方法在保证分割精度的前提下, 实现了更大的剪枝率, 比固定剪枝率方法更具有优势。
为了应对红外图像目标检测中目标像素低、背景复杂以及硬件资源有限等问题, 提出一种融合位置编码的多头交叉注意力机制和双特征交互细化结构的目标检测模型。在骨干网络中, 引入基于位置编码的交叉注意力(CCA)模块和空间金字塔池跨阶段局部(SPCP)模块。CCA模块通过行和列的相关矩阵变换, 在水平和垂直方向上聚合上下文信息, 并通过共享递归交错模块的参数, 减少自注意力机制所需的参数数量, 增强特征提取能力。SPCP模块通过统一不同大小和尺度的特征映射, 采用跨阶段局部(CSP)结构降低参数和计算量, 并引入挤压激励注意力机制选择对目标检测更有利的通道。在颈部网络中, 引入频域信息和双特征交互细化(DIR)模块, 进一步提取小型目标船舶的细化特征, 增强模型的特征融合能力。实验结果表明, 改进后的模型在红外船舶检测数据集(ISDD)上的精确度为89.5%, 召回率为97%, F1值为93.1%, 与基准模型相比, 显著提高了检测性能。此外, 与其他检测模型相比, 所提出的模型减少了计算参数量, 融合位置编码的多头交叉注意力机制和双特征交互细化结构可有效提升红外船舶目标检测的准确性。
针对复杂田间棉花的多尺度变化导致现存目标检测算法误报率及漏报率较高、现存检测算法计算量较大难以部署到边缘设备中的问题, 通过优化特征提取与特征融合, 并结合模型剪枝与知识蒸馏技术, 提出一种轻量级田间棉花品级检测算法YOLOv8-Cotton。首先, 在特征提取网络中设计多尺度卷积(MSConv), 其包含不同尺度的卷积核, 能够增强网络的特征提取能力; 其次, 在颈部网络中构建高效的局部特征选择(ELS)机制, 在空间维度上捕获水平和垂直方向的特征, 抑制不相关区域对预测结果的影响, 并利用ELS机制构建新型的分级特征路径融合网络(HL-PAN), 利用其上采样特征融合(U-SFF)及下采样特征融合(D-SFF)所产生的互补信息指导特征融合, 增强模型对棉花多尺度变化的检测能力; 接着, 通过分层自适应幅度剪枝(LAMP)模型剪枝算法压缩模型, 达到轻量化效果; 最后, 利用CWD损失函数进行特征蒸馏, 以增强轻量化模型的检测性能。实验结果表明, YOLOv8-Cotton在自建数据集上的mAP@0.5、mAP@0.5∶0.95值分别达到75.4%、53.1%, 比基线算法分别提高5.1、2.1百分点的同时, 模型大小下降4.83 MB, 计算量减少5.8×109, 并在公开数据集上验证了模型的泛化性。
为了提升钢板焊接的精度, 提高船体质量和建造效率, 提出一种自适应黄金正弦螯虾优化算法(AGSCOA)-Stacking特征加权代理模型的方法, 用于解决船用钢板焊接余量预测问题。首先, 基于Stacking集成学习策略, 根据所提出的PC指标, 从多种机器学习模型中筛选出兼具高预测精度和差异性的基学习器。其次, 提出一种特征加权方法, 针对所筛选基学习器的预测性能进行自适应特征加权, 从而提高模型的泛化能力。最后, 对传统螯虾优化算法进行多方面改进, 引入正交折射反向学习机制来改进种群初始化, 确保初始种群质量; 提出自适应Lévy飞行策略来优化探索阶段, 避免陷入局部最优; 引入黄金正弦算法改进开发阶段, 平衡全局搜索与局部开发能力。利用改进后的AGSCOA对代理模型进行多参数优化, 从而提升模型预测精度。实验结果表明, AGSCOA在优化性能和收敛速度上表现出色, 所提出的代理模型相比线性加权集成学习代理模型、AGSCOA-SVR、AGSCOA-ET和AGSCOA-RF具有更高的预测精度, 均方根误差(RMSE)分别降低了14.29%、35.78%、17.48%和22.31%。