作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2025年, 第51卷, 第3期 刊出日期:2025-03-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2025, 51(3): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 次天钊, 杨昊, 周游, 谢长生, 吴非
    计算机工程. 2025, 51(3): 1-23. https://doi.org/10.19678/j.issn.1000-3428.0068673
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    智能手机已成为人们日常生活中不可或缺的一部分。安卓系统以其开源、生态完备等优点成为目前市场份额占比最大的移动操作系统。在安卓手机中, 存储子系统是关键的组成部分, 对用户体验有重要影响。不同于服务器场景, 安卓手机存储系统的设计需要考虑诸多独特因素, 如资源受限、成本敏感、前台应用优先等, 学术界对此已经展开大量研究。针对该方向研究现状进行总结分析, 首先将安卓手机存储系统用户体验保障面临的问题凝练为主机端写放大、内存交换、文件系统碎片化、闪存设备性能以及I/O优先级反转5类; 然后围绕如何解决这5类问题, 对现有工作进行分类介绍, 并总结常用的手机存储系统测试与分析工具; 最后对安卓手机存储系统用户体验保障技术的研究现状进行总结, 并讨论了未来潜在的研究方向。

  • 蒋淇淇, 张亮, 彭凌祺, 阚海斌
    计算机工程. 2025, 51(3): 24-33. https://doi.org/10.19678/j.issn.1000-3428.0069378
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    大数据时代的到来与信息种类的丰富对数据的受控共享提出了更加细粒度的要求, 基于属性的分布式加密(DABE)可以支持多个参与方之间的数据细粒度访问控制。时兴的物联网数据共享场景对于数据的跨域访问、透明可信度与可控性都有着更高需求, 传统的基于属性的加密(ABE)方案的计算开销对于资源有限的小型设备造成了一定的负担。为了解决上述问题, 提出一种基于区块链的可问责可验证外包分层属性加密方案。该方案支持数据跨域流通, 通过区块链技术保障数据流通的透明度与可信性, 引入可验证凭证(VC)概念解决用户身份认证问题, 借助外包思想将复杂的加解密过程造成的负担分散给外包计算节点, 最终利用分层思想实现更加细粒度的数据访问控制。安全性分析表明, 该方案可以抵抗选择明文攻击。通过使用Docker模拟算力有限的小型设备进行实验, 结果表明该方案相较现有方案具有更低的计算开销, 在属性个数为30时各个算法的计算开销不超过2.5 s, 平均开销为1 s, 适用于资源受限的应用场景。

  • 鲜港, 杨文祥, 张晓蓉, 喻杰, 田永强
    计算机工程. 2025, 51(3): 34-44. https://doi.org/10.19678/j.issn.1000-3428.0068671
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为解决超级计算机I/O效率不高、用户无法充分利用存储系统I/O能力的问题, 研究生产型超级计算机对象存储目标(OST)上的工作负载, 分析高性能计算作业的I/O模式和整个系统中作业的I/O分布情况, 探索提升I/O效率的方法。研究结果显示: 在传统非条带化设置下, OST上的瞬时负载严重不平衡, 导致无法调用未充分利用的OST进行I/O请求; 不同作业的I/O模式对OST的使用情况也有所不同, 因此可以根据作业的I/O模式适当调整文件条带布局, 调动未充分利用的OST来提升I/O性能。提出一种作业感知条带优化方法, 包括静态和动态文件条带化。静态文件条带化将用户的作业均进行条带优化, 而动态文件条带化利用作业名和作业路径的聚类方式提取作业之间的相似性, 预测用户部分可条带优化的作业, 并在作业完成后还原条带配置以减小条带设置错误的负面影响。实验结果表明, 作业感知文件条带化能够增加作业使用的OST数量, 有效提升作业的并行I/O性能, 同时不会对系统稳定性产生显著影响。

  • 张肇鑫, 黄世泽, 张兵杰, 沈拓
    计算机工程. 2025, 51(3): 45-53. https://doi.org/10.19678/j.issn.1000-3428.0068941
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在自动驾驶感知系统中, 卷积神经网络(CNN)作为关键技术在车辆感知和决策中发挥着重要作用。然而, 其面临的对抗样本攻击威胁对自动驾驶系统的安全性和稳定性产生了严重影响。现有的对抗样本生成方法通常直接在图像中添加对抗扰动, 导致对抗样本视觉质量下降, 伪装性不足, 易被人类观察者识别。针对这一挑战, 引入交通场景中车辆运动引起的图像模糊先验知识, 提出一种运动模糊伪装对抗样本生成方法。通过模拟车辆和行人在移动过程中产生的模糊效应, 生成具有运动模糊特征的对抗样本。为了保持图像的运动模糊同时有效实现对抗攻击, 设计一种目标隐身的对抗样本损失函数。实验结果显示, 在ICDAR公共数据集上, 图像检测框数量为0, 通过Brenner梯度函数得到的图像模糊度指标为69.28, 证明了该方法可以生成运动模糊伪装对抗样本。

  • 袁亚剑, 毛力
    计算机工程. 2025, 51(3): 54-63. https://doi.org/10.19678/j.issn.1000-3428.0069042
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    交通标志检测在辅助驾驶中扮演着不可或缺的角色, 为安全驾驶提供了至关重要的支持。在实际交通环境中, 在黑夜或雨天产生的背景噪声会加大交通标志检测的难度。现有模型往往难以有效检出远处的小目标交通标志, 此外, 在设计交通标志检测模型时应当考虑到实际部署对模型体积的要求。为此, 在YOLOv8的基础上提出一种增强前景的轻量级交通标志目标检测模型。首先, 设计了1个轻量级的PC2f模块替换掉原本Backbone中的部分C2f模块, 该模块降低了模型的参数量和计算量, 在保留更多浅层信息的同时进一步丰富了梯度流信息, 同时实现了模型轻量化和提升检测性能; 其次, 设计了前景增强模块(FEM)并将其引入Neck位置, 该模块能够有效放大前景信息并减弱背景噪声; 最后, 增加了一层小目标检测层, 用于在高分辨率的图像上提取浅层特征, 加强模型对小目标交通标志的检测性能。实验结果表明, 优化后的模型在数据集CCTSDB 2021和GTSDB上的mAP50分别达到了82.5%和95.3%, 相较于原模型分别提升了3.6和1百分点, 并且模型权重大小减小了0.22×106。这些结果验证了所提模型在实际应用中的有效性。

  • 人工智能与模式识别
  • 朱红, 王阔然, 朱彤
    计算机工程. 2025, 51(3): 64-75. https://doi.org/10.19678/j.issn.1000-3428.0068839
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    实体对齐旨在发现不同知识图谱中相同对象的不同实例, 但图谱之间的异构性导致等价实例结构及表征不一致, 从而影响实体对齐准确性。提出一种实体主信息与多侧面信息表征相联合的异构图谱实体相似性度量方法, 并用于实体对齐任务。实体主信息包括实体名称及描述, 侧面信息包括实体属性、关系及关联实体描述等信息。针对图谱间等价实体结构异构带来的对齐干扰, 提出了一种结合实体多侧面信息语义表征的相似性度量方法UnMuSIR-SM&EA用于实体对齐。为提升信息同义词的表示一致性, 引入表示学习模型以获取实体各信息的语义表征, 为解决表示学习模型嵌入空间各向异性带来的同义词度量尺度不一致问题, 设计了一种基于实体主信息对比学习的微调方法, 优化实体信息的语义表征。实验结果表明, 该方法在结构差异较大的数据集DISZH-EN上的Hits@1达到了95.2%, 比基于侧面信息的模型BERT-INT高出了16.8百分点; 在DBP15K的DBP15KZH-EN、DBP15KJA-EN和DBP15KFR-EN数据子集上的Hits@1分别达到了95.7%、96.0%和98.9%;在DBP-WD数据集上的Hits@1达到了99.4%。所提模型在实体对齐任务上具有优异的效果。

  • 胡书林, 张华军, 邓小涛, 王征华
    计算机工程. 2025, 51(3): 76-85. https://doi.org/10.19678/j.issn.1000-3428.0068832
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度, 但通常忽略了文本中蕴含的丰富的句法结构信息, 而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致, 使得当前大多数结合句法分析的研究只能使用静态词嵌入来表征词的语义向量。针对此问题, 根据依存句法分析构建依存图, 通过分词掩码映射与注意力混合池化的方法实现动态词嵌入表征词节点的语义特征, 然后使用图卷积网络提取依存图中词节点之间的依存关系信息, 最终读出依存图, 将其作为句子的特征向量, 从语义与句法2个层面计算句子间的相似度。在表示型与交互型2种结构模型上应用所提方法, 并在BQ_Corpus与ATEC数据集上进行实验, 结果显示, 该模型的准确率最高分别达到87.12%与88.33%, 结合依存句法信息后模型的各项评估指标均有提升。

  • 李淑怡, 阳波, 陈灵, 沈玲, 唐文胜
    计算机工程. 2025, 51(3): 86-94. https://doi.org/10.19678/j.issn.1000-3428.0068626
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对机器人清洁作业过程中现有曲面覆盖方法难以适应曲面变化且覆盖效率低的问题, 提出一种自适应奖励函数的近端策略优化(PPO)曲面覆盖方法(SC-SRPPO)。首先, 将目标曲面离散化, 以球查询方式获得协方差矩阵, 求解点云的法向量, 建立3D曲面模型; 其次, 以曲面局部点云的覆盖状态特征和曲率变化特征作为曲面模型观测值以构建状态模型, 有利于机器人移动轨迹拟合曲面, 提高机器人对曲面变化的适应能力; 接着, 基于曲面的全局覆盖率和与时间相关的指数模型构建一种自适应奖励函数, 引导机器人向未覆盖区域移动, 提高覆盖效率; 最后, 将曲面局部状态模型、奖励函数、PPO强化学习算法相融合, 训练机器人完成曲面覆盖路径规划任务。在球形、马鞍形、立体心形等3种曲面模型上, 以点云覆盖率与覆盖完成时间作为主要评价指标进行实验, 结果表明, SC-SRPPO的平均覆盖率为90.72%, 与NSGA Ⅱ、PPO、SAC这3种方法对比, 覆盖率分别提升4.98%、14.56%、27.11%, 覆盖完成时间分别缩短15.20%、67.18%、62.64%。SC-SRPPO能够在适应曲面变化的基础上使机器人更加高效地完成曲面覆盖任务。

  • 戴康佳, 徐慧英, 朱信忠, 李悉钰, 黄晓, 陈国强, 张志雄
    计算机工程. 2025, 51(3): 95-104. https://doi.org/10.19678/j.issn.1000-3428.0068950
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    传统的视觉同步定位与建图(SLAM)系统是基于静态环境这一假设的, 然而在现实场景中往往存在动态物体, 这可能导致SLAM位姿估计和地图构建的精度下降、鲁棒性变差, 甚至出现跟踪丢失的情况。针对上述问题, 基于ORB-SLAM2提出新的语义SLAM系统(YGL-SLAM)。该系统首先使用轻量级目标检测算法YOLOv8n追踪动态对象, 获得动态对象的语义信息。然后在跟踪线程的同时提取点特征和线特征, 根据获取的语义信息利用Z-score和对极几何算法剔除动态特征, 以改进SLAM在动态场景中的表现。此外, 鉴于轻量级目标检测算法在追踪动态对象时存在连续帧的漏检测问题, 设计了基于相邻帧的检测补偿方法。在公开数据集TUM和Bonn上的测试结果表明, 相比ORB-SLAM2, YGL-SLAM系统准确率提升超过90%, 对比其他动态SLAM, YGL-SLAM也具有较高的准确度和鲁棒性。

  • 蔡瑞初, 许遵鸿, 陈道鑫, 杨振辉, 李梓健, 郝志峰
    计算机工程. 2025, 51(3): 105-112. https://doi.org/10.19678/j.issn.1000-3428.0068937
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在量子化学领域, 分子性质预测是一项基础而关键的任务, 广泛应用于药物发现、化学合成预测等多个领域。随着人工智能的发展, 深度学习方法在该领域得到了广泛应用。然而, 当前的方法往往采用微观和宏观视图两种极端的抽象层次来对分子性质进行建模, 导致难以推广到分布之外样本的挑战。化学的介观视图提供了一个有益的中间层次, 通过包含与性质相关的功能基团的介观成分来描述分子性质。通过考虑这些介观成分, 并从因果关系的角度对其进行建模, 可以更加关注与性质相关的功能基团。为了实现该目标, 提出一种介观成分识别模型。该模型基于分子数据的介观因果生成过程和变分自编码器的框架, 通过学习与分子性质相关的介观成分的表示, 实现对分子性质的预测。首先假设原子隐变量遵循高斯分布和语义隐子结构遵循多元伯努利分布, 将分子数据输入神经网络来识别原子隐变量和语义隐子结构。接着利用识别出来的原子隐变量和语义隐子结构来预测分子性质。为了能够识别出原子隐变量和语义隐子结构, 利用变分下界和稀疏项来构造模型的损失函数。实验结果表明, 该模型不仅在性能上取得先进的结果, 而且提供了深入的解释, 为模型预测提供了更全面的理解, 提高分子性质预测的准确性和泛化能力。

  • 杨竣辉, 李苏晋
    计算机工程. 2025, 51(3): 113-121. https://doi.org/10.19678/j.issn.1000-3428.0068741
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    词语作为一种上下文信息在中文命名实体识别(NER)任务中发挥着重要作用。以往基于字符的中文NER方法虽然在一定程度上取得了成功, 但仍存在词语信息嵌入方式简单、特征捕捉方式单一, 且忽视了潜在词的影响、未能充分利用词语信息的问题。针对上述问题, 提出一种改进的中文NER方法。首先, 通过基于全遮蔽技术的预训练模型RoBERTa-wwm将文本表示为字符级嵌入向量; 其次, 使用门控空洞卷积神经网络(DGCNN)模型进一步捕捉文本的特征信息; 然后, 在键值记忆网络(KV-MemNN)模型中采用位置实体类别组合机制(PECM)更有效地融合词语信息并缓解潜在词冲突所带来的影响; 最后, 利用条件随机场(CRF)模型对预测结果进行约束得到最佳标签序列。实验结果表明, 该方法在Weibo、MSRA和Resume数据集上的F1值分别达到71.82%、95.00%和96.14%, 相比于融合词语信息的FLAT模型分别提升了11.50、0.88、0.69百分点, 同时在不同实体上的识别表现整体优于RoBERTa-wwm+CRF和Lattice LSTM模型。此外, 通过预训练模型的对比和消融实验进一步证明了KV-MemNN和RoBERTa-wwm模型的有效性。

  • 李思源, 钟兴宇, 李凯茵, 徐清振
    计算机工程. 2025, 51(3): 122-130. https://doi.org/10.19678/j.issn.1000-3428.0069277
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    教育信息化的发展为促进教学内容多样化提供了更多方案。为了丰富程序化交易课程的内涵, 对量化策略的探讨研究提出了新的案例教学方法。由于在股票趋势预测的任务中, 公司股票的预测会受到相关联公司及多方面的隐性层面高管关系的影响。为了有效应对股票市场波动中的动量溢出效应, 就高管因素的影响提出一个基于多层图卷积神经网络(GCNN)的股票趋势预测及智能量化交易模型, 将其应用于实际课堂教学中充实课堂实例教学任务。该模型首先结合股票历史数据和市场媒体信息, 然后利用多层GCNN提取股票之间包含的具有交叉效应的公司间显性关系和高管间隐性关系等信息进行趋势预测, 最后通过强化学习(RL)进行策略训练。该模型不仅有效提高了股票趋势预测的准确性, 而且有效提升了投资组合优化收益。在CSI100E和CSI300E数据集上的实验结果表明, 该模型得到60.19%和57.44%的准确率, 而图卷积网络(GCN)模型得到51.58%和55.79%的准确率。通过分析得出该模型的股票趋势预测效果更好, 加入了预测结果的智能投资决策也更有效。该研究的方法和实验结果为金融课程提供了实际案例, 可帮助学生理解复杂市场动态和量化交易策略。

  • 刘春雨, 陈庆锋, 莫少聪, 谢泽
    计算机工程. 2025, 51(3): 131-143. https://doi.org/10.19678/j.issn.1000-3428.0069129
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    知识图谱补全旨在利用知识图谱中已有的知识推导出新的事实, 在多个任务和领域发挥重要作用, 引起研究者越来越多的关注。然而现有的知识图谱补全方法大多专注于对知识图谱中的事实三元组进行建模, 未充分考虑知识图谱中实体和关系之间所蕴涵的深层语义和关联。为了解决这个问题, 使用逻辑规则反映知识图谱中关系之间的隐含关联, 而知识图谱语义网络的本质决定了事实三元组周围高阶邻域中包含着深层语义信息。因此, 为了挖掘知识图谱中实体和关系的内在语义和关联, 提出一种基于逻辑规则和图神经网络(GNN)进行知识图谱补全模型。首先基于高效期望最大化(EM)迭代优化算法进行规则自动学习, 将得到的高质量逻辑规则与知识图谱中的实体和关系进行联合嵌入训练, 以实现对知识图谱中复杂关系模式的建模, 并提高嵌入表示的泛化性。同时, 考虑逻辑规则和三元组的重要性进行注意力嵌入传播, 以聚合高阶邻域信息, 最终得到融合深层语义和关联的实体、关系嵌入表示用于知识图谱补全。在4个公开数据集上针对链接预测任务进行实验, 实验结果证明了所提出模型的有效性。

  • 移动互联与通信技术
  • 林绍福, 陈盈盈, 李硕朋
    计算机工程. 2025, 51(3): 144-154. https://doi.org/10.19678/j.issn.1000-3428.0068675
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    由于有限的机载资源和续航能力, 无人机(UAV)在空中停留时间有限, 无法长时间连续执行计算密集型任务。为了满足军事行动、紧急救援等连续作业场景中UAV的不间断任务执行需求, 设计一种基于无线能量传输的多UAV边缘计算方法。采用一组具备无线能量传输和移动边缘计算能力的大型无人机作为空中边缘能量服务器(AEES), 为多个空中执勤UAV提供能量传输和边缘计算服务, 以提高UAV的任务执行效率。通过联合UAV的三维位置、电量和任务量信息, 建立多UAV能量与算力联合优化模型, 并采用多智能体深度Q网络(MADQN)算法实现AEES服务位置点和能量发射功率智能化决策, 以最大化固定服务时长内的系统吞吐量和能量传输效率, 同时最小化能耗。仿真结果表明, 所提出的MADQN方法有效地优化了AEES的服务位置和能耗, 能够高效地为UAV提供算力、能量等资源。与启发式学习算法和贪婪算法等其他基线方法相比, 明显提升了能量传输效益和系统吞吐量, 同时保证了能量传输、能耗和吞吐量等多个优化目标的平衡。

  • 卢以纯, 徐明
    计算机工程. 2025, 51(3): 155-161. https://doi.org/10.19678/j.issn.1000-3428.0069011
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了有效估计在水声信道多径效应影响下的跳频信号, 针对现有对跳频信号进行稀疏表示时存在的基不匹配问题, 提出一种基于原子范数的水声跳频信号参数估计算法。首先考虑到信号经过水声信道所受的影响, 对水声跳频信号进行数学建模时时间变量上会多一个时延, 之后按照采样频率对信号进行离散化表示, 然后定义原子集合并将水声跳频信号频率估计问题转化为原子范数最小化问题。通过凸公式的强对偶性证明目标位置可以通过求解原问题的对偶问题得到, 接着进一步将问题转化为一个对偶问题, 通过交替方向乘子法(ADMM)计算出对偶多项式在单位圆上模的值为1的点, 进而完成对信号支撑集的估计。最后对每段信号频率分量的个数进行分析, 估计出含有跳变点的分段信号, 再通过对分段信号进行处理, 精确估计出跳变时刻。仿真结果表明, 该算法采用无网格压缩感知理论, 能够有效地避免基不匹配问题, 与现有算法相比, 使用该算法估计水声跳频信号的参数具有更高的估计精度。

  • 聂雷, 胡字升, 鲍海洲
    计算机工程. 2025, 51(3): 162-171. https://doi.org/10.19678/j.issn.1000-3428.0068794
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    异构车载网络(HVN)环境中车载终端用户的服务质量(QoS)体验高度依赖于网络选择方法。针对单车辆选择接入网络容易导致优质网络阻塞和网络资源分配不均的问题, 提出一种基于路侧单元(RSU)辅助和自适应分簇的异构车载网络选择方法, 适用于融合5G/6G的城市HVN环境。首先, 该方法借助RSU的计算存储能力评估候选网络的性能, 分别利用层次分析法(AHP)和熵权法(EWM)计算候选网络的主观权重和客观权重, 在利用简单加权法计算其综合权重后, 根据车辆的业务类型采用基于直觉模糊集的灰色关联度分析(IFS-GRA)法对候选网络排序; 然后, 在网络负载较高时对车辆进行自适应分簇, 利用分层结构有效降低网络的拥塞概率; 最后, 车辆从RSU处获取满足其业务需求的最优接入网络。实验结果表明, 该方法相较CHSO-GRA和MANSA方法分别减少了30.72%和9.57%的网络切换次数, 相较DUVC和CHSO-GRA方法分别增加了8.01%和39.36%的吞吐量, 提高了网络资源的利用率, 也实现了网络的负载均衡。

  • 魏德宾, 乔维维, 张怡
    计算机工程. 2025, 51(3): 172-179. https://doi.org/10.19678/j.issn.1000-3428.0068571
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    由于卫星网络星座规模大、拓扑时变、链路不稳定等特点, 软件定义网络(SDN)应用在卫星网络时需要部署多个控制器来协同工作, 这就会引起一些问题, 例如控制器部署位置和数量以及平衡控制器数量、控制区域与网络性能之间的关系等。针对上述问题, 提出一种基于改进麻雀搜索算法(SSA)的软件定义卫星网络(SDSN)多控制器动态部署方案。该方案充分考虑卫星网络拓扑的周期性变化, 以降低网络时延、平衡控制器负载、提升网络可靠性作为优化目标建立控制器动态部署模型, 利用k-means聚类算法对SSA进行初始化改进, 并动态调整SSA的步长参数, 通过改进的SSA优化迭代出最优的控制器部署方案。仿真结果表明, 与对比实验中的基于粒子群优化(PSO)算法的SDSN多控制器部署方案CDS-LR相比, 该部署方案不仅使网络时延降低了约10%, 而且还使控制器负载均衡度和网络可靠性分别提升了约25%和40%, 充分保证了动态卫星网络的整体性能。

  • 体系结构与软件技术
  • 孟凡丰, 王子聪, 张金涛, 王彦景, 欧洋, 吴利舟, 肖侬
    计算机工程. 2025, 51(3): 180-188. https://doi.org/10.19678/j.issn.1000-3428.0068707
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    大数据时代的各类数据中心应用程序对大规模数据的存储与计算需求越来越大, 海量数据的访问开销成为限制应用程序性能的主要瓶颈, 计算快速链路(CXL)互联协议的出现为这一问题提供了新的解决思路。提出一种基于CXL的内存池系统软硬件设计。在硬件层面, 基于CXL扩展内存协议, 在系统结构模拟器gem5上构建CXL扩展内存设备。通过将设备内存暴露在中央处理器(CPU)地址空间内, 使得CPU可以直接使用load/store指令访问设备内存。在操作系统层面, 编写CXL设备的驱动程序, 为管理和访问设备提供了完整的软件栈。通过在用户态使用memkind库整合主机与设备内存, 从而向应用程序提供统一的内存视图。通过gem5的全系统模式搭建完整的CXL扩展内存池原型系统, 对系统进行全面的性能评估。使用基准测试membench和STREAM对主机本地动态随机存取内存(DRAM)与主机管理设备内存(HDM)进行了延迟和带宽的对比分析, 实验结果显示: HDM延迟约为DRAM的1.5倍, HDM的带宽约为DRAM的50%~63%。此外, 在DRAM和HDM上运行了真实的键值存储引擎Viper, 发现在DRAM容量受限的场景下, 使用扩展的HDM有2~7倍的性能提升。

  • 苏珲, 张建辉, 曾俊杰, 楚小茜
    计算机工程. 2025, 51(3): 189-196. https://doi.org/10.19678/j.issn.1000-3428.0068330
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    Dockerfile中存在的临时文件问题使Docker镜像打包了超过其功能所需的不必要的文件资源, 导致镜像尺寸增大, 影响了镜像传输和部署的效率。现有的动态分析法在运行时会产生大量日志, 造成较大的系统开销, 而静态分析法无法检测出临时文件的多种变化形式, 限制了其在日常检测中的有效应用。提出一种Dockerfile临时文件静态检测方法, 通过规则验证收集21种临时文件形式, 使用节点关联算法改进抽象语法树(AST)结构, 提高检测效率, 并在节点关联的AST(NA-AST)结构基础上使用着色机制对节点进行处理, 保证检测完整性。实验结果表明, 相较于现有方法, 所提方法能够以较小的时间开销检测出文件中存在的各种临时文件形式。此外, 提供一种对临时文件形式分类的依据, 其可用于对后续临时文件新增形式的分析和检测, 具有较高的普适性。

  • 张明, 郭文康, 王海峰
    计算机工程. 2025, 51(3): 197-207. https://doi.org/10.19678/j.issn.1000-3428.0068477
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    图形处理器(GPU)异构集群中处理大规模动态图时GPU计算资源未被充分利用, 并且面向GPU的图划分方法存在局限性导致出现性能瓶颈。为提高图计算系统性能, 提出一种中央处理器(CPU)/GPU分布式异构图计算系统引擎(DH-Engine), 用于提升异构处理器的计算性能。首先提出新的异构图分割算法, 该分割算法以流式图划分为核心, 通过贪心策略调整顶点位置, 进而实现计算节点之间、CPU/GPU之间的动态负载均衡。在初始图划分时基于最多邻居顶点分配图顶点, 在迭代时基于最少连接边动态调整顶点位置。其次, 设计GPU异构计算模型, 通过CPU/GPU功能并行的方式实现协同计算。CPU与GPU并行执行图算法, 提高CPU核心的利用率, 进而提升图计算效率。实验以图算法PageRank、CC(Connected Components)、SSSP(Single-Source Shortest Path)与k-core为例, 将DH-Engine与其他图计算系统展开对比。与未考虑异构计算的图引擎相比, DH-Engine能更好地平衡各节点计算负载以及计算节点内部的异构处理器之间的负载, 通过缩短局部时延来提高整体的计算速度。实验结果表明DH-Engine的CPU/GPU协同度趋于1。相较于其他图计算系统, DH-Engine异构计算的加速比达到5倍, 可以提供更好的图异构计算方案。

  • 图形图像处理
  • 郭俊博, 马祥
    计算机工程. 2025, 51(3): 208-215. https://doi.org/10.19678/j.issn.1000-3428.0068913
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对人脸图像在复杂环境下存在噪声污染、光照变化和遮挡等情况, 提出一种新的人脸识别方法, 即基于非凸混合范数误差编码的人脸识别方法(NMN), 旨在统一基于向量和基于矩阵的回归方法于一个回归模型中, 以更好地应对多样化的识别挑战。在考虑重构图像的低秩性质的同时, 引入核范数约束捕捉图像的低秩特征。为缓解由异常值引起的偏差问题, 引入非凸函数提高模型的鲁棒性。为进一步提升性能, 充分考虑标签信息, 以更有效地区分不同类别之间的特征差异。在分类阶段, 综合考虑非连续误差和连续误差, 利用类重构误差来判别待识别图像。在Extended Yale B、ORL和AR数据集上进行了实验验证, 结果表明, 相较于其他对比方法, NMN在遮挡人脸识别方面展现出更为卓越的性能。在Extended Yale B数据集上, 针对测试样本添加40%的“狒狒”图像遮挡块, 该方法的识别率达到80.40%, 比其他对比方法至少高出11.68百分点。

  • 胡倩, 皮建勇, 胡伟超, 黄昆, 王娟敏
    计算机工程. 2025, 51(3): 216-228. https://doi.org/10.19678/j.issn.1000-3428.0068753
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题, 提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先, 针对小目标或密集行人的特征信息易丢失这一问题, 在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积, 有效缓解特征信息丢失的问题; 其次, 针对非相邻特征图不直接融合从而引起特征融合率较低的问题, 提出新的双层渐进金字塔网络(DAFPN), 提高行人检测的准确性和精度; 最后, 基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数, 以调整和提高帧回归率, 促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型, mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点; 引入EfficiCIoU_Loss后, 模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展, 提高了其在实际应用中的性能和效率。

  • 陈德品, 赵珅, 焦一平, 王向学, 吕泓, 徐军
    计算机工程. 2025, 51(3): 229-240. https://doi.org/10.19678/j.issn.1000-3428.0068982
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    不同于常规阈值法或边与节点的合并等图采样方法侧重于减小图的规模, 该工作提出了一种具备创新性的基于Transformer架构的图神经网络模块AdaptConv。该模块能够在图结构中进行信息聚合的同时通过动态学习去除冗余的边, 从而构建出新的图, 称之为重构图。重构图保留了原本图结构的有效信息, 也为计算病理提供了新的可视化角度和分析角度。为了评估AdaptConv及重构图的有效性, 该工作将AdaptConv模块集成在聚类约束注意力多种实例学习(CLAM)框架中, 并在乳腺癌的激素受体(HR)和人表皮生长因子受体2(HER2)两种分子分型的计算病理诊断预测任务上验证了模型的准确性。与原生CLAM模型相比, 改进模型的曲线下面积(AUC)指标在HR分型上取得了4.7%的提升, 在HER2分型上取得了0.8%的提升。此外, AdaptConv优化模型生成的注意力分布图更合理可靠, 呈现出与诊断标准免疫组织化学染色一致的分布模式。最后, 该模型生成的重构图与特定组织区域和注意力图都表现出了关联, 具备进一步研究的价值。

  • 卢鹏, 仲闯
    计算机工程. 2025, 51(3): 241-251. https://doi.org/10.19678/j.issn.1000-3428.0069081
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    建筑物提取需要大量的标注数据进行训练, 收集和标注数据需要耗费大量时间。为了在小样本遥感图像数据集上基于半监督学习实现建筑物提取的目的, 构建4组建筑物提取数据集, 提出了一种基于循环一致性生成对抗网络(CycleGAN)的建筑物提取算法。首先, 在生成器中引入全局注意力机制(GAM)以增强对建筑物和图像背景细节特征的区分; 其次, 在判别器中加入谱归一化层以增强训练稳定性, 解决了训练过程中梯度消失问题; 最后, 改进对抗损失和循环一致性损失以提高生成图像的质量, 避免生成图像的过度平滑化, 并引入Identity损失以限制生成器不会自主修改输入图像的颜色, 保证输入图像与输出图像颜色组成的一致性。实验结果表明, 在第1组小样本数据集上, 与UNIT、MUNIT、U-GAT-IT、SPatchGAN、QS-Attn模型进行半监督实验对比, 结构相似性(SSIM)值和准确率分别至少提高了3、8.1百分点, 在扩充数据规模的数据集上, 使用改进后的算法进行全监督和半监督实验对比, 验证了改进后的算法在小样本遥感图像数据集上实现建筑物半监督提取的有效性。

  • 王新良, 王璐莹
    计算机工程. 2025, 51(3): 252-260. https://doi.org/10.19678/j.issn.1000-3428.0069174
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    安全帽是保障爆破作业人员人身安全的重要工具。受低照度爆破现场安全帽检测任务中目标视觉信息模糊、图像亮度低及对比度低的影响, 在目标检测过程中存在目标漏检、误检等问题。基于YOLOX提出了特征增强的安全帽检测算法FEM-YOLOX。首先, 在主干网络使用软池化构建软空间金字塔池化模块(SSPPM), 减少了特征映射中的信息弥散, 并在下采样映射中保留了更多上下文信息; 其次, 设计基于高效通道注意力(ECA)机制的高效特征融合模块(EFFM), 加强了模型对目标区域特征的学习, 提高了特征融合的效率, 减少了模型误检情况的出现; 再次, 采用VariFocalLoss替代BCEWithlogitsLoss, 动态调整正负样本的权重, 使得模型关注数量较少的正样本, 加速了模型的收敛过程, 提升了两类目标的检测精度; 最后, 采用CIoU作为边框回归损失函数, 提高了模型定位目标预测框的精度。实验结果表明, 所提算法的均值平均精度(mAP)相较于基线算法提升了2.21百分点, 每秒处理的图像数量提升了7.67, 满足了低照度爆破现场安全帽实时检测的精度和速度需要。

  • 吴潮宇, 杨斌
    计算机工程. 2025, 51(3): 261-273. https://doi.org/10.19678/j.issn.1000-3428.0068459
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现有变化检测方法在处理高精度遥感影像时存在漏检、误检及边缘检测效果差等问题, 提出了一种基于大核重参U-Net的遥感影像变化检测方法, 简称RepU-Net-CD。该方法以U-Net为骨干网络, 在编码端用大核重参模块代替单卷积核结构进行特征提取, 实现注意力机制的全局感受野。同时, 该方法利用重参技术将小核融合进大核结构中辅助训练, 使网络保留捕获小感受野中细节特征的能力, 从而生成多尺度特征, 提高变化检测精度。在网络解码端将不同时相的特征图进行融合, 得到特征差分图, 再通过跳跃连接和上采样得到变化特征图, 最后利用特征边缘增强模块提高网络对特征图的边缘信息关注度, 进一步提高检测精度后, 生成变化结果。此外, 针对数据集客观存在的正负训练样本不平衡问题, 采用有更高鲁棒性的混合损失函数进行网络训练。本文方法在LEVIR-CD和WHU-CD两个主流的公开数据集上进行实验验证, 并与其他最新的遥感变化检测方法进行了对比。实验结果表明本文方法在许多评估指标上有显著改进, 这两个数据集上的F1值分别提高到91.71%和92.60%, 交并比(IoU)分别提高到84.69%和86.20%。

  • 开发研究与工程应用
  • 杜松霖, 仵大奎, 余云涛, 刘亚, 周文举
    计算机工程. 2025, 51(3): 274-282. https://doi.org/10.19678/j.issn.1000-3428.0068736
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在分布式调度中, 调度策略的协同优化已逐渐成为分布式调度研究者与分布式制造行业决策者的重点关注方向之一。针对带装配机的分布式阻塞流水车间调度问题DBFSP-A, 以最大装配完成时间为优化目标, 提出一种基于Q-Learning的协同优化算法QLBC。首先, 建立了以最大装配完成时间为优化目标的数学模型, 以增强DBFSP-A的可解释性, 在算法构造初始化阶段, QLBC充分利用DBFSP-A的问题特征, 分别根据加工任务的总处理时间、前置延迟时间等特定的排序规则, 构造式地产生高质量的、多样性的可行调度序列作为算法的初始解; 其次, 在QLBC的后续迭代中, 采用基于Q-Learning的协同搜索策略, 自主学习地指导当前解根据其各自状态及先验反馈选择合适的搜索操作, 从而实现全局搜索和局部搜索、加工过程与组装过程的协同进化与协同优化; 最后, 在不同实例中, 测试和检验了QLBC算法的性能。实验结果表明, 相较于其他6种先进算法, QLBC求解的可行调度序列时间平均节省32.09 h, 在提高生产效率、节约生产成本方面更具优势。

  • 杨丰豪, 侯校, 赵紫娟, 强彦, 赵涓涓
    计算机工程. 2025, 51(3): 283-292. https://doi.org/10.19678/j.issn.1000-3428.0068948
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    以中医处方推荐任务作为切入点, 现有处方推荐模型忽略草药配伍等领域知识信息, 导致推荐效果不佳、推荐处方偏离实际。为此, 提出一种基于序列到序列框架的中药关键词感知模型。在症状序列信息挖掘部分加入一种关键词感知网络, 拓展模型多分支结构, 并以处方君药作为关键词嵌入向量来挖掘处方配伍信息, 提升模型深层次知识特征表示能力, 提高推荐质量。设计一种交叉传播机制, 降低注意力累加过程中被过多关注的特征维度, 使得累加结果可以关注到未被关注区域, 降低推荐处方重复概率。提出一种混合软损失, 通过加大不同分布之间的差距, 惩罚重复关注同一位置行为。在2个公共临床中医处方数据集上的实验结果表明, 与TPGen、Herb-Know等其他深度学习模型相比, 该模型能够有效提升推荐处方质量, 解决模型生成过程中的重复问题, 其在Precision、Recall、F1值上相比最好的基准模型分别提升了约8、5、6百分点。此外, 消融实验结果也证明了各个模块的有效性。

  • 韩鹏, 黄韫栀, 任彩月, 程竞仪, 徐军
    计算机工程. 2025, 51(3): 293-299. https://doi.org/10.19678/j.issn.1000-3428.0068929
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    准确的肿瘤亚区分割是乳腺癌异质性表征的关键, 而这种表征是了解乳腺癌化疗反应的关键。传统的阈值分割在功能性肿瘤亚区的区分上存在不足, 为此, 提出一种改进的分割(GR)方法, 该方法基于异质性影像组学特征, 包括纹理信息、强度信息、形状信息, 通过高斯混合聚类实现功能性亚区的精准分割。基于GR分割, 设计双分支双任务分类模型(DDCN), 预测新辅助化疗疗效, 利用得到的亚区来更好地提取肿瘤内部异质性的特征, 并结合文本信息来评估疗效。实验结果表明, 所提放射组学分割模型在不同功能亚区的识别上表现出色, 在剪影系数和方差比指数上都取得了良好的效果。DDCN模型融合了不同亚区的特征, 消融实验结果表明, 在受试者工作特征曲线下的面积(AUC)、准确率等指标上DDCN都取得了良好的结果。总体而言, GR在肿瘤亚区分割上比传统的阈值分割效果更优, 而DDCN模型在评估新辅助化疗疗效方面具有广泛的应用价值。

  • 高睿, 安国成, 邹丹平, 裴凌
    计算机工程. 2025, 51(3): 300-309. https://doi.org/10.19678/j.issn.1000-3428.0069208
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目前, 交通场景中的车辆检测存在目标尺度差异显著以及遮挡重叠严重等问题, 且对大规模数据进行完全标注需要较高的成本。针对以上情况, 提出一种基于改进YOLOv5的半监督车辆检测算法。引入SimOTA样本匹配方法, 优化次优匹配现象, 改善目标尺度形状变化导致的检测困难; 提出一种新的空间金字塔池化网络SPPFA, 通过引入LSKA, 在增大感受野的同时实现空间和通道的自适应性, 缓解大尺度目标和遮挡问题产生的影响; 将CIoU替换为SIoU, 优化回归损失函数。在此基础上, 提出一种改进的半监督深度学习算法, 通过优化损失函数设计, 增强算法学习未标注样本中有益信息的能力, 有效提高模型对车辆的检测精度。实验结果表明, 改进后的算法在自制车辆数据集上mAP@0.5指标达到了58.2%, 相较YOLOv5n基线模型提升了11.1百分点, 且模型体积远小于主流目标检测算法, 具有良好的工程应用前景。

  • 王湛, 张鹏程, 金惠颖, 吉顺慧
    计算机工程. 2025, 51(3): 310-319. https://doi.org/10.19678/j.issn.1000-3428.0069339
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着云网融合技术以及空天地一体化网络的快速发展, 越来越多的服务开始在云网融合环境下运行。在云网融合环境下, 用户呈现移动性特征, 导致服务组合过程变得愈发复杂, 服务组合验证变得尤为关键。同时, 在云网融合环境下用户要求服务组合不仅在当前时间段内稳定运行, 还需要在未来时间段内持续满足用户需求。为了解决以上问题, 提出一种云网融合环境下的服务组合未来属性验证方法。首先, 对云网融合中的服务组合过程进行形式化建模, 同时考虑用户移动导致的云网环境下服务场景的转换关系; 然后, 为了准确描述用户需求, 对云网融合场景下的用户需求进行形式化描述; 最后, 为了解决云网融合环境下用户对服务组合未来时间段内的验证需求, 对服务组合未来时间段的服务属性进行预测, 利用PRISM模型检验工具来进行云网融合环境下的服务组合验证, 以确保在未来时间段内仍然满足性能和可用性要求。实验结果表明, 在云网融合环境下, 当服务数量达到1 000时验证模型构建时间以及模型检测时间分别为3.372 s和0.075 s, 通过云网融合环境下的服务组合案例说明了所提方法的有效性与可行性。

  • 崔金荣, 叶伟浩, 郑鸿, 刘同来, 齐龙, 徐勇
    计算机工程. 2025, 51(3): 320-333. https://doi.org/10.19678/j.issn.1000-3428.0070049
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    水稻种植初期经常会遇到绿色水藻等干扰微小水稻幼苗计数的复杂环境, 使得微小水稻幼苗与背景难以区分, 容易造成检测计数模型性能显著下降, 然而目前通用的深度学习方法无法应对复杂跨域场景下的水稻幼苗检测计数任务。为此, 提出一种基于平均教师的域自适应NWD-YOLOv5模型, 以解决无人机视角下的复杂环境微小水稻幼苗计数问题。为了提高模型对复杂背景下微小幼苗的检测计数能力, 将基于平均教师模型的半监督域自适应训练策略集成到YOLOv5网络中, 并且在YOLOv5的损失中使用基于归一化高斯Wasserstein距离(NWD)的预测框度量方法, 来提高微小目标的正负样本分配准确性。实验结果表明: 与原始的YOLOv5模型相比, 改进模型泛化性能大幅提升, mAP@0.5值从60.0%提升到95.9%;与经典目标检测模型相比, 所提的域自适应模型在mAP、模型大小和检测速度等指标上均有着较大优势; 与传统人工方法相比, 所提水稻幼苗计数方法准确率达到98.6%, 计数时间仅为人工方法的1/5, 决定系数R2达到了0.900 3;所提域自适应模型与监督学习方法Oracle性能接近, 并且性能明显优于基准方法Source Only。所提方法可以大幅提高复杂多变环境下水稻植株计数的精度, 能够作为水稻作物管理方法的技术支撑。

  • 郭俊辰, 马御棠, 相艳, 赵学东, 郭军军
    计算机工程. 2025, 51(3): 334-341. https://doi.org/10.19678/j.issn.1000-3428.0068442
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    实体链接旨在将自然语言文本中的提及链接到知识库中相应的目标实体, 主要面临提及和候选实体的表征能力有限, 导致候选实体精确排序困难的问题, 而现有的知识库扩展和图嵌入等提高表征能力的方法依赖外部数据或知识, 限制了其应用。提出一种实体链接中提及和候选实体精确排序的方法, 通过结合提及上下文构建prompt问句, 将提及和候选实体相似度计算转化为基于prompt问句的打分模式。通过预训练模型微调打分器, 得到提及和候选实体相似度的打分, 并综合候选实体发现阶段的得分, 以筛选出更准确的目标实体。这一过程无需额外的知识, 能够融合上下文信息, 从而更准确地衡量提及和实体之间的相似度。在两个公共数据集上将该模型与基线模型进行实验比较, 结果表明, 相比次优模型, 该模型Acc@1值分别提升了0.88和0.41百分点。

  • 孙亭, 杨洁, 李家璇, 王耀宗
    计算机工程. 2025, 51(3): 342-351. https://doi.org/10.19678/j.issn.1000-3428.0068826
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对交通标志检测算法在黑夜及弱光条件下存在检测精度不高、漏检等问题, 提出一种改进YOLOv7的交通标志检测算法。构建用于弱光增强的高斯图像滤波器, 抑制其背景噪声, 对图像实现像素增强。在YOLOv7网络中, 构建新的AC-ResBlock残差模块来替代ELAN中的3×3卷积模块, 以提高交通标志的特征提取能力和网络推理速度。引入SIoU损失函数提高模型的准确度, 加速训练过程收敛。采用K-means++算法代替K-means重新标定锚框的尺寸, 在扩展后的中国交通标志检测数据集CCTSDB上的实验结果表明, 改进后的YOLOv7算法准确率达到95.7%, 召回率达到94.8%, 平均精度达到96.3%, 优于YOLOv8、YOLOv5及其他主流检测算法, 可以实现黑夜及弱光条件下的交通标志检测。对于复杂环境下的交通标志检测具有一定的研究意义。

  • 栾方军, 龚琪, 袁帅
    计算机工程. 2025, 51(3): 352-361. https://doi.org/10.19678/j.issn.1000-3428.0069071
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了应对人群图像中尺度变化和背景干扰的问题, 提出一种人群计数网络模型, 旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络, 用于提取特征。其次为了有效融合不同层次的特征, 提出多层次特征融合模块(MFFM), 将主干网络中不同层次的特征进行跨尺度融合, 融合后的特征包含了不同尺度的语义信息, 可以更好地适应人群计数任务中的尺度变化问题。接着为了更好地解决人群计数中存在的挑战, 设计一个多尺度注意力模块(MSAM), 根据不同感受野的分支提取不同尺度的特征, 利用选择性Kernel通道注意力(SKCA)缓解多列结构存在的特征相似问题, 并将模块生成的注意力图反馈到对应的尺度特征中, 以抑制背景的干扰。网络模型在ShanghaiTechA数据集中的平均绝对误差(MAE)和均方根误差(RMSE)分别达到了56.1和93.9;在ShanghaiTechB数据集中的MAE和RMSE分别达到了6.1和10.3;在UCF_CC_50数据集中的MAE和RMSE分别达到了174.9和252.7;在Mall数据集中的MAE和RMSE分别达到了1.42和1.85。在公开数据集上的实验结果表明, 提出的网络模型与现有代表性的人群计数方法相比, 在提升人群计数任务的准确性和鲁棒性方面均取得了明显进展。

  • 王庆丰, 李旭, 姚春龙, 程腾腾
    计算机工程. 2025, 51(3): 362-368. https://doi.org/10.19678/j.issn.1000-3428.0068504
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确, 以及每年需要更新问题库的问题, 引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型, 可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题, 根据3所高校真实招生数据, 构建问题与SQL语句模板, 通过填充模板的方式构建数据集, 共有训练集1 501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型, 并在目标领域数据集上进行微调, 在招生领域问题上取得了较高的准确率, 在mT5-large模型上执行正确率为0.95, 精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比, 该模型性能与成本均更优。