作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2024年, 第50卷, 第7期 刊出日期:2024-07-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2024, 50(7): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 智慧教育
  • 李惠乾, 钟柏昌
    计算机工程. 2024, 50(7): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0069539
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    知识图谱与教育教学的深度融合推动了智慧教育的发展。目前有关教育知识图谱的文献综述较为缺乏, 有必要从研究规范性及内容视角方面进行补充完善。利用系统性文献综述法对近10年发表的55篇中文核心期刊文献进行统计分析后发现: 在关键技术方面, 教育知识图谱构建主要包含本体构建、知识抽取、知识表示、知识融合和知识推理5项技术, 深度学习方法逐渐成为研究热点; 在应用场景方面, 教育知识图谱覆盖个性化学习推荐、智能问答(Q&A)、教学资源管理、智能搜索、智能学情诊断和课堂教学分析6类场景, 应用的广度和深度不断拓展; 在应用效果方面, 教育知识图谱促进了学习者个性化学习和碎片化泛在学习, 提升了学习者的学习绩效和教师的专业素养; 在问题与挑战方面, 教育知识图谱存在数据模态单一与缺乏优质数据集、自动化程度低与技术存在边界性、知识建模难度高与能力关照不足、缺乏互操作标准与教育应用率低等问题。后续研究将从完善理论与建立标准、优化技术与精准建模、强化应用与提升效果等方面进行深化。

  • 何杏宇, 周易歆, 罗东旭, 杨桂松
    计算机工程. 2024, 50(7): 13-22. https://doi.org/10.19678/j.issn.1000-3428.0069584
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在现有的教学资源推荐系统中算法和模型不断进步, 但推荐策略仍然停留在学生偏好分析或内容相关性计算两方面, 忽略了教学资源推荐中授课教师对教学目标的掌控以及企业导师的实践价值引导作用。为此, 提出一种基于图神经网络和多主体评价的教学资源推荐方法, 综合考虑学生、教师和企业导师3个主体的评价, 并解决多主体评价导致的小样本问题。首先, 构建包含教学资源和知识点的异质图, 通过异质图嵌入分别获取教学资源和知识点的特征向量表征, 计算教学资源与知识点的相关性; 然后, 设计多主体评价机制, 分别制定针对学生、教师和企业导师3个不同主体的细粒度评价指标, 利用基于图神经网络的小样本学习(GNN-FSL)模型获取不同主体对教学资源的评分向量估计; 最后, 利用注意力机制来综合不同主体的评分向量估计以及教学资源与知识点的相关性对推荐结果的影响。实验结果表明, 该方法在小样本训练中具有较好的评分向量估计准确度优势, 并且融合多个主体评价和增加细粒度多主体评价指标的两大措施均对提升推荐准确度和学习成绩具有显著作用。

  • 王炼红, 林飞鹏, 李潇瑶, 谌桂枝, 周莉
    计算机工程. 2024, 50(7): 23-31. https://doi.org/10.19678/j.issn.1000-3428.0069345
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有多数深度知识追踪模型的知识追踪结果的可解释性弱, 且忽视了习题与知识点的内在关联性对知识追踪效果与预测结果的影响。针对上述问题, 提出一种用于学生表现预测的结合课程知识图谱与多头注意力机制的知识追踪(KMAKT)模型。首先, 采用Word2Vec和双向长短期记忆(BiLSTM)网络将习题作答序列数据转换为低维稠密向量, 利用图嵌入模型TransR进行课程知识图谱嵌入表示, 并使用多头注意力机制计算过往习题作答序列对当前知识状态的贡献程度; 然后, 通过注意力网络挖掘前驱知识对预测结果的影响程度; 最后, 通过多层神经网络获取预测结果, 提高模型的可解释性与预测精度。实验结果表明, KMAKT模型在ASSISTments2017数据集上的受试者工作特征曲线下的面积(AUC)、准确率和F1值相比于深度知识追踪(DKT)模型分别提升了约5.20、4.20和2.40个百分点, 具有较好的预测性能。在湖南大学信号与系统(HNU_SYS)子数据集上的知识追踪可视化结果验证了KMAKT模型的知识追踪结果符合教育学认知规律且具备一定程度的可解释性。

  • 杨兴睿, 马斌, 李森垚, 钟忺
    计算机工程. 2024, 50(7): 32-41. https://doi.org/10.19678/j.issn.1000-3428.0068625
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    大语言模型在自然语言处理领域蓬勃发展, 但在教育数字化领域应用过程中仍面临一系列重要挑战。针对教育数字化领域垂域数据稀缺、摘要长度不稳定导致信息缺失或冗余的问题, 提出一种用于教育领域文本摘要的轻量化幂等模型框架IGLM。该模型首先采用多源训练进行自适应扩增以提升数据多样性, 然后对下游的文本摘要任务进行多种微调。同时, 为降低文本长度的影响, 设计幂等摘要生成策略拉近初次摘要与幂等摘要来约束模型, 减少语料分布不均导致的偏见, 结合量化技术在低资源条件下生成更为精确和流畅的摘要文本。实验以ROUGE分数为评估指标, 在公开中文文本摘要数据集LCSTS、EDUCATION、NLPCC上进行验证。实验结果表明, 该框架在生成摘要的准确率和流畅性上有明显提升, 其中ROUGE-1/2/L相较基线模型在LCSTS数据集上分别提升7.9、7.4、8.7个百分点, 在EDUCATION数据集上分别提升12.9、15.4、15.7个百分点, 在NLPCC数据集上分别提升12.2、11.7、12.7个百分点, 验证了模型有效性。

  • 翟洁, 李艳豪, 李彬彬, 郭卫斌
    计算机工程. 2024, 50(7): 42-52. https://doi.org/10.19678/j.issn.1000-3428.0069593
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在计算机实验报告评阅过程中, 不同的实验报告评价体系呈现出多样性和差异性, 固化的实验评语模板缺乏个性化的内容, 评价结果往往未给出可解释性的依据。针对以上问题, 提出基于大语言模型的个性化实验报告评语自动生成框架。通过主题-评估决策-集成提示策略, 从教师的实验需求、代码质量需求中抽取该实验特有的评价体系, 形成评估决策树, 构建计算机软件方向课程共享的评估决策树库。设计基于大语言模型和决策树的实验要求、代码质量主题评级方法, 从评估决策树库检索匹配学生实验报告内容的评估决策树, 结合实验报告和代码文本, 自动生成实验主题、代码质量主题定量或定性的评级结果及对应的可解释性依据。在实验报告模板中融入学生已完成的实验任务、主题评级结果、评价依据等, 生成个性化的实验评语。实验结果表明, 基于主题-评估决策-集成提示策略的决策树生成结果明显优于未用提示的方法, 该策略各部分具有一定的有效性和合理性, 同时自动生成的评级结果和教师原先批阅的评阅结果对比, 软件测试、面向对象程序设计、电商金融课程示例匹配正确率均达到90%以上。从任课教师对于自动生成的评语评分分析, 评语在流畅性、相关性、合理性3个维度上达到了较高的质量水平。

  • 翟洁, 李艳豪, 李彬彬, 郭卫斌
    计算机工程. 2024, 50(7): 42-52. https://doi.org/10.19678/j.issn.1000-3428.0069593
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在计算机实验报告评阅过程中, 不同的实验报告评价体系呈现出多样性和差异性, 固化的实验评语模板缺乏个性化的内容, 评价结果往往未给出可解释性的依据。针对以上问题, 提出基于大语言模型的个性化实验报告评语自动生成框架。通过主题-评估决策-集成提示策略, 从教师的实验需求、代码质量需求中抽取该实验特有的评价体系, 形成评估决策树, 构建计算机软件方向课程共享的评估决策树库。设计基于大语言模型和决策树的实验要求、代码质量主题评级方法, 从评估决策树库检索匹配学生实验报告内容的评估决策树, 结合实验报告和代码文本, 自动生成实验主题、代码质量主题定量或定性的评级结果及对应的可解释性依据。在实验报告模板中融入学生已完成的实验任务、主题评级结果、评价依据等, 生成个性化的实验评语。实验结果表明, 基于主题-评估决策-集成提示策略的决策树生成结果明显优于未用提示的方法, 该策略各部分具有一定的有效性和合理性, 同时自动生成的评级结果和教师原先批阅的评阅结果对比, 软件测试、面向对象程序设计、电商金融课程示例匹配正确率均达到90%以上。从任课教师对于自动生成的评语评分分析, 评语在流畅性、相关性、合理性3个维度上达到了较高的质量水平。

  • 曾碧卿, 陈鹏飞, 姚勇涛
    计算机工程. 2024, 50(7): 53-62. https://doi.org/10.19678/j.issn.1000-3428.0069066
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    方面情感三元组抽取(ASTE)任务是方面级情感分析的重要子任务之一, 传统的监督学习方法在该任务上取得了SOTA或接近SOTA的效果。然而, 随着深度神经网络的发展, 生成式大型语言模型(LLM)为该任务带来了更多的可能性。目前大多数工作都是直接对LLM进行微调, 但是忽略了LLM的幻觉现象, 导致性能下降。提出一种融合思维链技术和LLM低秩自适应(LoRA)微调LFC方法, 实现生成式的ASTE新范式, 以提升任务性能。在LFC中, 首先基于思维链技术, 通过人工构造少量推理样本, 并利用LLM生成具有推理结构的增强数据集。将增强数据集用于微调ChatGLM3-6B模型的学习。在微调过程中, 采用LoRA微调技术提高在低资源环境下适配ASTE任务的效果。实验结果表明, LFC方法相比于最优的基线模型在Res14、Lap14、Res15和Res16 4个数据集上的F1值分别提升8.37、12.31、11.07和8.43个百分点, 该方法不仅能够准确地识别三元组, 而且在一定程度上优化了LLM的幻觉现象。

  • 林加艺, 夏鸿斌, 刘渊
    计算机工程. 2024, 50(7): 63-70. https://doi.org/10.19678/j.issn.1000-3428.0069517
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目前基于类比学习的数学应用题(MWP)求解的研究多从语义相似度或浅层逻辑来筛选样本, 存在样本匹配度不足以及样本选取局限于数据集的问题。针对以上问题, 提出一种新的基于类比学习的数学应用题求解(MWP-AL)模型。该模型主要从2个角度对数学应用题进行类比学习。从文本编码的角度进行样本筛选, 从余弦相似度、树解顶节点以及树深度3个维度对样本进行限制。该方法从语义层面以及深层逻辑方面对样本进行选取, 得到的样本与原题的匹配度更高。从解方程的角度进行样本构建, 从方程本身出发, 针对不同类型的方程在逻辑方面对其进行变体从而构建样本。该方法不局限于从数据集中选取样本, 具有较强的泛化性。通过计算交叉熵损失函数对这2种样本进行类比学习。实验结果表明, 在2个基线模型上加入MWP-AL模型后, 其在英文数据集MathQA和中文数据集Math23K上的准确率分别提升了1.8、2.5和2.8、1.3个百分点, 同时较其他基线模型均有所提升。

  • 谭巨全, 王然
    计算机工程. 2024, 50(7): 71-78. https://doi.org/10.19678/j.issn.1000-3428.0069491
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    由于不同运动员的动作风格和速度不同, 导致田径录像中记录的不同运动员的人体动作序列在时间长度上存在差异, 从而产生不同长度序列之间的不对齐问题。为此, 提出特征融合下田径录像三维(3D)人体动作动态时间规整(DTW)捕捉算法。将田径录像中提取的人体动作数据转换为3D坐标序列, 表示人体各部位的位置和动作, 获取人体动作的深度图序列, 利用梯度局部各向异性系数(GLAC)和稀疏时间梯度自相关(STACOG)分析深度图局部区域的梯度特性以及时间自相关性。利用Canny算子提取每帧深度图的边缘轮廓, 结合小波变换和k-means聚类分析人体轮廓的动态变化特征。通过Kinect设备获取人体骨骼点的3D坐标信息, 采用主成分分析(PCA)方法将3D空间坐标、关节角度等多个特征融合到一个特征空间中, 通过补帧和删帧操作进行预处理, 选择最重要的主成分构建新的低维特征空间。利用DTW计算视频序列的相似性, 从而捕捉田径录像中不同长度序列的3D人体动作。实验结果表明, 该算法捕捉田径录像3D人体动作的准确程度高达99.07%, 面对复杂程度较高的动作时, 该算法捕捉到的人体动作与实际动作的相似度始终保持在97%以上。此外, 所提算法提取到的人体动作轮廓特征线条流畅、连续, 且与实际动作高度一致。

  • 张朋, 严盼盼, 乔凤杰
    计算机工程. 2024, 50(7): 79-86. https://doi.org/10.19678/j.issn.1000-3428.0069440
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在滑雪教学过程中, 由于学员的迅速移动和姿态的大幅变化, 导致以短时智能图像变化特征为主的姿态跟踪算法失效或不稳定, 特别是在雪地条件恶劣或光线不足等复杂环境下, 跟踪效果会受到较大的影响。为此, 提出基于长时跟踪的滑雪教学姿态辅助矫正方法。使用递归最小二乘法(RLS)分类器训练得到学员姿态位置核相关滤波器(KCF)。计算最大的KCF响应值, 精确检测学员的姿态位置。如果KCF结果低于经验阈值, 表明目标丢失, 启动再检测模块。利用光流法在前一帧学员姿态位置附近寻找当前帧中的姿态位置, 以获取一个大致位置。在此位置重新应用跟踪器, 获得精确的学员姿态位置, 实现长时跟踪。依据得到的姿态位置数据, 构建滑雪学员姿态误差补偿模型, 提取学员身体的运动参数和姿态误差。通过计算身体运动参数, 并结合KCF构建滑雪学员身体姿态辅助矫正模型, 从而完成滑雪教学的姿态辅助矫正。实验结果表明, 该方法在长时跟踪中展现出高度的有效性、可靠性和稳定性, 其平均PCK指标达到92.3%, 同时在目标跟踪效率上, 参数量和计算量分别为30.24 MB和9.26 GFLOPs, 速度达到142帧/s, 实现了高效实时的跟踪, 验证了该方法在滑雪教学姿态辅助矫正中的可行性。

  • 周炫余, 吴莲华, 郑勤华, 肖天星, 王紫璇, 张思敏
    计算机工程. 2024, 50(7): 87-95. https://doi.org/10.19678/j.issn.1000-3428.0069415
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    面向全国的学生综合评价与发展平台采集了百万级学生跳绳运动数据用于中小学生身体素质测评, 然而在采集的跳绳视频中存在着非跳绳视频、人物未全身出镜等不符合拍摄要求的各类异常视频, 严重影响了后续学生身体素质测评模型的准确性和鲁棒性。针对上述问题, 提出一种联合语义提示和记忆增强的弱监督跳绳视频异常检测方法。该方法首先提取正常跳绳视频和异常跳绳视频的视觉特征, 将正常特征和异常特征成对训练, 增强模型对异常视频特征的感知能力; 其次设计两个自监督记忆网络分别存储和分离正常视频和异常视频的特征, 进一步增强模型的特征表达能力; 最后引入提示学习方法迁移大规模预训练模型中的多种跳绳异常类型的语义先验知识, 增强模型在样本不足的情况下对多种异常类型语义信息的理解。实验结果表明, 该方法在自建的跳绳异常检测数据集(SRAD)上的AUC为94.14%, 相较于基准方法提升了2.71个百分点, 具有较高的准确性。该方法对实现身体素质的智能测评、推动教育评价改革具有重要意义。

  • 陈增照, 王政, 郑秋雨
    计算机工程. 2024, 50(7): 96-103. https://doi.org/10.19678/j.issn.1000-3428.0069592
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    探究教师注意力对于评估课堂教师行为具有极其重要的研究价值。然而, 现有的教师注意力识别算法存在无法应对极端头部姿态角度等问题。为此, 提出一种基于6DRepNet360模型的教师注意力状态识别算法, 提升极端角度中头部姿态估计算法的准确性。相较于传统的依赖条件判断来分类教师注意力状态的方法, 设计一种基于支持向量机(SVM)的教师注意力分类模型, 对复杂头部姿态角度进行注意力状态的精准识别。为进一步解决算法稳定性和准确性带来的误差数据, 提出基于滑动窗口的数据清洗算法, 有效提高整体识别结果的真实性和可靠性。通过在构建的CCNUTeacherState数据集上进行一系列的算法评估, 实验结果表明, 所提出的教师注意力识别算法在CCNUTeacherState数据集上达到了90.67%的准确率。

  • 人工智能与模式识别
  • 钱来, 赵卫伟
    计算机工程. 2024, 50(7): 104-111. https://doi.org/10.19678/j.issn.1000-3428.0068132
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    文本分类作为自然语言处理领域的基本任务, 在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息, 导致学到的文本特征不够全面。为了充分利用训练实例信息, 提出一种基于对比学习和注意力机制的文本分类方法。首先, 设计一种有监督对比学习训练策略, 旨在优化模型对文本向量表征的检索, 提高模型在推理过程中检索到的训练实例的质量; 然后, 构建注意力机制, 对获取的训练文本特征进行注意力分布学习, 聚焦关联性更强的相邻实例信息, 获得更多隐含的相似特征; 最后, 将注意力机制与模型网络相结合, 融合相邻的训练实例信息, 增强模型提取多样性特征的能力, 实现全局特征和局部特征的提取。实验结果表明, 所提方法在卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)、图卷积网络(GCN)、BERT和RoBERTa等多个模型上都取得了显著的性能提升。以CNN模型为例, 其在THUCNews数据集、今日头条数据集和搜狗数据集上宏F1值分别提高了4.15、6.2和1.92个百分点。因此, 该方法也为文本分类任务提供了一种有效的解决方案。

  • 刘娟, 段友祥, 陆誉翕, 张鲁
    计算机工程. 2024, 50(7): 112-122. https://doi.org/10.19678/j.issn.1000-3428.0068020
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    知识图谱补全是提高知识图谱质量的重要手段, 主要分为基于结构和基于描述的方法。基于结构的补全方法对图谱中常见的长尾实体推理性能表现不佳, 基于描述的补全方法在描述信息利用和负样本信息学习方面存在不足。针对上述问题, 提出基于知识增强的知识图谱补全方法KEKGC。设计一种特定模板, 将三元组及其描述信息通过人工定义的模板转换为连贯的自然语言描述语句输入预训练语言模型, 增强语言模型对三元组结构知识与描述知识的理解能力。在此基础上, 提出一种对比学习框架来提高链接预测任务的效率与准确率, 通过建立记忆库存储实体嵌入向量, 从中选择正负样本并结合InfoNCE损失进行训练。实验结果显示, 相较于MEM-KGC, KEKGC在WN18RR数据集上链接预测任务的平均倒数秩(MRR)提升了5.5, Hits@1、Hits@3、Hits@10指标分别提升了2.8、0.7、4.2个百分点, 三元组分类任务准确率达到94.1%, 表明所提方法具有更高的预测准确率与更好的泛化能力, 尤其对于长尾实体, 能够有效提升图谱补全的效果与效率。

  • 丁伟杰, 顾斌杰, 潘丰
    计算机工程. 2024, 50(7): 123-132. https://doi.org/10.19678/j.issn.1000-3428.0068211
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    密度加权孪生支持向量回归机(DWTSVR)是一种能够反映数据内在分布的回归算法, 具有预测精度高和鲁棒性强等优点, 然而其并不适用于训练样本以增量形式提供的场景。针对该问题, 提出一种增量式稀疏密度加权孪生支持向量回归机(ISDWTSVR)。首先, 辨别新增数据是否为异常样本, 并赋予有效样本适当的权重, 减小异常样本对模型泛化性能的影响; 其次, 结合矩阵降维与主成分分析思想筛选出原始核矩阵中的一组特征列向量基代替原特征, 实现核矩阵列稀疏化, 以获得稀疏解; 接着, 借助牛顿迭代法和增量学习策略对上一时刻的模型信息进行调整, 实现模型的增量更新, 同时结合矩阵求逆引理避免增量更新过程中直接求解逆矩阵, 进一步加快训练速度; 最后, 在UCI基准数据集上进行仿真实验, 并与现有代表性算法进行比较。实验结果表明, ISDWTSVR继承了DWTSVR的泛化性能, 在大规模数据集Bike-Sharing上, 新增一个样本模型更新平均CPU时间为5.13 s, 较DWTSVR缩短了97.94%, 有效地解决了模型必须从头开始重新训练的问题, 适用于大规模数据集的在线学习。

  • 耿丽丽, 牛保宁
    计算机工程. 2024, 50(7): 133-143. https://doi.org/10.19678/j.issn.1000-3428.0068284
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    卷积神经网络(CNN)中包含大量滤波器, 参数训练以及存储占用大量内存资源。裁剪滤波器是减小网络规模、释放内存、提高计算速度的有效方法。现有滤波器裁剪方法的主要问题是将滤波器权值作为孤立的数值计算, 裁剪小权值滤波器, 保留权值大的滤波器, 忽视了部分小权值滤波器在特征提取过程中的重要性。通过分析滤波器通道之间的相似性, 提出一种基于通道相似度的滤波器熵值计算方法(FEC)。针对滤波器结构特征, 对权值张量进行均值压缩, 并证明其合理性。先计算滤波器通道距离判断通道之间的相似性, 再根据通道相似度计算滤波器熵, 由熵值大小进行滤波器排序, 删除一定比例熵值较小的滤波器。实验设计针对不同卷积层采用不同的裁剪比例, 在CIFAR10以及ImageNet标准数据集上对VGG-16和ResNet-34网络进行裁剪。实验结果表明: 在基本保持原始准确度的情况下, 分别减少了约94%和70%的参数数量; 在目标检测网络SSD上参数数量减少了55.72%, 平均精度均值(mAP)提高了1.04个百分点。

  • 刘建敏, 林晖, 汪晓丁
    计算机工程. 2024, 50(7): 144-153. https://doi.org/10.19678/j.issn.1000-3428.0068163
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的轨迹预测工作大多依赖于高精地图, 但高精地图的采集耗时长、成本高、处理复杂, 难以快速适应智能交通的大面积普及。为解决无地图场景下车辆轨迹预测问题, 提出一种基于多模态数据时空特征的轨迹预测方法。构建多个历史轨迹时空交互图, 交叉使用时间和空间注意力并进行深度融合, 以建模道路上车辆之间的时空关联性。在此基础上, 利用残差网络进行多目标多模态轨迹生成。在真实数据集Argoverse 2上进行模型的训练和测试, 实验结果表明, 相较于CRAT-Pred方法, 该模型在单模态预测方面最小平均位移误差、最小最终位移误差和未命中率指标分别提升了3.86%、3.89%、0.48%, 在多模态预测方面各项指标分别提升了0.78%、0.96%、0.42%。该方法能够有效地捕捉车辆移动轨迹的时间和空间特征, 并可在自动驾驶等相关领域得到有效应用。

  • 王彬, 张娇, 李薇, 王晓帆, 金海燕
    计算机工程. 2024, 50(7): 154-163. https://doi.org/10.19678/j.issn.1000-3428.0067039
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    协同进化框架是解决大规模全局优化问题的有效方法, 设计合理的决策变量分组方法是提高协同进化算法性能的关键, 而利用精英决策变量动态构建精英子组件可以有效提高进化效率, 但在进行大规模优化时, 其可能将无关的变量分配到同一子组件, 从而无法充分利用分组提高协同进化效率。针对该问题, 提出一种精英贡献两阶段动态分组算法(EC-TSDG)。在分组前阶段, 对变量进行随机分组, 评估变量的贡献程度, 从众多变量中寻找精英贡献变量; 在分组后阶段, 利用变量的相关关系寻找与精英决策变量存在相互作用的剩余变量, 并将其合并形成精英子组件, 使得精英子组件内部的变量两两相关, 以此提高变量分组的准确性以及算法的收敛速度, 避免子组件之间的相关干扰。最后, 采用具有外部存档的自适应差分进化算法作为优化器进化各个子组件。在CEC'2013测试集上与其他先进算法进行比较, 实验结果表明, EC-TSDG收敛速度快于对比算法, Friedman检验值为1.43, 平均排序较对比的动态分组算法DCC平均提升36.78%。

  • 网络空间安全
  • 张洋, 刘畅, 李少青
    计算机工程. 2024, 50(7): 164-173. https://doi.org/10.19678/j.issn.1000-3428.0068248
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着全球化的不断深入, 第三方知识产权(IP)核应用越来越广泛。随着硬件木马攻击技术逐渐成熟, 使得在芯片设计阶段植入硬件木马成为可能。因此, 在芯片设计过程中面临IP核被植入木马的严重威胁, 现有研究所提的硬件木马检测方法具有依赖黄金参考电路、需要完备的测试向量、大量的样本进行学习等特征。面向IP核的硬件木马检测需求, 提出一种基于可控制性度量的图神经网络检测方法。该方法以门级网表作为输入, 首先以可控制性值为指导, 得到可疑的门节点, 用于缩小搜索范围; 然后利用可疑门节点生成对应的子图, 利用图卷积神经网络从子图中提取特征, 实现对子图的分类和检测, 最终识别硬件木马。实验结果表明, 该方法无须测试激励和黄金模型, 利用硬件木马的隐蔽特性与结构特征相结合的方法提升硬件木马的检测准确率, 平均真阳率为100%, 假阳率为0.75%, 在保证较高真阳率的同时可有效降低假阳率, 达到较好的检测效果。

  • 郑清安, 董建成, 陈亮, 阮英清, 李锦松, 许林彬
    计算机工程. 2024, 50(7): 174-186. https://doi.org/10.19678/j.issn.1000-3428.0068120
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    相较于传统的分布式数据库系统, 区块链技术在处理记账事务方面展现出更好的分布性、透明性和可信性, 且传统中心化数据库系统存在严重的隐私泄露问题。针对传统中心化数据管理机制中存在的信任问题和隐私泄露问题, 提出一种支持隐私保护的分布式可信数据管理模型。该模型采用分布式存储、数据隐私保护、访问控制和分布式身份等关键技术来实现数据的可信管理和协同隐私保护。在数据隐私保护方面, 基于同态加密和零知识证明算法协议保障用户的数据隐私。在数据访问控制方面, 结合链上群组隔离机制和节点存储落盘加密技术实现数据访问控制, 将隐私控制回归属主。在用户身份隐私保护方面, 利用分布式身份技术将物理身份和可验证凭证进行链下存储, 将实体信息最小化或根据需要在受控范围内共享。搭建系统原型并测试系统区块链吞吐量, 结果表明, 针对get请求, 每秒完成的事务数(TPS)达到811.2, set请求的TPS达到225.5, 正确率均为100%。系统测试结果验证了该模型在功能性、安全性和可行性方面符合预期, 性能较优。

  • 周昱, 于宗光
    计算机工程. 2024, 50(7): 187-193. https://doi.org/10.19678/j.issn.1000-3428.0068443
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    物理不可克隆函数(PUF)是芯片制造过程中随机偏差形成的唯一和不可复制的物理指纹, 使用这个特征可以鉴别各个芯片, 然而PUF芯片因环境变化会影响输出, 导致在认证应用时可能失败。介绍了模糊提取器的密钥提取方法, 通过在静态随机存取存储器(SRAM)-PUF芯片中加入里德-所罗门(RS)硬解码, 在认证系统中加入BCH软解码模块, 纠正PUF在一定范围内变化来确保通过认证, 并对SRAM-PUF电路在三温下进行实验分析。实验结果表明, SRAM-PUF电路的PUF点分布有较好的均衡性, 在常温时可靠性接近100%, 在低温条件下可靠性范围为98.84%~100%, 在高温条件下, 可靠性范围为97.77%~99%, 当RS码和BCH码设计的纠错能力大于PUF可靠性时能够通过认证。

  • 移动互联与通信技术
  • 陈姣, 沈艳
    计算机工程. 2024, 50(7): 194-203. https://doi.org/10.19678/j.issn.1000-3428.0067932
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在移动边缘计算(MEC)环境下, 用户需求快速增长, 但由于移动设备的计算和存储资源受限, 时延和能耗问题日益突显。此外, 任务的重复卸载和处理也进一步加剧了时延和移动设备的高能耗问题。针对上述问题, 提出一种带有缓存机制的移动边缘计算任务卸载方案来减少任务卸载过程中的时延和能耗。首先, 基于任务的流行度、新鲜度、数据大小等因素设计一个缓存机制, 根据该机制的结果设计缓存更新策略。然后, 针对任务卸载和缓存问题, 建立一个联合优化模型, 优化模型以最小化系统总成本为目标, 考虑了任务卸载和缓存对移动设备时延和能耗的影响。为求解这一复杂的优化模型, 通过添加惩罚函数的形式将约束条件加入目标函数, 并采用粒子群优化(PSO)算法获得任务卸载和缓存的最优决策。实验结果表明, 与传统的无缓存的本地计算、无缓存的任务卸载、使用随机缓存的任务卸载等方案相比, 该方案的总时延降低了37.00%以上, 缓存命中率提高了7.78%以上, 具有较高的缓存资源利用率。

  • 牛瑞婷, 严天峰, 高锐, 王映植
    计算机工程. 2024, 50(7): 204-215. https://doi.org/10.19678/j.issn.1000-3428.0068243
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    将深度学习算法应用于调制识别任务是近年来通信领域的一个研究热点, 但现有方法存在网络复杂度高、硬件要求高、在低信噪比(SNR)下识别准确率不高等问题。结合离散小波变换方法, 提出一种基于双路卷积神经网络级联可分离卷积网络(TCNN-MobileNet)的调制识别方法。首先通过小波变换对数据进行预处理, 将信号作为输入传送到双路卷积神经网络中进行不同维度的特征提取; 然后通过融合层进行特征融合并送入轻量级神经网络MobileNetV1中, 进行调制识别模型训练; 最后通过全连接层进行11种调制识别的分类输出。在公开数据集RML2016.10a上的实验结果表明, 在-20 dB的低SNR下TCNN-MobileNet的识别准确率可达88.71%, 在18 dB的高SNR下识别准确率可达96.66%, SNR在-20~18 dB范围内时平均识别准确率为88.37%, 相比于ResNet18、ResNet34等经典网络架构提升了约35%。TCNN-MobileNet识别方法在保证识别精度不变的情况下能够降低训练参数量以及网络训练时间, 有效简化网络架构, 降低对硬件设备的要求, 对轻量级神经网络在调制识别中的应用具有借鉴意义。

  • 图形图像处理
  • 屠乃威, 焦猛, 阎馨
    计算机工程. 2024, 50(7): 216-226. https://doi.org/10.19678/j.issn.1000-3428.0068852
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了解决复杂环境下电力巡检无人机对输电线路鸟巢识别精度低、错检漏检率高、定位不准等问题, 在YOLOv5s模型的基础上, 提出一种用于输电线路鸟巢目标检测的改进YOLO-nc-kd模型。设计一种高效的多尺度卷积特征融合模块(MCFFM), 实现不同尺度下的高效特征提取, 使模型能获得更加丰富和多样化的特征表示。引入注意力机制, 提升主干网络在相似环境背景下的鸟巢特征提取能力。设计改进的定位损失函数, 提高边界框的定位精度和小目标检测能力。使用知识蒸馏技术, 进一步提升模型精度。实验结果表明, 改进YOLO-nc-kd模型的准确率、召回率以及平均精度均值(mAP)相较于YOLOv5s模型分别提升了7.3、5.6、4.9个百分点, 具有较好的输电线路鸟巢目标图像检测效果。

  • 周小华, 周园春, 孟珍, 王学志
    计算机工程. 2024, 50(7): 227-239. https://doi.org/10.19678/j.issn.1000-3428.0068142
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    遥感数据规模庞大且增长迅速, 目前可公开访问的遥感影像数据已接近EB级别, 然而类型多样、结构复杂、存储文件大等特点给大规模开放遥感数据的发现、共享与使用带来诸多不便。在线地图可使用户无须下载便可对海量云端遥感数据执行可视化分析, 是一种高效的数据服务方式。针对传统地图技术方案存在的瓦片渲染效率低、遥感数据适配性差等问题, 从遥感数据时空属性特征及用户访问行为特征出发, 依托遥感数据云平台GSCloud, 设计并实现面向海量遥感数据的高效地图服务平台TiMap。TiMap由分布式地图瓦片渲染引擎TiRender与分布式地图瓦片缓存TiCache构成。TiRender通过将地图瓦片渲染操作转换为分布式环境下的同步实时渲染任务与异步批量预渲染任务, 充分利用多节点并行计算的优势, 快速响应客户端的地图瓦片请求。TiCache负责缓存TiRender产生的地图瓦片, 以提升后续重复地图瓦片请求的响应速度, TiCache中的地图瓦片缓存分配算法基于疏远度实现, 可以保证多节点的负载均衡。实验结果表明, TiRender与TiCache均比同类技术方案的性能更好, 两者协同工作可使TiMap在100 ms内快速响应大规模地图瓦片请求。

  • 张溢文, 蔡满春, 陈咏豪, 朱懿, 姚利峰
    计算机工程. 2024, 50(7): 240-250. https://doi.org/10.19678/j.issn.1000-3428.0067789
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着深度学习的快速发展, 深度伪造技术作为一种基于深度学习生成模型的图像篡改技术迅速兴起。深度伪造视频图像的泛滥给国家和社会安全带来了负面影响, 使得深度伪造检测技术的重要性日益凸显。然而, 现有基于卷积神经网络(CNN)或ViT的深度伪造检测技术普遍存在模型参数量大、训练速度慢、容易过拟合、应对视频压缩或噪声的鲁棒性差等问题。为此, 提出一种融合空间特征的多尺度深度伪造检测方法。首先采用自动白平衡(AWB)算法对输入图像进行对比度调整, 以增强模型的鲁棒性; 然后利用MViT和CNN分别提取输入图像的多尺度全局和局部特征; 接着提出一种改进的稀疏交叉注意力机制, 对用MViT提取的全局特征和用CNN提取的局部特征进行融合, 提升模型的识别效果; 最后针对融合后的特征, 通过多层感知机(MLP)进行分类。实验结果表明, 该方法在Deepfakes、FaceSwap和Celeb-DF(v2)数据集上的帧水平AUC分别达到0.986、0.984和0.988, 且在跨压缩率实验中表现出了较强的鲁棒性, 模型改进前后的对比也验证了所提各模块对检测结果的提升作用。

  • 逯焕宇, 张永宏, 马光义, 谢东林, 田伟
    计算机工程. 2024, 50(7): 251-263. https://doi.org/10.19678/j.issn.1000-3428.0068129
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    语义分割技术被广泛应用于遥感图像水体提取任务中, 然而语义分割的结果极大依赖于数据集的规模, 针对遥感图像中水体数据集较少、获得精准标注数据成本高的问题, 提出一种用于水体提取的半监督对抗语义分割方法。作为生成器的分割网络中的卷积操作具有受限的感受野, 缺乏对长距离上下文关系的建模能力, Transformer能够建模图像的全局信息。该方法在分割网络中采用Swin Transformer建模深层特征的全局上下文信息, 挖掘像素之间的语义关系, 提高网络的特征提取能力。采用双卷积块提取图像的局部特征, 保留高分辨率细节信息。特征增强模块(FEM)用于抑制图像的背景噪声干扰, 进一步提高水体提取的精度。分割网络和判别器网络共同训练, 以提高在使用少量有标签数据条件下模型提取水体的性能。在GID数据集上进行大量实验, 结果表明, 该方法在不同比例有标签数据条件下均提高了水体提取的精度, 在仅1/8有标签数据的条件下, 该方法取得的F1-Score和交并比(IoU)分别为90.02%和81.86%, 优于U-Net、MWEN等语义分割网络。

  • 李云航, 潘晴, 田妮莉
    计算机工程. 2024, 50(7): 264-270. https://doi.org/10.19678/j.issn.1000-3428.0067853
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的多模态医学图像融合方法存在结构信息以及相位特征保存不完整的问题, 为此, 提出一种基于混合多尺度分解和结构相似度优化的医学图像融合方法。首先, 针对单一滤波器在保留图像结构和细节方面的局限性, 提出一种多尺度分解潜在低秩表示(MDLatLRR)和非下采样轮廓波变换(NSCT)相结合的混合多尺度分解方法, 利用MDLatLRR分解源图像获取低秩层和显著层, 使用NSCT对低秩层做进一步分解; 其次, 在基础层上使用基于局部拉普拉斯能量和的融合规则, 使融合图像具有更好的视觉效果, 对于细节层, 通过脉冲耦合神经网络(PCNN)计算全局耦合以获得融合权重, 从而融合细节层; 最后, 考虑到空间一致性, 由初始融合图像获取线性调整图像, 利用加权局部结构相似度进行测量从而得到修正系数, 并对初始融合图像进行修正, 提高融合图像中信息的准确性。实验结果表明, 相比于MSMG、EMFusion、CFL等9种方法, 该方法在归一化互信息、空间频率误差比等10个客观评价指标上评估性能更高, 特别在相位一致性、余弦特征互信息以及差异相关和指标上, 分别比次优方法平均提升了13.89%、19.62%和35.8%, 所提方法的融合图像具有更丰富、更准确的细节信息和良好的视觉效果。

  • 肖慈, 徐杨, 张永丹, 冯明文, 黄易仟
    计算机工程. 2024, 50(7): 271-281. https://doi.org/10.19678/j.issn.1000-3428.0068104
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着深度学习技术的发展和计算能力的提升, 对白天拍摄的自然场景图像进行语义分割能够取得良好的效果。然而, 在夜间图像语义分割任务中, 由于存在曝光不平衡、缺乏标记数据等问题, 由白天数据训练的模型往往无法取得良好的表现。为此, 提出一种新的无监督夜间图像语义分割网络(AI-USeg)。首先, 使用一个轻量级的自校准照明网络(SCI)对夜间图像进行增强, 以减少光照变化对后续语义分割网络的影响; 其次, 引入领域自适应(DA)方法, 将模型从包含大量有标签数据的Cityscapes自适应到Dark Zurich-D, 解决缺乏标记数据的问题; 随后, AI-USeg在基于全卷积网络(FCN)实现的判别器中引入SENet, 通过在输出空间进行对抗学习来适应夜间低光照环境下的图像特征, 以提升夜间图像语义分割任务的效果。实验使用Cityscapes和Dark Zurich-train中的2 416个昼夜图像对进行无监督训练, 结果表明, AI-USeg在Dark Zurich-test和Nighttime Driving-test上的平均交并比(mIoU)分别达到了47.9%和51.5%, 相较于MGCDA方法分别提高了5.4和2.1个百分点。AI-USeg对夜间图像的特征适应性更强, 具有更高的鲁棒性, 为夜间场景下的图像分割任务提供了一种有效的解决方案。

  • 张诗婧, 莫绪涛, 赵行, 董杨林
    计算机工程. 2024, 50(7): 282-292. https://doi.org/10.19678/j.issn.1000-3428.0068237
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    螺母在机械制造环节得到广泛应用, 其内壁螺纹质量对于机械联接至关重要。为了实现螺母内螺纹的非接触缺陷检测, 首先提出一种基于球面折反射全景成像原理的图像采集装置, 其次利用该装置采集图像数据集并提出一种基于改进YOLOv7的缺陷检测算法。该成像装置具备一次性成像、无须伸入内壁、采集到的内螺纹图像细节完整等优势, 有效地改进了传统视觉检测方案存在的成像分辨率低、相机视场占比小的问题。对YOLOv7模型进行改进并结合螺母内螺纹的缺陷特征, 使用k-means++算法聚类锚框, 使得模型训练更容易收敛。通过在特征融合网络中加入坐标注意力(CA)机制, 提高网络的特征表达能力。使用SIoU损失函数替换原YOLOv7模型中的CIoU损失函数, 提高模型分类的准确性和可靠性。实验结果表明, 针对缺口、漏攻纹、刮痕、碎屑4种内螺纹缺陷, 改进后的YOLOv7模型的平均精度(AP)分别达到96.89%、100%、98.07%、99.98%, 平均精度均值(mAP)达到98.74%, 检测速度达到39.64帧/s, 与其他常见模型相比, 改进模型精度更高, 能够满足工业现场的实时检测需求。

  • 张锡英, 孙守东, 于海浩, 边继龙
    计算机工程. 2024, 50(7): 293-302. https://doi.org/10.19678/j.issn.1000-3428.0068126
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对多视图三维重建任务中点云完整性欠佳的问题, 提出一种基于空间传播的多视图深度估计网络(SP-MVSNet)。引入空间传播思想用于复杂条件下的稠密点云重建, 并分别设计基于空间传播的混合深度假设策略和空间感知优化模块。混合深度假设策略采用由粗糙到精细的深度推理方式, 将深度估计视为多标签分类任务, 对正则化概率体执行交叉熵损失以约束代价体, 从而避免回归方法过拟合和收敛速度过慢的问题。空间感知优化模块从包含高级语义特征表示的特征图中获得引导, 在进行置信度检查后采用卷积空间传播网络, 通过构建亲和矩阵来细化最终的深度图。同时, 为解决大多数方法存在的对不满足多视图一致性的不可靠区域重建质量较低的问题, 进一步结合注意力机制设计具有样本自适应能力的动态特征提取网络, 用于增强模型的局部感知能力。实验结果表明, 在DTU数据集上, SP-MVSNet的重建完整性相比于CVP-MVSNet提升32.8%, 整体质量提升11.4%。在Tanks and Temples基准和BlendedMVS数据集上, SP-MVSNet的表现也优于大多数已知方法, 取得了良好的三维重建效果。

  • 杨露露, 马萍, 王聪, 李新凯, 孟月, 张宏立
    计算机工程. 2024, 50(7): 303-313. https://doi.org/10.19678/j.issn.1000-3428.0068244
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对基于深度学习的绝缘子缺陷检测方法存在泛化性能低、难以识别复杂背景下的绝缘子等问题,从特征提取和融合角度出发,提出一种结合特征重用与重建的YOLO(YOLO-RR)模型的绝缘子缺陷检测方法。首先,在特征提取阶段,以DenseNet为基础构建dense35网络作为主干网络,通过特征的重用增加对特征细节的感知能力,提升了模型在低饱和度和低对比度成像情况下的检测精度,并降低了网络参数量。其次,在特征融合阶段,提出基于沙漏模块的双向特征金字塔网络(H-BiFPN)结构进行不同尺度特征间的双向融合,通过特征重建和融合丰富了不同尺度的特征信息,解决了连续卷积下小目标信息丢失的问题,提升了对小目标的检测精度。最后,使用Wise-交并比(WIoU)损失函数优化模型,通过重点关注普通锚框使预测更加精准。在扩充后的中国输电线路绝缘子数据集(CPLID)上的实验结果表明,YOLO-RR模型识别率达到93.6%,网络参数量压缩至5.16×106,优于对比模型,能够满足绝缘子缺陷定位的准确性和实时性要求,同时在背景干扰较大、受光照影响的成像上也有很好的检测效果。

  • 杨郅树, 梁佳楠, 曹永军, 钟震宇, 何永伦
    计算机工程. 2024, 50(7): 314-323. https://doi.org/10.19678/j.issn.1000-3428.0067857
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目前基于深度学习的超分辨率重建网络存在卷积运算冗余、图像重建信息不完整、模型参数庞大等问题,限制了其在边缘设备上的适用性。针对上述问题,提出一种轻量级的局部分离与多尺度融合图像超分辨率重建网络,该网络利用局部卷积对图像进行特征提取,通过分离部分图像通道,在减少网络冗余计算的同时保持图像重建的质量。设计一种多尺度特征融合模块,在空间维度学习长依赖特征,并采用一个通道注意力增强组在空间维度捕获空间特征,减少图像重建信息的丢失,有效恢复图像的细节纹理。由于多尺度特征融合模块更多地是从全局角度进行特征提取融合,因此构建一种高效反残差模块补充网络的局部上下文信息提取能力。在Set 5、Set 14、B 100、Urban 100、Manga 109这5个基准数据集上的实验结果表明,当尺度因子为2、3、4倍时,该网络的参数量分别为373 000、382 000、394 000,FLOPs分别为84.0×109、38.1×109、22.1×109。与VDSR、IMDN、RFDN、RLFN等网络相比,该网络在较少网络参数的情况下,能够保证图像重建效果。

  • 开发研究与工程应用
  • 王晋涛, 秦昂, 张元, 陈一飞, 王廷凤, 谢承霖, 邹刚
    计算机工程. 2024, 50(7): 324-332. https://doi.org/10.19678/j.issn.1000-3428.0067645
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对基于字符表示的中文医学领域命名实体识别模型嵌入形式单一、边界识别困难、语义信息利用不充分等问题, 一种非常有效的方法是在Bret底层注入词汇特征, 在利用词粒度语义信息的同时降低分词错误带来的影响, 然而在注入词汇信息的同时也会引入一些低相关性的词汇和噪声, 导致基于注意力机制的Bret模型出现注意力分散的情况。此外仅依靠字、词粒度难以充分挖掘中文字符深层次的语义信息。对此, 提出基于注意力增强与特征融合的中文医学实体识别模型, 对字词注意力分数矩阵进行稀疏处理, 使模型的注意力集中在相关度高的词汇, 能够有效减少上下文中的噪声词汇干扰。同时, 对汉字发音和笔画通过卷积神经网络(CNN)提取特征, 经过迭代注意力特征融合模块进行融合, 然后与Bret模型的输出特征进行拼接输入给BiLSTM模型, 进一步挖掘字符所包含的深层次语义信息。通过爬虫等方式搜集大量相关医学语料, 训练医学领域词向量库, 并在CCKS2017和CCKS2019数据集上进行验证, 实验结果表明, 该模型F1值分别达到94.90%、89.37%, 效果优于当前主流的实体识别模型, 具有更好的识别效果。

  • 刘树林, 李红军, 甘雨金, 罗茜雅
    计算机工程. 2024, 50(7): 333-341. https://doi.org/10.19678/j.issn.1000-3428.0068215
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    细粒度城市流量推断(FUFI)旨在从粗粒度交通流量中推断出真实的细粒度交通流量, 以代替在现实世界中大量传感器设备的作用。现有的FUFI方法仅考虑到时间、天气等外部因素特征, 忽略了道路网络特征对城市交通流的重要影响。此外, 现有方法使用的传统残差网络结构对交通流的低级特征捕获能力不足, 低级特征容易在网络深层消亡。为解决以上问题, 提出一种使用线性低秩卷积与全局注意力Transformer的细粒度城市流量推断模型LLCGAT, 以更好地捕获交通流的低级特征并融合道路网络特征的学习。该模型在考虑外部因素的基础上, 首先将城市的道路网络作为重要的特征与交通流特征融合, 并使用广泛激活的线性低秩卷积对综合特征进行特征提取, 然后将综合特征与道路网络特征分别接入注意力Transformer的编码器和解码器中以进一步捕获交通流的全局空间分布。在TaxiBJ-P1和XiAn两个真实世界数据集上的实验结果表明, LLCGAT模型将平均绝对百分比误差分别降低了3.3%和10.7%, 均方根误差分别降低了2.3%和2.4%, 平均绝对误差分别降低了3.8%和6.3%。

  • 贵向泉, 刘世清, 李立, 秦庆松, 李唐艳
    计算机工程. 2024, 50(7): 342-351. https://doi.org/10.19678/j.issn.1000-3428.0068125
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对当前景区行人检测具有检测精度低、算法参数量大和现有公开数据集在小目标检测上存在限制等问题, 创建TAPDataset行人检测数据集, 弥补现有数据集在小目标检测方面的不足, 并基于YOLOv8算法, 构建一种检测精度高、硬件要求低的新模型YOLOv8-L。首先引入DepthSepConv轻量化卷积模块, 降低模型的参数量和计算量。其次采用BiFormer注意力机制和上采样算子CARAFE, 加强模型对图像的语义理解和信息融合能力, 提升模型的检测精度。最后增加一层小目标检测层来提取更多的浅层特征, 从而有效地改善模型对小目标的检测性能。在TAPDataset、VOC 2007及TAP+VOC数据集上的实验结果表明, 与YOLOv8相比, 在FPS基本不变的情况下, 在TAPDataset数据集上, 模型的参数量减少了18.06%, mAP@0.5提高了5.51%, mAP@0.5∶0.95提高了6.03%;在VOC 2007数据集上, 模型的参数量减少了13.6%, mAP@0.5提高了3.96%, mAP@0.5∶0.95提高了6.39%;在TAP+VOC数据集上, 模型的参数量减少了14.02%, mAP@0.5提高了4.49%, mAP@0.5∶0.95提高了5.68%。改进算法具有更强的泛化性能, 能够更好地适用于景区行人检测任务。

  • 林芷薇, 杨祖元, 王斯秋, 杨超
    计算机工程. 2024, 50(7): 352-359. https://doi.org/10.19678/j.issn.1000-3428.0068140
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    运动员在比赛过程中的快速移动且频繁遮挡, 使得对视频中运动员检测容易出现漏检、多检、检测精度下降等问题。现有的主流方法对于移动和遮挡情况下的运动员检测表现不佳。当运动员受到遮挡后, 检测目标框的尺度变化增大。引入cutout作为数据增强的方法来模拟遮挡情况, 提出基于多尺度线性全局注意力EfficientViT模块的运动员检测算法。使用线性全局注意力模块减少计算量, 并辅以卷积模块来增强其局部的特征提取能力, 通过轻量级小卷积聚合不同注意力头部的token获得多尺度信息, 增强其全局特征提取能力。针对损失函数部分, 选择EIoU作为边界框损失, 加入检测框与目标框的宽高距离, 使得检测框和真实目标框在尺度上更为贴近。在SportsMOT数据集中4个公开的篮球比赛视频数据集上的实验结果表明, 该算法取得了98.0%准确率和98.2%的平均精度均值, 相较于YOLOv5算法, 其精度提升了4%, 高置信度的平均精度均值提升了8.7%。

  • 张正康, 杨丹, 聂铁铮, 寇月
    计算机工程. 2024, 50(7): 360-371. https://doi.org/10.19678/j.issn.1000-3428.0068187
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    图自监督学习方法近年来被应用于疾病诊断任务中以缓解医疗标签信息缺乏和人工标注问题。然而, 图自监督学习的性能主要依赖于高质量的正样本和负样本, 这限制了疾病诊断的灵活性和泛用性。此外, 在构建医疗异构属性图时没有充分利用病人的多模态数据, 影响了疾病诊断的性能。提出一个基于医疗异构属性图结构聚类的自监督学习疾病诊断框架SC4DD。该框架利用病人的结构化数据和非结构化临床文本摘要构建医疗异构属性图, 通过图上的结构聚类算法生成节点的伪标签。考虑到不同元路径对学习病人嵌入表示的重要性以及不同模态医疗数据对疾病诊断结果的影响程度, 引入注意力机制的异构图神经网络作为编码器, 伪标签作为自监督信号辅助编码器学习注意力系数和病人嵌入表示。在MIMIC-Ⅲ数据集上的实验结果表明, SC4DD优于传统基线方法, 能够有效提高疾病诊断的性能。其中, 相较于性能最优的基线方法HeCo, SC4DD在2%、3%、4%标记节点下的宏平均F1值分别提高了1.46%、0.97%、0.94%, 微平均F1值分别提高了0.91%、0.84%、0.52%。

  • 火久元, 王虹阳, 巨涛, 胡军
    计算机工程. 2024, 50(7): 372-380. https://doi.org/10.19678/j.issn.1000-3428.0068282
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为解决人体健康评估方法个性化监测不足的问题以及在满足不同场景下健康状态精细化评估的需求, 需要一种基于多场景的人体健康状态评估方法来实现长期自动化监测。提出一种基于层次分析法(AHP)和熵权法(EWM)组合的多场景人体健康状态评估模型。首先采集人体在运动、休息、工作/学习和娱乐等4种不同场景下的健康监测指标数据, 构建相应的评估指标体系。然后分别根据评估指标计算出AHP和EWM权重, 再采用量子粒子群优化(QPSO)算法对AHP和EWM中的主客观权重进行分配, 以确保评价指标占比的客观性。最后通过模糊综合评价法对人体健康状态进行评估和量化, 并利用实际监测数据对方法的可靠性和稳定性进行验证。实验结果表明, 在4种场景下所提方法的综合得分分别为63.78、59.83、58.71和59.21, 表明在不同场景下该模型都具有较好的准确性和稳定性。根据评估结果, 对测试者的身体状态评价结果进行分析, 并给出一些健康建议。所提模型可全面了解人体在不同场景下的健康状况, 并为人们提供科学的健康指导, 从而为健康管理和疾病预防提供科学依据。