作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2024年, 第50卷, 第6期 刊出日期:2024-06-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2024, 50(6): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 徐明亮, 李芳媛, 马浩然, 何飞
    计算机工程. 2024, 50(6): 1-34. https://doi.org/10.19678/j.issn.1000-3428.0069014
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    峰电位聚类是指在进行细胞外神经记录时,从神经电极记录中检测、聚类并确认出不同峰电位信号,并以一定的可靠度与假定的不同神经元对应。它是对细胞外神经记录进行预处理分析的基本步骤,也是神经科学中神经解码的首要步骤,更是当前高带宽脑机接口(BCI)的重要研究方向之一。传统峰电位聚类包括峰电位检测、峰电位对齐、特征提取、特征聚类等步骤。当前,随着神经电极数量和密度不断增加,神经记录的规模呈爆炸式增长,这对峰电位聚类算法的效率和精度提出重大挑战。此外,针对现有峰电位聚类算法特征提取和表征能力不强、信噪比低、信息混叠等问题,各种算法增强方案乃至人工智能和大数据峰电位聚类方案应运而生,极大促进了对大脑复杂原理和工作机制的理解。研究首先概述侵入式BCI、神经编解码与峰电位聚类的相关性,接着阐述了各类峰电位聚类算法的原理和一般过程,并探讨了大脑神经信号与具体行为的映射关系与应用,最后展望了未来神经编解码所面临的挑战和发展趋势。
  • 刘金硕, 文尧
    计算机工程. 2024, 50(6): 35-47. https://doi.org/10.19678/j.issn.1000-3428.0068234
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现有模板代码生成方法不支持多图形处理器(GPU)、调优不充分等问题,提出一种由领域专用语言(DSL)描述的模板代码的自动生成与调优框架。在代码自动生成阶段,该框架能够自动解析上层提供的描述语言,构建计算图进而生成模板运算的统一计算设备架构(CUDA)核函数,同时根据单GPU或多GPU环境生成不同的主机端代码。在代码调优阶段,根据不同的GPU型号确定候选参数范围,动态调用生成的CUDA核函数以确定最优参数。在多GPU的情况下,自动生成的主机端代码能够使用计算与通信重叠的方法进行边界数据交换。在4种不同的GPU与7、13、19、27点模板运算中,该框架能找到最优的参数配置。实验结果表明,对于Tesla V100-SXM2,以调优过的参数进行模板运算,该框架在单精度4种模板运算下的每秒万亿次浮点运算数(TFLOPs)分别为1.230、1.680、1.120、1.480,在双精度下分别为0.690、1.010、0.480、1.470,平均性能达到手工优化代码的98%,并且描述更简单,支持多GPU扩展。
  • 魏琢艺, 罗迈, 李文兵, 曾远松, 余伟江, 杨跃东
    计算机工程. 2024, 50(6): 48-55. https://doi.org/10.19678/j.issn.1000-3428.0067378
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    单细胞核糖核酸(RNA)测序技术被成功应用于产生人体组织和器官的高分辨率细胞图谱,这加深了研究者们对人类疾病组织中细胞异质性的理解。细胞注释是单细胞RNA测序数据分析中非常关键的一步,许多典型的模型利用一个有标签的单细胞参考数据集去注释目标数据集,但目标数据集中部分细胞类型可能不在参考数据集中。整合多个参考数据集可以更好地覆盖目标数据集中的细胞类型,然而多个参考数据集和目标数据集之间存在因测序技术差异等原因造成的批次效应。为此,提出一种基于多源域适应的单细胞分类模型,利用多个已标注细胞类型的参考数据集分别与未标注细胞类型的目标数据集进行对抗训练,消除了批次效应。采用虚拟对抗训练,进一步提升模型预测结果对数据点周围局部微小扰动或噪声的鲁棒性,防止过拟合。在多个单细胞数据集上的实验结果表明,该模型比目前主流模型的细胞识别精度至少提升了5个百分点,为新测序的单细胞身份鉴定提供了新的选择和参考。
  • 李亚康, 陈刚
    计算机工程. 2024, 50(6): 56-64. https://doi.org/10.19678/j.issn.1000-3428.0068179
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    小角中子散射(SANS)实验数据的分析过程需要科研人员选择样品对应的物理模型进行迭代拟合来表征样品的结构和属性。目前选择物理模型的方法大多是基于人工经验,分析门槛高、准确率较低。基于标准神经网络模型的小角中子散射实验样品物理模型自动化筛选方法面临着图像缺乏局部特征、类内差异大、类间差异小等问题。设计双模态特征融合卷积神经网络(BFF-CNN)模型,先引入物理感知的傅里叶-贝塞尔变换(FBT)来提取散射图像的全局结构信息,再将原始图像与FBT变换图像通过两个子网络分别进行特征提取与特征融合,以提升神经网络整体的特征表达能力。提出受限Softmax(R-Softmax)损失函数,通过在原生Softmax损失函数的基础上添加惩罚项来限制输入样本被分配到非本真类的概率,可在Softmax损失接近0时缓解梯度的消失问题,进而提高收敛速度。在自建的小角中子散射图像数据集上的实验结果表明,BFF-CNN的预测准确率和平均召回率相比于ResNet-18、PMG等模型提升幅度较大,采用R-Softmax与中心损失函数的联合学习策略后的预测准确率和召回率相比只采用Softmax损失函数提升了5.4和10.5个百分点,具有较好的小角中子散射图像分类效果。
  • 秦媛, 张杭, 朱宏鹏, 李炯, 胡航
    计算机工程. 2024, 50(6): 65-76. https://doi.org/10.19678/j.issn.1000-3428.0069649
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    移动无人机(UAV)集群可以对卫星多输入多输出(MIMO)通信系统下行链路近距离实施压制式恶意干扰,导致接收信号的信干比(SIR)很低,严重影响通信质量。由于移动无人机信号的传输具有快衰落特性,因此此类扰信混合不仅具有时变性,而且存在突变性。采用盲源分离(BBS)算法实现扰信分离,提出一种部分回溯自适应变步长动量项等变自适应盲分离(PR-V-M-EASI)算法。算法以自适应变步长动量项EASI算法为基础,将串音误差作为分离性能指标自适应调整步长和动量项因子,加快算法的迭代速度,以适应混合矩阵的时变性。此外,算法还通过部分回溯分离的方式提升混合矩阵突变阶段的分离性能,降低分离算法的复杂度。仿真结果表明, PR-V-M-EASI算法能够在不影响收敛速度的前提下改善混合矩阵突变导致的分离精度下降,可有效对抗移动无人机集群施放的强恶意干扰。
  • 人工智能与模式识别
  • 李子杰, 周菊香, 韩晓瑜, 甘健侯, 鹿泽光, 王俊
    计算机工程. 2024, 50(6): 77-85. https://doi.org/10.19678/j.issn.1000-3428.0067528
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    知识追踪是人工智能技术与教育相结合的新兴领域,旨在通过学生过去完成习题的交互序列对学生的知识状态进行评估,是实现大规模个性化学习服务的关键核心技术。随着深度学习在计算机视觉、自然语言处理、推荐系统等领域的广泛应用,知识追踪领域也出现了大量基于神经网络的方法,简称深度知识追踪(DKT)模型。针对目前已有DKT模型在可解释性和准确性方面的不足,提出一种序列特征与学习过程融合的知识追踪模型SLKT,模型包括知识状态模块、序列特征模块、预测模块。知识状态模块用以模拟学生学习过程,序列特征模块捕捉学习者近期学习状况。通过序列特征和学习过程的融合,有效解决了基于知识状态建模方法无法考虑学习者近期学习状况的问题,同时提出一种带约束的动态Q矩阵表示练习和知识点之间的关系,从而更好地进行学习者学习过程建模,在确保较好可解释性的同时有效提升模型的准确性。在3个知识追踪领域公共数据集上的实验结果表明,相比DKT、动态键值记忆网络(DKVMN)、自注意力的知识追踪(SAKT)、卷积知识追踪(CKT)等深度追踪模型,SLKT模型在曲线下面积(AUC)、准确率指标评估中表现较优。
  • 陈佳玉, 王元龙, 张虎
    计算机工程. 2024, 50(6): 86-93. https://doi.org/10.19678/j.issn.1000-3428.0068081
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    预训练语言模型在大规模训练数据和超大规模算力的基础上,能够从非结构化的文本数据中学到大量的知识。针对三元组包含信息有限的问题,提出利用预训练语言模型丰富知识的问题生成方法。首先,利用预训练语言模型中丰富的知识增强三元组信息,设计文本知识生成器,将三元组中的信息转化为子图描述,丰富三元组的语义;然后,使用问题类型预测器预测疑问词,准确定位答案所在的领域,从而生成语义正确的问题,更好地控制问题生成的效果;最后,设计一种受控生成框架对关键实体和疑问词进行约束,保证关键实体和疑问词同时出现在问题中,使生成的问题更加准确。在公开数据集WebQuestion和PathQuestion中验证所提模型的性能。实验结果表明,与现有模型LFKQG相比,所提模型的BLUE-4、METEOR、ROUGE-L指标在WebQuestion数据集上分别提升0.28、0.16、0.22个百分点,在PathQuestion数据集上分别提升0.8、0.39、0.46个百分点。
  • 程腾腾, 姚春龙, 于晓强, 李旭, 王庆丰
    计算机工程. 2024, 50(6): 94-101. https://doi.org/10.19678/j.issn.1000-3428.0068404
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    当前对话生成技术已取得显著进展,然而为了更好地满足人类交流的需求,研究人员开始将共情引入对话生成领域。共情作为人际交流的重要组成部分,有助于更好地理解他人的情感和感受。通过引入常识知识来加强对用户情感和处境的理解,然而目前方法对非情感知识采用统一编码以及对常识知识融合采用简单的向量拼接,导致某些常识知识特征的影响可能降低,并且各个知识之间的关联刻画模糊。为此,提出一种基于多头注意力机制融合常识知识的共情对话模型ATT-EDM。该模型对引入的5种关系(xReact、xWant、xNeed、xIntent、xEffect)进行单独编码,保留了每种常识各自的特征,并利用多头注意力机制融合常识知识,对每种知识在注意力层进行运算,以更准确地反映它们各自的影响,同时更有效地刻画各个常识知识之间的联系。在数据集EmpatheticDialogues上的实验结果表明,该模型在困惑度(PPL)、准确率和Distinct-2指标上优于基线模型,PPL降低到36.435 0,准确率和Distinct-2分别达到37.96%、3.345 5,能够生成质量更高、内容更丰富、共情能力更强的同理心响应。
  • 胡庆
    计算机工程. 2024, 50(6): 102-109. https://doi.org/10.19678/j.issn.1000-3428.0068317
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    受行人姿态的多变性和行人被遮挡等因素的影响,行人重识别模型难以提取行人关键特征。为增强模型的特征表达能力,提出一种基于多尺度融合与双输出U-Net网络的行人重识别方法,旨在解决现有方法中难以提取行人关键特征、特征表达能力较低的问题。首先,提出多尺度融合的双输出U-Net网络,并对输出特征进行欧氏距离和散度距离约束;其次,设计联合损失函数,解决生成对抗网络在训练过程中不易收敛的问题,提高训练过程的收敛速度。在3个公共基准数据集上的仿真实验结果表明,相比经典特征提取网络,所提特征提取网络的平均精度均值(mAP)提升超过10%,所提行人重识别方法相比主流方法的mAP提高约2%,该方法能够增强模型的特征表达能力,提高行人重识别的准确率。
  • 严银凯, 彭宁宁, 易丽莎
    计算机工程. 2024, 50(6): 110-123. https://doi.org/10.19678/j.issn.1000-3428.0068354
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现有时间序列分类算法对高维拓扑信息以及时序顺序信息提取能力不足等问题,提出一种基于持续同调的倾斜时间序列分类算法。该算法结合时序数据方差,将原始单变量时序数据嵌入二维点云,同时展现出周期内和周期间的时序变化;在滑动窗口划分的子区间上进行时间倾斜,将点云分解为不同结构,从而使算法适应更多的时序数据,有效捕捉时序顺序信息;利用持续同调技术在点云上构建Vietoris-Rips(VR)复形流,从不同尺度分析各个维度下孔洞数量的变化,从而提取到更全面的时序数据的拓扑结构特征,并通过计算持久性图像得到点云中的拓扑特征。在此基础上,以持久性中心表示向量作为输入,使用随机森林模型对点云进行分类。在9个UCR时间序列数据集上进行对比实验,结果显示,该算法在其中8个数据集上取得了最高的准确率,相较于其他6种传统时间序列分类算法分类准确率提高了0.5~24个百分点,F1值提高了0.9~23.9个百分点,表明该算法在时间序列数据分类方面具有较高的精度和良好的鲁棒性。
  • 韩美慧, 王鹏, 李瑞旭, 刘仲尧
    计算机工程. 2024, 50(6): 124-137. https://doi.org/10.19678/j.issn.1000-3428.0067986
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    约束多目标优化(CMOP)问题的求解旨在将有限的搜索资源合理地配置到约束条件的满足与目标函数的优化2个方面,但问题约束的日趋复杂给求解算法带来了巨大挑战。提出一种基于协同演化的自适应约束多目标进化算法,该算法同时进化2个功能互补的种群(主种群和存档种群),使算法在求解复杂约束问题时能够实现约束处理与目标优化之间的良好平衡。首先,主种群进行双重繁殖,首次繁殖过程通过动态适应度分配函数自适应地利用不可行解所携带的有价值信息,使种群在进化前期强调对目标函数的优化,后期强调可行性,二次繁殖则与存档种群进行合作,以提高种群收敛性并维护多样性。然后,提出一种基于角度的选择方案更新存档种群,在保证种群良好多样性的同时保持种群向Pareto前沿的搜索压力。最后,与5种先进的约束多目标进化算法在33个基准问题上进行对比实验,结果表明,所提出的算法在解决各类CMOP问题时与对比算法相比更具优势,其效率平均提高了约67%。
  • 更藏措毛, 黄鹤鸣, 杨毅杰
    计算机工程. 2024, 50(6): 138-147. https://doi.org/10.19678/j.issn.1000-3428.0067970
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在语音增强中,常用自编码器结构自动提取特征,但这样得到的特征单一或者冗余且不能较好地捕获语音信号的上下文依赖关系。因此,提出一种融合多尺度特征和上下文信息的语音增强方法MSF-CI。首先,利用多尺度卷积块提取语音信号的多尺度特征,解决特征单一问题;其次,利用注意力机制关注所提取特征的空间与通道关键信息,解决特征冗余问题;最后,使用门控卷积循环神经网络学习语音信号中跨度较长的上下文依赖关系,并通过门控线性单元提高该网络的非线性学习能力,从而提高模型的泛化性。实验结果表明,MSF-CI在低信噪比和不同噪声环境下增强语音信号的语音感知质量、短时客观可懂度等多个指标上均优于GRN、DPT-FSNet、U-Net等同类的单通道语音增强模型。在信噪比为0 dB时,该方法的平均语音感知质量和平均语音客观可懂度达到1.49和0.761。在构建的安多藏语语料库上验证模型的泛化性,平均语音感知质量和平均语音客观可懂度相对于噪声提高了20.7%和11.3%,MSF-CI模型不仅可以提升语音的质量与可理解度,而且具有较优的泛化性。
  • 网络空间安全
  • 余长宏, 许孔豪, 张泽, 高明
    计算机工程. 2024, 50(6): 148-156. https://doi.org/10.19678/j.issn.1000-3428.0068055
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着网络攻击的不断增多和日益复杂化,传统基于监督的网络入侵检测算法不能准确识别没有类别标记或特征不明显的网络访问链接,而对于无监督的网络入侵检测算法,也存在检测效率和准确率低等问题。针对如何进一步提升网络入侵检测性能,提出使用自编码器(AE)与分割点改进孤立森林模型对网络入侵进行检测。首先,对无监督自编码器进行L1正则化,以增强自编码器的稀疏性,通过学习数据内在结构,自适应地提取具有判别性的特征,完成入侵攻击的特征提取;然后,使用改进的孤立森林分离异常点,即使用最大化均值与标准差之商来确定分割点划分最佳超平面来构建隔离树,使隔离树在相关子空间中具有更强隔离异常值的能力,并通过遍历所有隔离树中数据点的平均路径长度得到异常得分来判定异常流量。在KDDCUP99和UNSW-NB15数据集上的实验结果表明,与6种传统无监督方法相比,该方法较传统孤立森林准确率和召回率均提升约20%,F1值和曲线下面积(AUC)值均提升约10%,较其他无监督方法相比大幅降低了误码率。
  • 杨小东, 李沐紫, 马国祖, 李松谕, 王彩芬
    计算机工程. 2024, 50(6): 157-165. https://doi.org/10.19678/j.issn.1000-3428.0067902
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    车联网环境中,车辆通过互联网连接到公共网络,车辆信息在传输过程中很容易遭受到攻击者的各种恶意攻击,从而导致车辆隐私信息泄露甚至威胁用户生命安全。2022年,为了保障车辆间公开通信中消息传输的安全性和隐私性,研究人员提出了一种车联网环境下的无证书匿名认证方案,并证明该方案在随机预言机模型下满足签名的不可伪造性。然而,通过安全性分析发现,该方案无法抵抗恶意的密钥生成中心替换攻击以及车辆之间的合谋攻击。针对上述安全缺陷,提出改进的车联网无证书匿名认证方案。在随机预言模型下基于椭圆曲线离散对数问题存在不可伪造性,同时也能够抵抗车辆之间联合发起的合谋攻击。此外,该方案支持非法签名的快速查询,能在聚合签名验证失败后,通过建立非法签名与聚合签名验证等式的关联性,节省对右子节点中非法签名的查找次数,从而迅速定位到非法签名的位置。实验结果表明,与同类方案相比,改进方案在聚合签名验证阶段的计算开销减少了至少25%,并能满足更多的安全属性。
  • 刘寅昊, 蒋文保, 孙林昆, 王勇攀
    计算机工程. 2024, 50(6): 166-178. https://doi.org/10.19678/j.issn.1000-3428.0067721
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    Hashgraph是一种数据采用有向无环图(DAG)结构的区块链共识算法,Hashgraph引入了虚拟投票的概念,允许节点在无额外通信开销的情况下并发出块,实现异步场景下的拜占庭容错。然而,Hashgraph提出的虚拟投票算法存在算法时间复杂度较高、共识运行逻辑过于复杂等问题。为此,提出一种基于路径存储表的Hashgraph优化方案。首先,提出一种基于顶点可达表的见证人判定方法,通过存储路径的方式实时记录生成事件与历史事件的可达关系,在轮次划分阶段,通过查询顶点事件的可达信息取代回溯算法,降低见证人判断算法的时间复杂度;其次,针对顶点可达表无法跨轮次判断事件关系的问题,提出一种基于历史可达表的知名见证人判定方法,历史可达表将存储见证人与历史事件之间的可达关系,通过查询历史可达表解决知名见证人判定阶段需要反复回溯视图的问题;最后,根据顶点可达表和历史可达表改进Hashgraph中复杂的共识计算,提升算法效率,加快事件确认速度。实验结果表明,所提优化方案与Hashgraph原共识算法相比,算法运行效率提升65.76%,在吞吐量方面平均提升41.27%。
  • 李永飞, 李铭洋, 常鑫, 曹可欣
    计算机工程. 2024, 50(6): 179-187. https://doi.org/10.19678/j.issn.1000-3428.0067570
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着物联网技术的发展和应用范围的扩大,物联网设备和传感器的数量和种类也在不断增加。物联网水质传感器在生态监测与保护领域起着至关重要的作用,针对物联网水质传感器采集的监测数据中数据量大、维度高、无标注等问题,提出一种基于可解释性深度学习的无监督异常数据检测算法。使用自动编码器(AE)和SHAP算法对多维水质数据集进行异常检测。通过训练自动编码器模型,标记重建误差较大的数据,使用SHAP解释自动编码器并计算被标记数据中各数据特征的重要性。基于这些特征的重要性,确定最终的异常值,从而实现对水质监测数据的异常检测。在物联网水质监测数据集上的实验结果表明,该算法能有效检测出异常数据,F1值为0.875,性能优于当前无监督异常检测领域常用算法。该算法对于处理物联网水质监测数据具有实际应用价值,此外,还可以应用于其他领域的海量物联网监测数据的异常检测,例如气象、环境等领域。
  • 顾永跟, 高凌轩, 吴小红, 陶杰
    计算机工程. 2024, 50(6): 188-196. https://doi.org/10.19678/j.issn.1000-3428.0067926
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标签数据提升系统性能和如何缓解数据异质性带来的负面影响是两大挑战。针对标签数据仅在服务器场景,基于分享的思想,设计一种可应用在联邦半监督学习系统上的方法Share&Mark,该方法将客户端的分享数据由专家标记后参与联邦训练。同时,为充分利用分享的数据,根据各客户端模型在服务器数据集上的损失值动态调整各客户端模型在联邦聚合时的占比,即ServerLoss聚合算法。综合考虑隐私牺牲、通信开销以及人工标注成本3个方面的因素,对不同分享率下的实验结果进行分析,结果表明,约3%的数据分享比例能平衡各方面因素。此时,采用Share&Mark方法的联邦半监督学习系统FedMatch在CIFAR-10和Fashion-MNIST数据集上训练的模型准确率均可提升8%以上,并具有较优的鲁棒性。
  • 张慧妍, 梁勇, 兰景宏, 赵强
    计算机工程. 2024, 50(6): 197-207. https://doi.org/10.19678/j.issn.1000-3428.0068157
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为了解决现有的网络入侵检测方法在异常样本有限时存在精确度低且容易产生过拟合的问题,提出一种基于记忆模块和过滤式生成对抗网络(GAN)的入侵检测方法MemFGAN。在生成对抗网络中,生成器采用编码器-解码器结构并引入1个记忆模块学习正常样本的特征向量进行记忆增强,生成器用于对给定的输入进行编码并将其用作查询请求,在记忆模块中查询最相关的项进行重构,生成器的重构误差作为异常分数用于入侵检测,在判别器之前增加过滤器过滤异常样本,利用判别器损失提高生成器对正常样本的生成能力以降低其异常分数。此外,分别为生成器和判别器设计了新的训练目标,实现利用已知异常标签对生成器进行监督,降低生成器对异常样本的重构能力以扩大其异常分数,从而提高模型的入侵检测精确度并缓解过拟合问题。在MAWILab、ISCX2012、IDS2017、IDS2018 4个入侵检测数据集上的实验结果表明,相较于基线方法,MemFGAN的F1值平均提高了0.147,在入侵检测方面具有较好的准确性和泛化性,可以在异常样本有限时保持良好的检测能力。
  • 图形图像处理
  • 叶智奇, 章国宝, 朱宏伟
    计算机工程. 2024, 50(6): 208-217. https://doi.org/10.19678/j.issn.1000-3428.0067675
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在复杂室内环境中,消除动态行人对实时建图的干扰一直是激光同步定位与建图(SLAM)算法需要解决的核心问题之一。当前的SLAM算法主要关注静态场景,忽略了场景中存在的运动物体。然而,在室内场景中,频繁出现的移动行人降低了全局点云地图的质量,增加了后续定位与导航的不确定性。提出一种针对室内动态行人场景的紧耦合激光SLAM算法,以更好地适应此类复杂场景。在传统SLAM框架的基础上引入基于点云聚类与分割的预处理模块,用于准确消除动态行人点云。该算法首先采用基于欧氏距离的增强两步式聚类算法对点云进行聚类和分割,随后提取聚类结果的多维切片特征和强度特征,并结合支持向量机(SVM)的分类结果来识别场景中的行人实例,同时利用静态点云实时估计自身位姿并构建高分辨率点云地图。分别使用Hilti公开数据集以及真实场景数据对所提算法的动态点云去除效果和实时性进行测试,结果表明,相较于Removert、Dynablox等当前先进的激光SLAM算法,该算法能够显著改善点云地图的构建效果,降低其中动态行人点云的比例,且系统对单帧图片的处理时长不超过100 ms,满足实时性要求。
  • 武星, 殷浩宇, 姚骏峰, 李卫民, 钱权
    计算机工程. 2024, 50(6): 218-227. https://doi.org/10.19678/j.issn.1000-3428.0067874
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    多模态情感分析旨在从文本、图像和音频数据中提取和整合语义信息,从而识别在线视频中说话者的情感状态。尽管多模态融合方案在此研究领域已取得一定成果,但是已有方法在处理模态间分布差异和关系知识的融合方面仍有欠缺,为此,提出一种多模态情感分析方法。设计一种多模态提示门(MPG)模块,其能够将非语言信息转换为融合文本上下文的提示,利用文本信息对非语言信号的噪声进行过滤,得到包含丰富语义信息的提示,以增强模态间的信息整合。此外,提出一种实例到标签的对比学习框架,在语义层面上区分隐空间中的不同标签以进一步优化模型输出。在3个大规模情感分析数据集上的实验结果表明,该方法的二分类精度相对次优模型提高了约0.7%,三分类精度提高了超过2.5%,达到0.671。该方法能够为将多模态情感分析引入用户画像、视频理解、AI面试等领域提供参考。
  • 于洋, 孙芳芳, 吕华, 李扬, 王晓民
    计算机工程. 2024, 50(6): 228-235. https://doi.org/10.19678/j.issn.1000-3428.0068016
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    微表情可以揭示人们试图隐藏的真实情绪,为刑事侦查、心理辅导等提供潜在的信息。现有微表情检测方法主要在获取空间特征的基础上提取时间特征以构建时空特征,这种处理方式容易导致时间特征失真,同时在空间处理过程中会破坏原有时序关系,降低微表情时空特征的判别性。针对这一问题,提出基于多尺度时空注意力网络的微表情检测方法。利用包含时间和空间关系的三维卷积神经网络(3DCNN)对微表情序列进行处理,获取兼顾时间域和空间域的鲁棒性特征。构建多尺度时间输入序列,从不同时间长度的图像序列中提取多维时间特征,采用轻量级3DCNN提取多尺度时空特征,利用全局时空注意力模块(GSAM)对时空特征进行全局性时空关联加强,其中时空重组模块用于加强不同时刻图像帧之间的连通性,全局信息关注模块构建单帧图像上的空间关联信息,最后对不同时刻的特征赋予权重以突出关键时间信息,有效完成微表情检测工作。实验结果表明,该方法可以准确检测出微表情序列片段,在CASME、CASME II和SAMM公开数据集上的准确率分别达到92.32%、95.04%和89.56%,相比目前最优的深度学习方法LGAttNet,所提方法在CASME II和SAMM数据集上的准确率分别提高了3.84和4.96个百分点。
  • 贺姗, 蔺素珍, 王彦博, 李大威
    计算机工程. 2024, 50(6): 236-244. https://doi.org/10.19678/j.issn.1000-3428.0067302
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对现有图像描述生成方法普遍存在的对夜间场景、目标被遮挡情景和拍摄模糊图像描述效果不佳的问题,提出一种基于特征融合的多波段探测图像描述生成方法。将红外探测成像引入图像描述领域,首先利用多层卷积神经网络(CNN)对可见光图像和红外图像分别提取特征;然后根据不同探测波段的互补性,以多头注意力机制为主体设计空间注意力模块,以融合目标波段特征;接着应用通道注意力机制聚合空间域信息,指导生成不同类型的单词;最后在传统加性注意力机制的基础上构建注意力增强模块,计算注意力结果图与查询向量的相关权重系数,消除无关变量的干扰,从而实现图像描述生成。在可见光图像-红外图像描述数据集上进行多组实验,结果表明,该方法能有效融合双波段的语义特征,BLEU4指标、CIDEr指标分别达到58.3%和136.1%,能显著提高图像描述准确度,可以用于安防监控、军事侦察等复杂场景任务。
  • 董良振, 田建艳, 杨胜强, 陈海滨
    计算机工程. 2024, 50(6): 245-254. https://doi.org/10.19678/j.issn.1000-3428.0067684
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在低照度条件下采集的机械加工零件表面图像质量较低,严重影响后续与粗糙度相关的特征提取效果。为此,提出一种基于光照校正和图像融合的低照度图像增强算法。首先对引导滤波算法进行改进,使其能根据图像的纹理情况自适应地调整滤波参数,在平滑纹理的同时保持整体结构,得到更优质的照度图;然后对原始图像进行反相增强,抑制图像中的高亮条纹与光斑,通过图像融合来综合原图和正、反相增强图像的优质像素;接着利用限制对比度的自适应直方图均衡化(CLAHE)算法进一步提高融合图像的对比度;最后将增强图像用于2种不同的零件表面粗糙度检测模型。在钛、钢、镁3种材质的零件表面低照度图像数据集上进行实验,结果表明,该算法有效增强了低照度零件表面图像的质量,增强图像的标准差、平均梯度和信息熵均高于对比算法。与图像增强前相比,基于灰度共生矩阵特征提取的支持向量回归(GLCM-SVR)和基于卷积回归神经网络(RCNN)的粗糙度检测模型的均方根误差分别降低了0.140和0.202 μm,平均绝对误差分别降低了0.116和0.146 μm,表明图像增强能有效提升低照度条件下基于视觉的粗糙度检测方法的精度。
  • 杨硕, 王一丁
    计算机工程. 2024, 50(6): 255-265. https://doi.org/10.19678/j.issn.1000-3428.0068130
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    面部动画在电影、游戏、虚拟现实等领域起着关键作用,对于实现逼真、生动的人脸动画和情感传达至关重要。当面临面部形状、姿态、表情等多个变化因素时,虽然通过薄板样条非线性变换可以获得较好的运动估计结果,但在处理面部复杂纹理和嘴部运动时存在运动估计不精细的问题,需要更强大的图像修复能力。因此,提出一种基于改进薄板样条运动模型(TPSMM)的人脸动画算法。首先,在TPSMM的基础上引入一种Farneback光流金字塔算法,通过与薄板样条变换和背景仿射变换相结合,使得人脸局部运动估计更精准;其次,为了更真实地恢复缺失区域的细节纹理信息,提出一种多尺度细节感知网络,该网络在编码器中通过嵌入通道注意力(ECA)模块减少源图像因多层下采样而导致的人脸细节信息丢失,在解码器中利用坐标注意力(CA)模块来有效捕获运动估计特征图中不同位置的重要特征,提高人脸图像的生成质量。实验结果表明,相比一阶段运动模型(FOMM)、关节动画的运动表示法(MRAA)、TPSMM等,该算法在MUG、UvA-Nemo和Oulu-CASIA数据集上的L1、平均关键点距离(AKD)、平均欧氏距离(AED)数值均达到最优,平均分别为0.0129、0.923、0.00099。
  • 吴凡, 徐朝农, 邹英豪
    计算机工程. 2024, 50(6): 266-275. https://doi.org/10.19678/j.issn.1000-3428.0067738
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    危险区域人员监控具有摄像节点密度高、传输实时性和图像质量要求高的特点。功率域非正交多址接入(PD-NOMA)技术可以支持多路并行传输,有利于在密集传输场景下提升传输实时性,而多摄像节点协同有利于提高图像质量。在面向危险区域人员监控的PD-NOMA摄像网络中,提出通过多图融合的人员监控图像传输算法,以实现高质量监控。首先,定义了图像的“单人信息量”这一关键术语,它反映了图像中单个人员被准确识别的概率;其次,基于摄像节点之间的位置关系定义了多摄像节点拍摄到的单个人员的融合图像信息量;最后,在满足传输实时性要求以及图像中所有人员均可识别的前提下,以最大化融合图像信息量为目标,计算以摄像节点的图像分辨率和无线发射功率为控制变量的实时传输调度方案。实验结果表明,当实时传输上限为0.4 s时,基于PD-NOMA的传输调度方案传输信息量比传统传输方案提高了46.4%,使得图像中人员识别概率从0.8549提升至0.8919。
  • 时志鹏, 冯肖维, 赵一平
    计算机工程. 2024, 50(6): 276-286. https://doi.org/10.19678/j.issn.1000-3428.0067894
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在获得三维点云数据时,由于仪器、环境、算法等原因,不可避免地会使获得的点云数据带有噪声,而点云数据所携带的噪声将影响后续的点云处理效果。为了抑制三维点云数据中的噪声,同时保留其不同程度的特征,提出一种改进邻域漂移的多假设点云降噪方法。首先,利用邻域点和法向双张量投票法进行特征描述;接着,利用非参数估计构建转移概率函数,并使用核回归方法对新的采样点进行权重计算,在此基础上运用粒子滤波实现邻域漂移,经过多次迭代得到非局部邻域;然后,通过多假设检验法确定不同特征点处的多个法向,并通过加权平均获得最终法向;最后,采用多假设检验的方法分别对特征点和非特征点进行滤波,产生多个候选点并使用目标函数进行优化,从而对点云模型进行降噪。利用所提方法与RIMLS、EAR、L1、PointNet方法对相同噪声模型进行恢复,并对恢复模型与原模型进行误差分析,结果表明,所提方法的平均降噪精度相比RIMLS、EAR和L1方法分别提高了38.1%、41.3%和12.4%,与PointNet相比约降低2.9%,但是所提方法无须进行数据库训练且可调参。
  • 李致金, 汤佳辉, 闫金凤
    计算机工程. 2024, 50(6): 287-295. https://doi.org/10.19678/j.issn.1000-3428.0067836
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    “新零售”模式的出现,对传统零售业的转型以及提升用户消费体验具有重要意义。然而,目前市场上的无人水果秤大多存在一些问题,如识别率低、模型结构复杂、部署困难、模型推理实时性差等。针对这些问题,提出一种基于边缘计算的轻量化识别方法。选用MobileNext作为主干网络,引入轻量型的注意力模块CBAM改进MobileNext中的SandGlass模块。利用Ghost模块替换SandGlass模块中的标准1×1卷积,以压缩模型的参数量和运算量。在此基础上,使用迁移学习的策略搭配NAdam优化器训练改进后的MobileNext模型,进一步提高模型的识别精度。在Fruit Recognition数据集上的实验结果表明,该方法在水果识别任务中达到了98.95%的识别准确率,优于原MobileNext、MobileNetV2和EfficientNet-B0等轻量级模型。相较于原MobileNext模型,改进后的MobileNext模型识别准确率提高了1.17个百分点,参数量仅为1.775×106,推理时间仅为16.5 ms。在实际的零售场景中,所提方法只需很小的参数量和运算量就能实现较好的识别效果,并能够部署在边缘设备上。
  • 陈晓玉, 沈晨, 沈阅, 孔德明
    计算机工程. 2024, 50(6): 296-303. https://doi.org/10.19678/j.issn.1000-3428.0067995
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在堆场环境下,实时图像语义分割可以提供直观的场景类别信息。为节约工控机等边缘设备的硬件资源以及为多源信息融合提供图像语义类别信息,提出一种轻量化的实时语义分割网络模型。首先提出基于空间注意力引导的上采样融合模块,通过引入空间注意力和残差注意力结构设计一种轻量化的解码器,在上采样过程中还原空间细节,抑制冗余信息,进而融合不同来源的特征图;其次提出一种轻量化的级联空洞空间金字塔模块,利用级联的空洞卷积单元增大网络感受野,有效提取多尺度特征;最后使用通道分离、通道混洗、通道池化等操作,降低多尺度聚合过程中的计算开销。在公开数据集Camvid上,该模型的平均交并比(MIoU)为70.1%,推理速度为146.3 帧/s,分割精度和推理速度优于ENet、ICNet等模型,消融实验结果也证明了所提各模块的有效性;在实际堆场图像数据集上,该模型的MIoU为93.5%,推理速度为123.8帧/s,证明模型结构具有良好的泛化性能。
  • 开发研究与工程应用
  • 李雪, 王雅文, 张前进
    计算机工程. 2024, 50(6): 304-310. https://doi.org/10.19678/j.issn.1000-3428.0068041
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    源代码自动命名是指为给定代码的方法体命名一个反映代码功能的有意义的名称,可以使代码易读易懂,提高软件开发效率。传统自动命名方法仅使用代码的词法或者语法等单一信息,基于深度学习的自动命名方法通常忽略了语料库中的相似代码,影响命名准确率。针对上述问题,提出一种基于信息检索的源代码自动命名方法。首先,利用预训练模型和BERT-whitening方法提取输入代码和语料库中代码的有效特征,使用欧氏距离计算两者之间的语义相似度。其次,在语料库代码中选择与输入代码语义相似度较高的代码组成候选库,利用Jaccard系数和最长公共子序列分别计算输入代码与候选库代码的词法和语法相似度。最后,使用加权和来匹配候选库中与输入代码最相似的代码片段,复用该代码片段的方法名称作为输入代码的方法名称。实验结果表明,在公开的Java-small数据集上,与基于向量空间模型(VSM)和基于深度学习模型Code2Vec的自动命名方法相比,该方法的F1值分别提升了6.93和1.22个百分点,具有较优的预测性能。
  • 周春雷, 宋继勐, 沈子奇, 余晗, 雷杰, 林兵
    计算机工程. 2024, 50(6): 311-320. https://doi.org/10.19678/j.issn.1000-3428.0067719
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    数联网是为解决目前互联网数据资源共享交互过程中传输效率低、协调成本高、安全管控难等缺陷而提出的一种新型信息基础设施。标识解析系统是实现数据流通的关键,但随着标识注册量和解析量的迅速增长,解析节点正面临着大量高并发解析请求,服务质量将变得难以保证。针对该问题,考虑数联网标识解析系统中节点架构的特点,以降低解析时延为目标,提出一种基于遗传算法的自适应离散粒子群优化算法(DPSO-GA)来对标识进行合理布局。该方法综合考虑节点之间的带宽、标识数量和节点容量等因素对解析时延的影响,引入遗传算法的交叉操作和变异操作,对粒子群优化算法的惯性权重因子采取自适应策略,对学习因子采取线性增减的策略。实验结果表明,相较于传统粒子群优化算法及遗传算法,该算法优化效果分别提升了48.9%和19.9%,增加了种群进化的多样性及搜索范围,减少了算法的时间复杂度以及陷入局部最优解的可能性,且能较稳定地降低标识解析时延。
  • 徐权, 冷珏琳, 刘田田, 郑澎
    计算机工程. 2024, 50(6): 321-327. https://doi.org/10.19678/j.issn.1000-3428.0067448
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对实际工程应用中的大规模数值模拟需求,面向复杂几何装配体模型,提出一种适配高性能计算机分布式共享存储体系的两级并行曲面网格生成方法。首先提取几何模型的关键特征,基于关键特征构建网格尺寸场并预估出每个几何实体内的网格规模大小;然后基于模型几何实体的相邻关系和预估的网格规模建立模型实体间的邻接关系图,通过图剖分算法将几何模型分解为不同的子模型,将子模型分配到不同的进程内;最后在各进程内按照“点-线-面”的顺序依次并行生成点网格、线网格和面网格。在曲面网格并行生成中采取进程和线程混合的并行方式,不同子模型之间采用消息传递接口并行,同一个子模型的不同几何曲面之间采用OpenMP并行。通过三峡大坝模型对该方法进行验证,结果表明,通过分析算法的并行效率、通信最小化和负载平衡,该方法可以在数千处理器核上获得40%的并行效率,不同进程间的通信量较少,且可以获得良好的负载平衡。
  • 宋庆增, 刘向东, 许康为, 刘佳辉, 任二祥, 骆丽, 魏琦, 乔飞
    计算机工程. 2024, 50(6): 328-335. https://doi.org/10.19678/j.issn.1000-3428.0067515
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着人工智能的发展,边缘端设备对智能图像处理的需求急剧增加。目前边缘端设备主要面临能量受限、吞吐率较低等问题。无人机在侦察过程中,根据任务要求需进行复杂的地形分析、物体识别和环境监测等任务,这些任务常常会给设备带来严重的功耗问题,并且严重影响无人机的飞行时间。针对上述问题,提出一种基于卷积神经网络的逐级唤醒存内计算控制器设计方案,控制器内部能够完成分类型网络的前向推理,可根据分类结果唤醒对应的边缘端设备。控制器的模拟部分采用存算一体计算模式,数字部分采用分块的处理方式,在运行过程中可将空闲模块休眠,以降低系统的整体功耗。此外,控制器内部还集成了级联接口,可以将复杂任务分解为多个层级的子任务,并将其部署到级联的控制器上,从而实现多级唤醒,使系统具备提前输出的潜力。实验采用ResNet-14作为神经网络模型,数据集采用CIFAR-10数据集。实验结果表明,在10 MHz的时钟频率下,基于卷积神经网络的逐级唤醒存内计算控制器可以实现60 帧/s的检测帧率,并且分类精度达到84.61%,验证了该架构在能量受限应用场景下的可行性和高效性。
  • 郑锦灿, 邵立珍, 雷雪梅
    计算机工程. 2024, 50(6): 336-345. https://doi.org/10.19678/j.issn.1000-3428.0067326
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对实际生产车间中加工时间的不确定性,将加工时间以模糊数的形式表示,建立以最小化模糊最大完工时间和模糊总材料消耗为优化目标的多目标模糊柔性作业车间调度问题数学模型,提出一种改进基于分解的多目标进化算法(IMOEA/D)进行求解。该算法基于机器和工序两层编码并采用混合的初始化策略提高初始种群的质量,利用插入式贪婪解码策略对机器的选择进行解码,缩短总加工时间;采用基于邻域和外部存档的选择操作结合改进的交叉变异算子进行种群更新,提高搜索效率;设置邻域搜索的启动条件,并基于4种邻域动作进行变邻域搜索,提高局部搜索能力;通过田口实验设计方法研究关键参数对算法性能的影响,同时得到算法的最优性能参数。在Xu 1~Xu 2、Lei 1~Lei 4和Remanu 1~Remanu 4测试集上将所提算法与其他算法进行对比,结果表明,IMOEA/D算法的解集数量和目标函数值均较优,在Lei 2算例获得的解集个数为对比算法的2倍以上。
  • 秦灏, 戚志东, 于灵芝, 童新
    计算机工程. 2024, 50(6): 346-357. https://doi.org/10.19678/j.issn.1000-3428.0067981
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为准确描述质子交换膜燃料电池(PEMFC)在其发电过程中的特性及变量影响关系,提出一种基于信息交流布谷鸟搜索差分进化(IECSDE)算法的改进分数阶子空间辨识方法来建立PEMFC分数阶模型。首先基于状态空间方程建立PEMFC模型,为了描述PEMFC的分数阶特性,将分数阶微分理论融入到模型中,引入Poisson滤波函数预处理实验数据,解决数据多阶不可导的问题,同时引入变步长记忆法处理分数阶微分时的权系数,提高子空间辨识精度。其次在辨识过程中的参数对于建模效果具有重大影响,因此基于IECSDE算法并对其进行优化,对布谷鸟搜索(CS)算法中的控制参数进行自适应处理,受到粒子群优化(PSO)算法的启发,改进随机游走方式提高收敛精度和速度,并引入差分进化(DE)算法与改进CS算法分别对种群进行优化,同时在寻优过程中进行信息交流提高种群的多样性和算法的鲁棒性。仿真结果表明,IECSDE算法的寻优能力在8种测试函数下比其他5种优化算法至少提升了10倍;通过对PEMFC测控平台收集到的实验数据进行模型辨识,所建立的模型将误差缩小到基于短记忆法的分数阶子空间辨识方法误差的20%,输出功率误差控制在0~0.1之间,输出电压误差控制在0~0.2之间,能够精准地模拟PEMFC发电过程。
  • 赵云涛, 肖俊杰, 李维刚, 熊雅婷
    计算机工程. 2024, 50(6): 358-366. https://doi.org/10.19678/j.issn.1000-3428.0068127
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    信息码识别技术推动着社会的进步,使人们的生活更加便捷。由于受所处拍照环境影响,信息码识别效果有待提高,而且信息码角度倾斜也会影响解码正确率。以基于信息码的电力互感器误差实验接线判断为背景,提出一种基于改进PPYOLOE-R的信息码矫正算法。首先以PPYOLOE-R检测算法为基础,融合轻量级网络ESNet,在提升精度的同时降低模型参数量;其次引入动态卷积进一步加强特征提取,减少模型因下采样丢失信息,加强模型通道特征提取能力;最后为满足人工智能(AI)边缘设备上的实时性要求,采用模型融合技术将推理模型进行融合,保证在模型精度不变的情况下提升模型检测速度。为丰富数据集,采用两步旋转数据增强和Mosaic+Mixup数据增强方法,充分利用数据集中已有信息,提高模型学习能力。实验结果表明,改进后算法精度达到89.46%,较原模型提升了1.95%,检测照片速度从每张154 ms提升至每张50 ms。相较其他算法,改进算法具有体积小和速度快的优势,通过算法矫正后的信息码,可显著提高解码效率和正确率。
  • 高家豪, 胡创业, 丁男, 刘战东
    计算机工程. 2024, 50(6): 367-376. https://doi.org/10.19678/j.issn.1000-3428.0067946
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在智能网联汽车(ICV)中,提高驾驶数据的有效性是提升车辆安全性的基石。只有准确的、可靠的驾驶数据才能为车辆的安全性提供可靠的依据和支持。与传统的异常分析相比,ICV数据有效性分析面临数据异常的多样性(传感器异常、驾驶行为、恶意篡改等)。如何将车辆自身数据特征、驾驶风格和交通流特征相结合,提供有效的数据异常检测方法,已成为智能网联汽车中新的问题。针对ICV系统,采用结合驾驶风格和交通流理论的方法,设计基于粒子群优化的TE-PSO-SVM数据有效性检测算法,实现驾驶数据的有效检测。首先定义驾驶风格识别系数Rad,设计驾驶风格量化模型;其次建立交通流模型,将车辆状态数据与驾驶风格和交通流理论相结合,通过长短期记忆(LSTM)网络对车辆速度预测;最后通过TE-PSO-SVM算法进行数据有效性检测。由于ICV数据的多样性,单一模型在多类型异常混合并存的场景中检测精度仍有局限,利用多个模型的优势构建模型池,并提出基于强化学习的模型选择(RLBMS)算法。在真实数据集highD上的实验结果表明,在不同噪声环境下,TE-PSO-SVM算法模型的F1值相比于传统SVM模型平均提升约8.1个百分点;RLBMS算法模型在不同噪声环境下的F1值相比于模型池中检测率最高的算法平均提高约1.7个百分点,明显提高了数据有效性检测的准确率。
  • 郭羽含, 李文华, 钱亚冠
    计算机工程. 2024, 50(6): 377-393. https://doi.org/10.19678/j.issn.1000-3428.0068013
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    服务车辆时空分布与出行需求的不一致严重影响网约车平台的服务效率,降低平台和服务车辆的收益以及乘客的服务体验。针对该问题,提出融合空间、时间和天气3种维度影响因素的时空流差计算方法,并构造双层深度森林模型对时空流差进行准确预测。双层深度森林模型通过集成两种不同输入数据的深度森林模型来提升模型预测准确性。基于时空流差预测,设计一种在线局部调度与离线全局调度相结合的双模式混合调度算法。在线局部调度采用集成并行和n阶段求解模式对正在等待订单的车辆进行实时调度,离线全局调度则通过遗传匹配算法对可提前预测的车辆进行离线全局调度。依据遗传算法获取最优路径以及车辆对应子空间的最优匹配值,设计一种迭代Kuhn-Munkres算法和更新机制得到所有车辆和子空间的最优匹配。实验结果表明,该预测模型较其他预测模型解释方差平均提升0.13,确定系数平均提升0.16,平均绝对误差平均减少2.39,均方误差平均减少100.44;调度算法可将全局供需差异降低57.16%,司机接单率提升88.4%。
  • 周春良, 刘仰光, 孟祥佩
    计算机工程. 2024, 50(6): 394-400. https://doi.org/10.19678/j.issn.1000-3428.0066957
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为了防止社交网络中的负面信息快速传播,则需要通过评价社交网络中用户的影响力来找出影响力大的社交网络节点。针对传统算法在社交网络领域中交叉特性缺失的问题,结合高斯贝叶斯衍生分类器,提出一种网络用户影响力评价模型。该模型结合用户活跃度、用户联系度、用户覆盖度等维度,建立社交网络用户影响力刻画指标,同时考虑社交网络用户之间的关系特征和用户自身的行为特征,降低僵尸粉和垃圾社交网络对网络评价结果的影响,通过建立连续属性朴素贝叶斯分类器方法,提出基于高斯贝叶斯衍生分类器的模型求解方法。使用新浪微博中152059423条媒体报纸用户评论作为实验数据,分析影响该评价模型的关键因素,利用仿真软件完成和HRank等传统模型对比实验,结果表明,该模型体现了社交网络用户的交叉特性,提升了模型的实用性,相比于其他传统算法,该模型分类误差更趋于稳定,分类结果的误差率更低,适应性更好。