作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2022年, 第48卷, 第6期 刊出日期:2022-06-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2022, 48(6): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 区块链理论与技术
  • 黄华威, 孔伟, 彭肖文, 郑子彬
    计算机工程. 2022, 48(6): 1-10. https://doi.org/10.19678/j.issn.1000-3428.0063887
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    区块链作为分布式账本的关键技术之一,其去中心化、可匿名、不可篡改的特性受到学术界和工业界的青睐,被广泛应用于金融、数字货币、公共服务等领域。分片技术作为区块链扩容的主流方式之一,能够在不降低区块链去中心化程度的同时实现高性能的链上扩容,从而解决区块链可拓展性不足以及吞吐量较低的问题。介绍近年来出现的分片技术以及相关协议,总结分片技术的关键理论与方法,从分片配置、重配置、片内共识协议、跨片共识协议、状态存储等方面对分片技术方案进行对比,归纳不同分片方案在网络分片、交易分片、状态分片等设计中存在的优势和不足。同时,阐述一些经典分片技术在性能和实现方式上的特点,对许可区块链和无许可区块链、片内共识协议、跨片共识协议、准入性方案、状态分片方式等进行分析和概述。在此基础上,从分片内、分片间以及系统层级的角度总结分片技术当前所面临的困境和挑战,并对该领域的发展前景及未来研究方向加以展望。
  • 王劲松, 杨唯正, 赵泽宁, 魏佳佳
    计算机工程. 2022, 48(6): 11-23. https://doi.org/10.19678/j.issn.1000-3428.0064002
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    区块链技术已广泛应用于金融、公共服务、物联网、网络安全、供应链等多个领域,但传统单链结构的区块链在吞吐量、交易确认速度和可扩展性方面存在不足,导致其在一些短时高并发量数据场景中难以落地应用。基于有向无环图(DAG)的区块链技术因其具有交易并发确认功能、吞吐量高、可扩展性强等优势受到研究者广泛关注。通过分析研究现有DAG区块链的发展和演化过程、评估方法、优化方向以及应用场景,探索DAG区块链在落地应用中的可行性。阐述主流DAG区块链的研究现状,比较传统区块链与DAG区块链的优势与不足,并分析现有区块链属性评估方法,总结DAG区块链评估结果。在此基础上,从交易确认速度、系统吞吐量、系统安全性、存储结构等方面对比现有DAG区块链的优化方法,介绍DAG区块链在数据管理、基于边缘计算和联邦学习的数据共享以及面向访问控制和隐私保护的数据安全等场景中的应用情况,并指出当前研究中存在的主要问题和挑战,对未来的研究方向进行展望。
  • 李鸣, 张亮, 宋文鹏, 吴美玉
    计算机工程. 2022, 48(6): 24-32,41. https://doi.org/10.19678/j.issn.1000-3428.0064120
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    当前,元宇宙产业热度极高,或将形成庞大的信息消费生态,成为数字经济的重要组成部分,然而业界对于元宇宙概念的定义多为叙事性描述,缺乏体系化研究和工程化应用。元宇宙产业发展的基础是厘清其本质和内涵,明确元宇宙的基础设施和技术体系,以对元宇宙产业的工程应用提供实际帮助。通过分析元宇宙的背景和产业情况,研究元宇宙内涵和外延,提出区块链是元宇宙的核心基础设施,可从技术平台、应用场景、协作机制等方面对元宇宙提供关键支持。元宇宙的技术参考模型包括元网络、元系统、元服务、元应用、元空间等5层,而区块链的关键技术组件覆盖了元宇宙技术参考模型的核心部分,密码学和分布式身份认证体系可支撑元宇宙的组织、身份、资产、活动等4个关键要素以建立元宇宙的身份价值网络,金融资产协议、加密货币体系和数字资产凭证也将辅助构建元宇宙经济金融体系。同时,对基于区块链的元宇宙概念和术语体系、技术体系的集成方法、分布式商业应用场景等未来发展方向进行展望。
  • 陈乃月, 金一, 李浥东, 蔡露鑫, 魏圆梦
    计算机工程. 2022, 48(6): 33-41. https://doi.org/10.19678/j.issn.1000-3428.0064095
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为解决典型联邦学习框架在训练样本数据分布不均衡情况下产生的聚合模型对各个客户端模型不公平的问题,结合区块链的去中心化、不可篡改性以及智能合约的特点,提出基于本地数据特征的公平性联邦学习模型,以实现数据分布差异的客户模型可信安全共享。多个客户端通过区块链上传本地参数以及信用值,利用区块链的共识机制选择信用值最高的区块进行模型聚合,在模型聚合过程中按照节点信用依次进行融合,并根据区块链记录工作节点的本地模型参数作为证据,完成整体模型参数的聚合任务,在此基础上通过广播下传当前聚合模型参数,模型利用区块链的共识机制可降低参数在传输过程中所面临的安全风险。在开源数据集上的实验结果表明,该模型相较FedAvg模型训练精度提高40%,不仅能够优化非独立同分布下的模型训练精度,同时可以防止中间参数传输信息泄露,保证了多个客户端的利益与安全隐私,从而实现具有隐私保护的公平性模型。
  • 陈润宇, 王伦文, 朱然刚
    计算机工程. 2022, 48(6): 42-49,56. https://doi.org/10.19678/j.issn.1000-3428.0063904
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    实用拜占庭容错(PBFT)算法在Raft和Paxos共识算法的基础上,解决了分布式系统中恶意节点向其他节点发送错误消息以扰乱系统正常运行的问题,但PBFT算法由于主节点选举随意导致共识效率低下,而现有PBFT改进算法普遍通信复杂度较高且容易出现系统集中化趋势。针对上述问题,提出一种基于信誉值投票与随机数选举的RN-VPBFT共识算法。通过增设监督节点,实现权力分散和信息中转,保证系统安全运行。在投票确定初始信誉值的过程中,引入随机参数使得满足条件的节点均有机会当选主节点,缓解系统集中化趋势。建立节点动态信誉模型,区分系统中的诚实节点与恶意节点,简化共识算法的一致性协议,降低算法通信复杂度。实验结果表明,与PBFT算法和基于信誉投票的PBFT改进算法相比,RN-VPBFT算法将通信复杂度由ON2)降至ON),并且所有诚实节点的信誉值之差仅为0.02,具有更低的通信复杂度及更好的去中心化特性。
  • 王兵, 李辉灵, 牛新征
    计算机工程. 2022, 48(6): 50-56. https://doi.org/10.19678/j.issn.1000-3428.0063433
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    区块链技术是一种信任机制,具有去中心化、防篡改、可追溯的特性。共识算法是区块链核心技术之一,可维持区块链网络的运行,相较于工作量证明、权益证明等其他公有链共识算法,股份授权证明(DPoS)共识算法具有低延时、高吞吐量、几乎不分叉等优势。但由于按股份权重进行投票选举,选取的委托人总是持币量大的节点,导致其余节点出现投票政治冷漠性的情况,同时节点出块顺序随机,增大了节点通信的消耗。针对上述问题,提出一种综合选举算法CE-DPoS,该算法通过节点之间的通信消耗预先设定网络信息表,根据节点的意愿权重进行投票,投票后计算每个节点的最终得分。选择所有节点中分数最高的节点作为第一个委托人节点,再从该节点的网络信息表中选择得分最高的节点作为第二个委托人节点,直至选定委托人节点数达到系统规定。仿真实验结果表明,与DPoS、BFT-DPoS共识算法相比,CE-DPoS共识算法能动态地选择委托人节点,节点之间选举相对公平,节点活跃度提升至85%,同时出块时间降至0.4 s,能更好地应对日益增长的交易量。
  • 人工智能与模式识别
  • 范林歌, 武欣嵘, 童玮, 曾维军
    计算机工程. 2022, 48(6): 57-64. https://doi.org/10.19678/j.issn.1000-3428.0061524
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    在机器学习理论与应用中,特征选择是降低高维数据特征维度的常用方法之一。传统的特征选择方法多数基于完整数据集,对实际应用中普遍存在缺失数据的情形研究较少。针对不完整数据中含有未被观察信息和存在异常值的特点,提出一种基于概率矩阵分解技术的鲁棒特征选择方法。使用基于分簇的概率矩阵分解模型对数据集中的缺失值进行近似估计,以有效测量相邻簇之间数据的相似性,缩小问题规模,同时降低填充误差。依据缺失数据值存在少量异常值的情形,利用基于l2,1损失函数的方法进行特征选择,在此基础上给出不完整数据集的特征选择方法流程,并对其收敛性进行理论分析。该方法利用不完整数据集中的所有信息,有效应对不完整数据集中异常值带来的影响。实验结果表明,相比传统特征选择方法,该方法在合成数据集上选择更少的无关特征,可降低异常值带来的影响,在真实数据集上获得了较高的分类准确率,能够选择出更为准确的特征。
  • 谭元珍, 李晓楠, 李冠宇
    计算机工程. 2022, 48(6): 65-72. https://doi.org/10.19678/j.issn.1000-3428.0061589
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    实体对齐旨在判断来自不同知识图谱的实体是否为指向真实世界的同一个对象。然而,知识图谱间的结构异质性往往会影响实体对齐的准确性。提出一种基于邻域聚合匹配网络(NAMN)模型的实体对齐方法。根据每跳邻居对中心实体重要性不同的特点,采用分层的思想区别处理每跳邻域信息,通过门控机制进行聚合以学习图结构的表征。在此基础上,为每个实体构建邻域局部子图进行跨图邻域匹配,并将匹配阶段的输出与通过门控机制所学习到的图结构表征进行联合编码,生成最终面向匹配的表征。采用DBP15K数据集进行实验,结果显示,Hits@1的所有值均在75%以上,Hits@10的所有值均在85%以上,最高可达到97%,平均倒数排名均高于80%,表明NAMN模型能够有效提高实体的匹配准确度。
  • 钱龙, 赵静, 韩京宇, 毛毅
    计算机工程. 2022, 48(6): 73-78,88. https://doi.org/10.19678/j.issn.1000-3428.0063270
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    多标签学习是机器学习领域的一个研究热点,其能够有效解决真实世界中的多语义问题。在多标签学习任务中,样本的多个标签之间存在一定的关联关系,忽略标签间的相关性会导致模型的泛化性能降低。提出一种基于标签间相关性的多标签学习K近邻算法。充分挖掘样本多标签间的相关性,通过Fp_growth算法得到标签的频繁项集。针对频繁项和标签分别构建评分模型和阈值模型,评分模型用于衡量样本与频繁项或标签之间的关联程度,阈值模型用于求解频繁项或标签对应的判别阈值,结合评分模型和阈值模型对样本所属频繁项进行预测,进而确定样本标签集。在经典数据集Emotions和Scene上的实验结果表明,该算法的F1-Measure指标分别达到66.6%和73.3%,相比CC、LP、RAKEL、MLDF等基准方法,其F1-Measure分别平均提高3.8和2.1个百分点,该算法通过合理利用标签间的相关性使得分类性能得到有效提升。
  • 刘蒙蒙, 牛保宁, 杨茸
    计算机工程. 2022, 48(6): 79-88. https://doi.org/10.19678/j.issn.1000-3428.0061722
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    关键词最优路径查询(KOR)查找在满足关键词全覆盖和路径长度约束条件下,时间开销最小的路线常用于旅行规划。现有优化算法虽然采用各种剪枝策略缩小搜索规模,但是本质上是广度优先搜索,在查找长路径时,搜索规模依然过大,执行时间长。针对该问题,提出一种关键词最优路径查询的分段拓展算法(SE-KOR)。SE-KOR算法根据关键词倒排索引表构建关键词顶点路径,将路径划分为多段分别拓展,降低搜索规模,从而缩短执行时间。该算法在路径拓展时给出路径走向,而现有剪枝策略不控制路径拓展方向,因此提出局部代价阈值剪枝,控制路径的走向沿关键词顶点路径拓展,并综合运用近似支配、可行解目标值剪枝和全局优先拓展策略加速拓展。实验结果表明,在不损失精度的情况下,该算法执行时间分别在不同关键词个数、代价阈值与查询图规模下至少缩短8.0%、61.0%和57.7%。
  • 李军怀, 陈苗苗, 王怀军, 崔颖安, 张爱华
    计算机工程. 2022, 48(6): 89-94,106. https://doi.org/10.19678/j.issn.1000-3428.0061630
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    命名实体识别是知识图谱构建、搜索引擎、推荐系统等上层自然语言处理任务的重要基础,中文命名实体识别是对一段文本序列中的专有名词或特定命名实体进行标注分类。针对现有中文命名实体识别方法无法有效提取长距离语义信息及解决一词多义的问题,提出一种基于ALBERT-双向门控循环单元(BGRU)-条件随机场(CRF)模型的中文命名实体识别方法。使用ALBERT预训练语言模型对输入文本进行词嵌入获取动态词向量,有效解决了一词多义的问题。采用BGRU提取上下文语义特征进一步理解语义,获取长距离词之间的语义特征。将拼接后的向量输入至CRF层并利用维特比算法解码,降低错误标签输出概率。最终得到实体标注信息,实现中文命名实体识别。实验结果表明,ALBERT-BGRU-CRF模型在MSRA语料库上的中文命名实体识别准确率和召回率分别达到95.16%和94.58%,同时相比于片段神经网络模型和CNN-BiLSTM-CRF模型的F1值提升了4.43和3.78个百分点。
  • 李冠达, 金兢, 王凡, 夏营威, 杨学志
    计算机工程. 2022, 48(6): 95-106. https://doi.org/10.19678/j.issn.1000-3428.0061761
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    针对基于随机采样的路径规划算法效率低且采样具有随机性的问题,提出一种应用拓扑结构的高效路径规划算法ATIRRT*。通过引入拓扑节点代替STIRRT*算法中Harris角点检测算法得到的特征点进行采样,给出基于阈值的自适应选择方法来消除路径骨架上提取的冗余特征点,利用该阈值得到的拓扑节点可以使随机树的扩展更具方向性,从而减少寻找初始路径的时间和代价。根据非单一父节点的连接方式加强交叉支路上的拓扑节点间的联系,通过节点扩充策略增加相邻拓扑节点间的节点数量以加快优化算法的收敛。在此基础上定义相关约束条件将初始路径分段并进行逐段优化,以提高优化算法的效率。在常规环境、狭长空间和仿真的室内环境3种类型地图上的仿真结果表明,相较于STIRRT*算法,改进算法在规划路径长度上平均减少8%,在规划时间上平均降低10%,可快速地找到更优的初始路径,同时在优化过程中减少了无用的探索空间,提高了搜索效率。
  • 王树芬, 张哲, 马士尧, 陈俞强, 伍一
    计算机工程. 2022, 48(6): 107-114,123. https://doi.org/10.19678/j.issn.1000-3428.0061911
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    联邦学习允许边缘设备或客户端将数据存储在本地来合作训练共享的全局模型。主流联邦学习系统通常基于客户端本地数据有标签这一假设,然而客户端数据一般没有真实标签,且数据可用性和数据异构性是联邦学习系统面临的主要挑战。针对客户端本地数据无标签的场景,设计一种鲁棒的半监督联邦学习系统。利用FedMix方法分析全局模型迭代之间的隐式关系,将在标签数据和无标签数据上学习到的监督模型和无监督模型进行分离学习。采用FedLoss聚合方法缓解客户端之间数据的非独立同分布(non-IID)对全局模型收敛速度和稳定性的影响,根据客户端模型损失函数值动态调整局部模型在全局模型中所占的权重。在CIFAR-10数据集上的实验结果表明,该系统的分类准确率相比于主流联邦学习系统约提升了3个百分点,并且对不同non-IID水平的客户端数据更具鲁棒性。
  • 刘子怡, 王宇嘉, 孙福禄, 贾欣, 聂方鑫
    计算机工程. 2022, 48(6): 115-123. https://doi.org/10.19678/j.issn.1000-3428.0061885
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    代理模型利用近似预测代替算法对多目标优化问题的真实评价,大幅减少了算法寻优所需的真实适应度评估次数。为提高代理模型在求解高维问题时的准确性并降低计算开销,提出一种基于特征扰动与分配策略的集成辅助多目标优化算法。将径向基函数网络代理模型与支持向量机回归代理模型作为集成过程中的基模型,降低算法在高维问题上的计算开销。结合特征扰动与基于记忆的影响因子分配策略构建集成代理模型,提高集成准确性。使用集成预测值与不确定信息加权辅助管理集成代理模型,平衡全局搜索与局部探索,增强算法在目标空间中的寻优能力。实验结果表明,该算法在ZDT1~ZDT3和ZDT6测试问题上所得解集的分布性与收敛性相比经典算法更好,并且当决策变量维数增加时,使用集成代理模型相比于Kriging代理模型约减少了90%的适应度评估次数,同时可获得更准确的预测结果。
  • 网络空间安全
  • 任方, 薛斐元, 姚雪梅
    计算机工程. 2022, 48(6): 124-131. https://doi.org/10.19678/j.issn.1000-3428.0062356
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统基于预测误差直方图平移的可逆信息隐藏算法大多通过固定顺序来扫描原始图像,从而进行数据嵌入,这种方式没有考虑图像本身的纹理信息,导致无效移位像素点较多,伪装图像视觉质量较差。为解决该问题,提出一种基于中值预测的四轮嵌入可逆信息隐藏算法,以在提高嵌入容量的同时降低伪装图像的失真率。利用相邻像素之间具有较强相关性的特点,在较小的误差值处聚集大量像素点,以得到更陡峭的预测误差直方图并提高嵌入容量。对每个像素点定义复杂度,根据复杂度的高低对预测误差进行排序,优先在图像平滑区域嵌入数据,从而有效减少无效移位像素点个数,降低伪装图像的失真率。实验结果表明,该算法的最大嵌入率可以达到0.3 bpp,在0.1 bpp的嵌入率下峰值信噪比高达55.15 dB,与非对称直方图算法、误差直方图移位算法等相比,其具有较高的嵌入容量和较小的视觉失真率。
  • 李莉, 杜慧娜, 李涛
    计算机工程. 2022, 48(6): 132-138. https://doi.org/10.19678/j.issn.1000-3428.0062464
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    区块链技术的去中心化、数据难篡改等特性使其在溯源问题上体现出明显优势,基于区块链的溯源系统可以解决传统系统中信息孤岛、共享程度低以及数据可篡改等问题,从而保证数据的可追溯性。然而,区块链溯源系统中的数据可追溯性与用户隐私保护之间难以取得平衡。提出一种结合群签名、隐私地址协议、零知识证明以及属性加密的分布式可监管隐私保护方案。对群签名的群管理员机制进行改进,设置多群管理员生成用户私钥片段,用户根据返回的私钥片段计算自身私钥,并根据需要有选择性地对溯源数据进行属性加密,同时为链上数据设置特定的访问结构,以实现数据与用户的“一对多”通信。群管理员利用群公钥对交易双方的身份进行追踪与追责。符合数据特定访问结构的用户通过自身的属性私钥对密文进行解密从而获取数据信息。实验结果表明,该方案能在保证数据可追溯并实现交易双方监管的同时,提高链上数据的隐私保护水平,与现有隐私保护方案相比安全性更高。
  • 赵秉宇, 王柳生, 张美玲, 郑东
    计算机工程. 2022, 48(6): 139-145,153. https://doi.org/10.19678/j.issn.1000-3428.0061797
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    侧信道攻击是密码学研究的热点方向,碰撞攻击作为侧信道攻击的重要分支,可从泄露能量中有效提取中间值信息,根据中间值信息检测不同S盒之间的碰撞,并利用碰撞建立不同密钥字节之间的线性关系,缩小密钥候选值的空间。针对使用重用掩码的高级加密标准(AES)算法,自适应选择明文碰撞攻击方法需要预先建立攻击模板,并且实施攻击所需的前提条件较多。提出一种高效的随机明文碰撞攻击方法,基于2个不同S盒输入值的汉明距离及其对应能量迹的欧氏距离之间的关系,从256个密钥异或值中找出正确的密钥异或值。通过理论分析得出该方法无需预先确定碰撞阈值及建立攻击模板,即可有效利用能量迹中未发生碰撞的信息,并且所加密的明文是随机的,能在没有目标设备的情况下实施攻击。实验结果表明,与自适应选择明文碰撞攻击、改进型相关性碰撞攻击等方法相比,该方法减少了实现碰撞攻击所需的前提条件,并且扩大了攻击范围。
  • 生龙, 袁丽娜, 武南南, 姬少培
    计算机工程. 2022, 48(6): 146-153. https://doi.org/10.19678/j.issn.1000-3428.0061509
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    为了增强网络入侵检测模型的准确率与泛化性,提出一种基于引力搜索算法(GSA)与差分进化(DE)算法优化混合核极限学习机(ELM)的网络入侵检测模型。该模型针对采用单个核函数的ELM模型存在的泛化能力弱、学习能力差的问题,结合多项式核函数和径向基函数的优点,构建混合核ELM模型(HKELM),将GSA和DE相结合优化HKELM模型参数,从而提高其在异常检测过程中的全局和局部优化能力,在此基础上利用核主成分分析算法进行入侵检测数据的数据降维和特征抽取,构建网络入侵检测模型KPCA-GSADE-HKELM。在KDD99数据集上的实验结果表明,与KDDwinner、CSVAC、CPSO-SVM、Dendron等模型进行对比,KPCA-GSADE-HKELM模型具有更高的检测精度和更快的检测速度。
  • 杜田, 李欣, 赖成喆, 郑东
    计算机工程. 2022, 48(6): 154-166. https://doi.org/10.19678/j.issn.1000-3428.0062377
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    地图的实时性和准确性在无人驾驶车辆导航中发挥着重要作用。基于卫星图像的数字地图能够保证地图中道路信息的准确性,但是根据相关路况信息进行实时更新时,由于车辆用户数较多且来源复杂,因此无法确保数据的安全性和可靠性。提出一种基于区块链的认证与信任管理方案。利用无证书签名技术实现车辆的匿名认证,保证车辆身份的可验证性和不可否认性。设计基于区块链的信任管理机制,通过存储在区块链上的历史信任值计算路况消息的可信度,同时将可靠的路况信息发送给地图更新服务器,根据车辆提供信息的真实与否更新车辆信誉值,实现车辆信誉的同步与更新。从计算开销、通信开销和信任管理功能等方面验证了该方案的有效性。仿真结果表明,该方案具有较高的地图更新效率和防骗能力,能够确保数据来源的安全性和可靠性,为无人驾驶车辆提供实时路况更新服务。
  • 先进计算与数据处理
  • 钱文渊, 荆一楠, 王晓阳, 吴振环
    计算机工程. 2022, 48(6): 167-173. https://doi.org/10.19678/j.issn.1000-3428.0061625
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    基数估计是实现数据库多表连接(JOIN)查询优化的重要手段之一。对数据量较大的数据表进行基数估计时常用数据抽样来获得较小的样本,从而估计各种查询负载下所需的数据基数。在单表上利用数据抽样来完成基数估计的方法已经得到广泛研究,但在多个数据表的抽样样本总体存储预算存在限制时,目前仍缺乏有效的多表间样本数划分方法使得整体基数估计达到较优。为此,提出一种面向多表JOIN查询优化的基数估计方法,针对一组给定的含有复杂多JOIN操作的查询负载,为其合理分配数据库中每个表的抽样率,从而在满足样本大小总和限制的同时使得基数估计准确率达到最高。将上述过程抽象为一个抽样率分配搜索问题,在数据库数据抽样问题中引入贝叶斯优化搜索算法,利用该算法快速搜索出不同表之间抽样样本大小的分配比例,使得有限时间内获得的样本分配方案对应的基数估计准确率最高,从而达到查询优化的目的。在TPC-H数据集上的实验结果表明,在相同时间内确定多JOIN操作查询负载下基数估计准确率最高的抽样比例方案时,相比随机搜索算法,贝叶斯优化算法所得方案对应的基数估计误差率降低54.8%~60.2%。
  • 曹瑞阳, 郭佑民, 牛满宇
    计算机工程. 2022, 48(6): 174-181. https://doi.org/10.19678/j.issn.1000-3428.0062241
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    数据增强是解决数据集不平衡的有效方法,针对现有的数据增强方法存在生成样本越界和随机性差的问题,提出一种基于最大最小距离的多中心数据增强方法MCA。通过计算所有样本的加权密度,减少离群点对最终分类结果的影响,同时将抽样方法与最大最小距离算法相结合选择最优的数据,生成多中心点集,避免生成结果出现样本类别越界的情况,从而拓展样本数据的多样性,并且降低时间复杂度。在此基础上,根据样本的相似性构建权重函数,计算加权平均生成新的样本,解决原有数据集不平衡的问题。在SwedishLeaf数据集和实测数据集上进行实验,结果表明,相比SMOTE、Easy Ensemble、RR等方法,该方法的精确率和召回率均提高了1.17%以上,F1值提高了2%以上,能够有效提高泛化能力,在少数类和多数类样本不平衡率较高的情况下具有较优的分类性能。
  • 王晓峰, 于卓, 赵健, 曹泽轩
    计算机工程. 2022, 48(6): 182-192,199. https://doi.org/10.19678/j.issn.1000-3428.0063092
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    最大团问题是一个经典的组合优化问题,在蛋白质功能推测、竞胜标确定、视频对象分割等领域有广泛的应用。随着图例规模的增大,最大团问题求解难度增加,常规图例最大团求解算法已逐渐被大规模图例最大团求解算法取代。介绍求解大规模图例最大团问题的技术支撑点,重点总结基于大规模图例的最大团问题算法,并在大数据计算背景下对融合单层图划分方法和多层图划分方法的MapReduce框架和Spark框架进行优缺点分析。此外,比较k-core方法与k-community方法的应用场景,从算法分类的角度总结不同类型算法的优缺点,对求解大规模图例最大团问题的确定型算法进行梳理,并对代表性的求解算法在公开数据集中的表现进行对比分析。基于分析结果,指出不同算法在求解大规模图例最大团问题时需要重点关注的方面,并展望了智能优化算法、分层式深度强化学习方法、图结构相变分析技术的未来研究方向。
  • 范明亮, 郭子涵, 柴晓楠, 商建东
    计算机工程. 2022, 48(6): 193-199. https://doi.org/10.19678/j.issn.1000-3428.0061903
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    边缘检测是图像处理与计算机视觉领域中一种重要的图像分析方法,Sobel算子常用于粗精度的边缘提取,在图像边缘检测中被广泛应用。随着国产飞腾(FT)系列高性能数字信号处理器的发展,图像处理领域对FT平台的需求日益提高,同时急需实现面向FT平台的高性能图像处理算法。针对上述问题,在FT-M7002平台上对Sobel边缘检测算法进行向量并行优化,使用FT-M7002处理器内嵌SIMD指令,挖掘Sobel边缘检测算法中的数据级并行性,同时设计并实现一种字符型与整型数据间的并行化转换接口,使用循环展开优化方法提升指令节拍数,通过DMA矩阵转置解决数据访存不连续的问题。采用双缓冲技术实现数据传输与内核计算的并行,从而隐藏数据传输与计算之间的时间间隙。对比分析多种卷积核大小及图片规模下原Sobel算法与优化算法的性能,结果表明,与原始算法相比,该优化算法能取得1.66~3.14倍的加速比,此外,相较TMS320C6678处理器上的运行结果,在FT-M7002平台上优化算法可达到1.87~2.08倍的加速效果。
  • 吴正江, 张亚宁, 张真, 梅秋雨, 杨天
    计算机工程. 2022, 48(6): 200-206,212. https://doi.org/10.19678/j.issn.1000-3428.0062982
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    拟单层覆盖粗糙集与集值信息系统之间存在一一对应的映射关系,当集值信息系统中的对象集动态添加或移除时,对应拟单层覆盖粗糙集中的信息单元也会随之改变,导致拟单层覆盖粗糙集中的近似集发生变化。针对拟单层覆盖粗糙集中近似集的动态更新问题,将拟单层覆盖粗糙集与增量学习相结合,提出近似集的增量更新算法。设计拟单层覆盖集中信息单元的更新算法,以分析信息单元的变化情况,分别构建近似集中可靠单元和争议单元的相关可靠单元集的更新算法。在此基础上,设计与可靠单元和争议单元更新算法相对应的增量更新算法,并且分析其时间复杂度。在UCI数据集上的实验结果表明,与静态算法相比,该算法在对象集发生添加和移除情况下的近似集更新效率分别提高21.5和29倍,能够有效提高近似集的计算效率。
  • 图形图像处理
  • 丁泳钧, 黄山
    计算机工程. 2022, 48(6): 207-212. https://doi.org/10.19678/j.issn.1000-3428.0061823
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    雾霾天气会使计算机视觉相关系统获取到的图像质量下降并影响系统的正常工作。传统图像去雾算法通过分析大量图像建立模型,并找出清晰图像与模型之间的映射关系,但该类算法大多存在颜色失真和图像失真的问题,且在某些特定场景下可能失效。基于卷积神经网络的去雾算法得到的图像质量相对较好,但是该类算法对数据集要求较高,普遍需要成对数据进行训练,而获取同一时刻和场景下的有雾图像与无雾图像难度较高。提出一种基于循环生成对抗网络(CycleGAN)的改进图像去雾算法,该算法无需使用成对的数据进行训练。通过优化生成器生成的无雾图像与真实无雾图像之间的颜色损失,使得生成器能够生成与无雾图像具有相同颜色分布的图像。同时,通过向2个生成器中分别添加对应目标域图像的输入并引入特征损失函数,以解决经典CycleGAN在图像转换时存在的图像失真问题,从而更好地还原原始图像的细节特征。实验结果表明,相较DCP、CycleGAN、AOD-Net、Cycle-dehaze等算法,该算法的结构相似度提高4.3%~23.0%,峰值信噪比提高2.3%~36.9%,其能取得更好的去雾效果。
  • 邓翔宇, 吕亚辉, 陈岩
    计算机工程. 2022, 48(6): 213-221. https://doi.org/10.19678/j.issn.1000-3428.0061296
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    脉冲耦合神经网络(PCNN)模型具有脉冲调制和耦合连接特性,广泛应用于数字图像处理领域。然而现有PCNN模型的研究都是从时域或图像本身包含信息角度分析参数与模型特性之间的关系,无法全面解释参数对模型特性的影响。从PCNN模型的迭代方程出发,利用离散系统频域分析方法从频域角度对无耦合PCNN模型进行分析,揭示无耦合PCNN模型的动态门限子系统具有低通特性,并确定网络参数aE的选取范围,同时通过对脉冲发放时刻公式进行推导,得到参数vE的选取范围。采用傅里叶变换方法分析单个神经元的脉冲发放频率特性和动态门限衰减频率特性,解释无耦合PCNN模型的参数对频域特性的影响。仿真实验结果验证了该理论分析结论的正确性,从频域角度理解无耦合PCNN模型的参数与模型特性之间的关系,为挖掘PCNN模型特性提供一种新的方法。
  • 李莉, 王新强, 银珊
    计算机工程. 2022, 48(6): 222-227. https://doi.org/10.19678/j.issn.1000-3428.0062355
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    水下物理环境复杂多变,导致获取的水下图像颜色失真、对比度低且细节模糊,影响了水下场景探测的准确性。结合衰减补偿和直方图拉伸技术,提出水下图像增强算法ACHS。根据不同颜色通道的衰减特性,设计基于衰减补偿的颜色校正方法解决水下图像颜色失真问题。将需要颜色校正的水下图像从RGB颜色模型转换到LAB颜色模型,使用引导滤波将亮度通道L分解为基础层和细节层,同时提出基于K-means聚类的双直方图增强算法用于增强基础层的对比度,通过Gamma校正突显细节层的纹理结构。在此基础上,累加亮度通道L的基础层和细节层,并将其从LAB颜色模型转换到RGB颜色模型以获取最终的增强图像。实验结果表明,与GDCP、REBE、WaterNet等算法相比,经该算法增强的水下图像可视度较高,并且具有自然的颜色和清晰的细节。
  • 柳聪, 屈丹, 司念文, 魏紫薇
    计算机工程. 2022, 48(6): 228-234. https://doi.org/10.19678/j.issn.1000-3428.0061892
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    图像超分辨率重建旨在依据低分辨率图像重建出接近真实的高分辨率图像,现有基于卷积神经网络的图像超分辨率重建方法存在网络参数量大、重建速度慢等问题,从而限制其在内存资源小的终端设备上的应用。提出一种基于深度可分离卷积的轻量级图像超分辨率重建网络,利用深度可分离卷积提取图像的特征信息,减少网络的参数量,采用对比度感知通道注意力机制获取图像的对比度信息,并将其作为全局信息,同时对提取特征的不同通道权重进行重新分配,增强重建图像的细节纹理信息。在此基础上,采用亚像素卷积对图像特征进行上采样操作,提高整体重建图像质量。实验结果表明,当放大倍数为2、3和4时,该网络的参数量分别为140 000、147 000和152 000,重建时间为0.020 s、0.014 s和0.011 s,相比VDSR、RFDN、IDN等网络,在保证重建效果的前提下能够有效减少网络参数量。
  • 蒋明, 陈雨, 周青华, 袁媛, 何世琼
    计算机工程. 2022, 48(6): 235-242. https://doi.org/10.19678/j.issn.1000-3428.0060882
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    空间非合作目标的增多导致太空安全受到严重威胁,对非合作目标进行捕获回收具有维护空间安全、节约资源等现实意义。非合作目标捕获回收需要进行位姿估计,而目前在硬件资源有限的航天器平台上,现有的大多数非合作目标位姿估计算法无法同时满足及时性和准确性的要求。设计一种超轻量级目标检测网络YOLO-GhostECA,利用GhostBottleneck网络减少特征图冗余,并使用高效注意力机制提取核心特征图,以降低模型参数,在提升运算速度的同时保证精度水平几乎不下降。根据YOLO-GhostECA网络的检测结果粗略估计姿态,以协助机械臂更加合理地执行智能捕获任务,解决2D识别算法无法检测出物体姿态的问题。在7自由度冗余机械臂上开展的空间非合作目标捕获地面模拟的实验结果表明,与YOLOv5s网络相比,该网络模型大小减小了80.4%,运算复杂度降低了78.9%,而精度基本保持不变,可准确快速地对非合作目标进行位姿估计,能够引导机器人成功捕获非合作物体。
  • 许嘉麟, 姚双, 张蕊华, 许浩, 沈洋
    计算机工程. 2022, 48(6): 243-250. https://doi.org/10.19678/j.issn.1000-3428.0062801
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    点云识别与分割在应用过程中通常需要提取空间旋转不变和置换不变的点云特征,PointCNN采用监督学习的方式来提取,但会产生额外的计算量,PointNet使用最大池化算子提取置换不变特征,且容易忽略点云的局部信息,导致识别准确率下降。提出一种基于亲疏度矩阵的新方法,将点云空间坐标映射到曲率特征空间,提取空间旋转不变特征。通过K邻域内的点集合构建基于欧式内积的亲疏度矩阵,对亲疏度矩阵特征值进行排序,并将对应的特征向量组成变换矩阵,从而变换点云特征,进行置换不变的点云特征卷积操作。在ModelNet40数据集上的实验结果表明,该方法的总体准确率和类别平均准确率分别为92.28%和88.80%,超过PointCNN等基于卷积的方法。此外,该方法通过代数计算的方式获得变换矩阵,可以提高模型训练的效率,且浮点运算数仅为36.6×106 frame/s,大幅降低了训练的复杂度。
  • 王道累, 杜文斌, 刘易腾, 张天宇, 孙嘉珺, 李明山
    计算机工程. 2022, 48(6): 251-256,262. https://doi.org/10.19678/j.issn.1000-3428.0061482
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    遥感技术的快速发展使得遥感图像检测技术广泛应用于军事、农业、交通、城市规划等多个领域。随着遥感分辨率和数据体量的不断提升,通过人工处理数据的方法已经无法满足实时性需求,因此,实现高效、精准的自动化数据处理方式成为该领域的研究热点。针对遥感图像分辨率高、背景复杂、目标尺度小等特点,提出一种改进的YOLOv3算法,用以提升遥感图像的检测效果。在原始YOLOv3算法的基础上,使用改进的密集连接网络替换原有的DarkNet53作为基础网络,以提升网络输入和预测结果的尺度多样性。通过阀杆模块降低输入损失,同时在浅层特征图中加入特征增强模块,从而丰富特征图的感受野,强化网络对浅层特征信息的提取,在保证整体检测性能的同时使网络对遥感图像中、小目标的检测精度和鲁棒性均有所提升。在遥感图像数据集上进行多组对比实验,结果表明,相比原始YOLOv3算法,该算法的平均准确率提高9.45个百分点,在小尺度目标上的检测准确率提升更显著,达到11.03个百分点,且模型参数量得到有效缩减。
  • 史宝岱, 张秦, 李瑶, 李宇环
    计算机工程. 2022, 48(6): 257-262. https://doi.org/10.19678/j.issn.1000-3428.0061569
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统图像目标识别模型通常使用结构复杂、层数更深的神经网络以提升其在计算机视觉领域的准确率,但该类模型存在对计算机算力要求过高、占用内存较大、无法部署在手机等小型计算机上的问题。提出一种轻量化卷积神经网络ConcatNet,采用特征拼接的方式,通过多支路并行将通道注意力机制与深度可分离卷积相结合,在增强有效特征权重的基础上,降低模型的参数量和复杂度,实现网络的轻量化。在网络输出阶段,采用先筛选再混洗的方式提高模型的识别精度。利用全局平均池化和全局随机池化提取中间特征图的信息,其中全局平均池化可以较好地保留背景信息,全局随机池化按概率值选取特征,具有较强的泛化性,两者相结合能够减少信息的丢失。在CIFAR-10、CIFAR-100等数据集上的实验结果表明,与MobileNetV2等轻量化神经网络相比,ConcatNet网络在保持Top-1和Top-5精度相当的情况下,将参数量和计算复杂度均降低了约50%,极大降低了对承载设备的要求。
  • 张国庭, 陈利霞, 周泽锋
    计算机工程. 2022, 48(6): 263-269. https://doi.org/10.19678/j.issn.1000-3428.0061356
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    传统背景减除模型在背景静止和前景对象移动较快时提取到的前景效果较好,但当背景变化或前景对象移动缓慢时容易将动态背景误判为前景或检测出的前景有较多空洞。针对传统背景减除模型在动态背景和前景对象移动缓慢条件下存在前景检测精度下降的问题,提出一种基于l1/2范数与显著性约束的背景减除模型。将观测数据分为低秩背景、运动前景和动态干扰3类,利用l1/2范数约束运动前景加强前景稀疏性,有效抑制动态背景对前景提取造成的干扰,提高运动前景在动态背景中的检测精度。引入视频每一帧的显著性约束,通过对每一帧图像进行低秩稀疏分解来检测移动缓慢的目标。实验结果表明,该模型对于复杂场景具有较强的适应能力,可有效去除动态背景对前景的干扰,快速检测出移动缓慢的前景对象,相比于l1/1/2-RPCA背景减除模型的平均查全率、查准率和调和平均值分别提升了9、14和10个百分点。
  • 开发研究与工程应用
  • 杨志勇, 王俊杰, 金磊
    计算机工程. 2022, 48(6): 270-277. https://doi.org/10.19678/j.issn.1000-3428.0061833
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    人口老龄化是当今社会发展不可忽视的问题,目前有很大一部分老年人在无人照顾的境况下独自生活,摔倒后无法及时得到救助成为威胁老人生命安全的重要原因之一。现有的人体摔倒检测方法存在适应性差、高入侵性、易误判、成本昂贵等问题,且无法快速、实时检测老人摔倒。提出一种基于机器学习和无线传感器网络的摔倒检测方法,使用多个物联网传感节点组建无线传感器网络采集RSS数据,对采集到的RSS数据进行预处理后,通过XGBoost模型对时域特征分量和小波域特征分量进行处理,并以排列组合方式得到具有强鲁棒性的联合特征分量。利用深度学习网络获得数据潜在规律的特点构建人体摔倒识别模型,采用卷积神经网络作为主干网络,并在相邻网络层之间引入通道注意力模块,通过构建SE-CNN模型实现人体摔倒检测。实验结果表明,联合特征的加入能够提高RSS数据的可区分性,且SE-CNN模型的识别准确率高于CNN模型,可以实现高准确率的人体摔倒检测。
  • 李琴, 李少波, 胡杰
    计算机工程. 2022, 48(6): 278-287,294. https://doi.org/10.19678/j.issn.1000-3428.0061490
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    网络文本作为现代游客承载感知和表达观点的载体,已成为游客画像构建与分析的重要数据来源。现有的自然语言处理技术在游客画像的挖掘过程中主要关注游客的需求和情感,缺少技术与旅游应用的有效衔接,然而现有的文本挖掘技术中文本的主题和情感通常被割裂分析,缺乏相互指向性,无法有效提取用户细粒度的意见。提出一种基于变分自编码的有监督主题情感联合分析模型。将词频权重引入到先验知识中,同时通过截断高斯模型构造变参数,有效捕获离散数据中的相关性,利用情感标签辅助主题的训练和生成,以提升主题挖掘及情感预测的准确率。通过变分自编码模型计算贝叶斯主题模型的后验分布,采用主题分布下的情感分类预测实现主题情感的联合分析。实验结果表明,当主题数为10~100时,该模型的情感预测平均准确率约为85%,相比LDA、SAGE、NVDM模型,能够有效挖掘酒店用户评论的特征。
  • 王刚, 孙媛媛, 陈彦光, 林鸿飞
    计算机工程. 2022, 48(6): 288-294. https://doi.org/10.19678/j.issn.1000-3428.0061119
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    文本摘要是指对文本信息内容进行概括、提取主要内容进而形成摘要的过程。现有的文本摘要模型通常将内容选择和摘要生成独立分析,虽然能够有效提高句子压缩和融合的性能,但是在抽取过程中会丢失部分文本信息,导致准确率降低。基于预训练模型和Transformer结构的文档级句子编码器,提出一种结合内容抽取与摘要生成的分段式摘要模型。采用BERT模型对大量语料进行自监督学习,获得包含丰富语义信息的词表示。基于Transformer结构,通过全连接网络分类器将每个句子分成3类标签,抽取每句摘要对应的原文句子集合。利用指针生成器网络对原文句子集合进行压缩,将多个句子集合生成单句摘要,缩短输出序列和输入序列的长度。实验结果表明,相比直接生成摘要全文,该模型在生成句子上ROUGE-1、ROUGE-2和ROUGE-L的F1平均值提高了1.69个百分点,能够有效提高生成句子的准确率。
  • 张家钧, 唐云祁, 杨智雄
    计算机工程. 2022, 48(6): 295-303. https://doi.org/10.19678/j.issn.1000-3428.0061942
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    随着监控摄像头的普及和图侦技术的快速发展,“鞋印+监控”技战法成为公安机关侦破案件的重要手段。该技战法根据现场嫌疑鞋印推断出嫌疑鞋型,进而在犯罪现场周围监控视频中查找对应鞋型,锁定犯罪嫌疑人。然而现有鞋型识别算法无法充分提取嫌疑鞋印的重要特征,导致识别准确率降低。针对该问题,提出一种融合自适应感受野模块与多支路特征的鞋型识别算法。通过设计一种自适应感受野模块,使网络自适应选择合适大小的感受野特征,增强网络的特征提取能力,同时构建多支路特征融合模型,融合网络的深层和浅层特征,以充分利用有效特征进行鞋型识别,从而提高识别精度。在此基础上,采用中心损失函数和标签平滑损失函数联合训练的方法,在增大类间差距的同时缩小类内差距,增强模型的泛化能力。在多背景鞋型数据集上进行实验,结果表明,该算法Rank-1和mAP精度分别为79.77%和62.18%,具有较优的识别效果,为公安刑侦实战提供了一种可行方案。
  • 程志康, 孙锐, 孙琦景, 张旭东
    计算机工程. 2022, 48(6): 304-313. https://doi.org/10.19678/j.issn.1000-3428.0062018
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    跨年龄人脸合成是指通过已知特定年龄的人脸图像合成其他年龄段的人脸图像,在动漫娱乐、公共安全、刑事侦查等领域有广泛的应用。针对跨年龄人脸合成图像容易产生器官变形扭曲、人脸局部特征保持效果不佳等问题,提出一种基于条件对抗自动编码器的合成方法。通过在解码器结构中引入通道关注和空间关注模块,分别从通道域和空间域提取重要信息,使模型在训练过程中忽略背景等无关信息,聚焦人脸图像变化的区域,有效解决合成图像器官扭曲变形等问题。此外,设计一种多尺度特征损失网络,从多个尺度更深层次地约束人脸图像的局部结构特征,从而保持人脸合成过程中局部特征结构的稳定性。在UTKFace跨年龄人脸数据集上的实验结果表明,与CAAE方法相比,该方法有效避免了人脸器官变形扭曲问题,能够更好地保持人脸局部结构特征,具有较佳的人脸合成效果和细节保持能力。
  • 佘朝阳, 严馨, 徐广义, 陈玮, 邓忠莹
    计算机工程. 2022, 48(6): 314-320. https://doi.org/10.19678/j.issn.1000-3428.0062170
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
    目前药物不良反应(ADR)研究使用的数据主要来源于英文语料,较少选用存在标注数据稀缺问题的中文医疗社交媒体数据集,导致对中文医疗社交媒体的研究有限。为解决标注数据稀缺的问题,提出一种新型的ADR检测方法。采用ERNIE预训练模型获取文本的词向量,利用BiLSTM模型和注意力机制学习文本的向量表示,并通过全连接层和softmax函数得到文本的分类标签。对未标注数据进行文本增强,使用分类模型获取低熵标签,此标签被作为原始未标注样本及其增强样本的伪标签。此外,将带有伪标签的数据与人工标注数据进行混合,在分类模型的编码层和分类层间加入Mixup层,并在文本向量空间中使用Mixup增强方法插值混合样本,从而扩增样本数量。通过将数据增强和半监督学习相结合,充分利用标注数据与未标注数据,实现ADR的检测。实验结果表明,该方法无需大量的标注数据,缓解了标注数据不足对检测结果的影响,有效提升了药物不良反应检测模型的性能。