作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

2024年, 第50卷, 第5期 刊出日期:2024-05-15
  

  • 全选
    |
    封面和目录
  • 计算机工程. 2024, 50(5): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 热点与综述
  • 熊世强, 何道敬, 王振东, 杜润萌
    计算机工程. 2024, 50(5): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0067782
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    联邦学习(FL)是一种新兴的分布式机器学习技术, 只需将数据留在本地即可通过各方协作训练一个共有模型, 解决了传统机器学习中数据难以采集和隐私安全的问题。随着联邦学习技术的应用和发展, 相关研究发现联邦学习仍可能受到各类攻击。为了确保联邦学习的安全性, 研究联邦学习中的攻击方式及相应的隐私保护技术显得尤为重要。首先介绍了联邦学习的背景知识及相关定义, 总结概括了联邦学习的发展历程及分类; 接着阐述了联邦学习的安全三要素, 从基于安全来源和基于安全三要素2个角度分类概述了联邦学习中的安全问题及研究进展; 然后对隐私保护技术进行分类, 结合相关研究应用综述了联邦学习中安全多方计算(SMC)、同态加密(HE)、差分隐私(DP)、可信执行环境(TEE)4种常用隐私保护技术; 最后对联邦学习的未来研究方向进行展望。

  • 江惠珍, 孙艳春, 黄罡
    计算机工程. 2024, 50(5): 16-25. https://doi.org/10.19678/j.issn.1000-3428.0068655
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    GitHub是全球最大的在线代码托管平台, 为软件开发学习者提供了丰富的学习资源, 然而面对丰富而繁杂的GitHub内容, 软件开发初学者在使用GitHub的搜索功能搜索所需的学习资源时, 由于需求不明确或缺乏相关知识和经验, 常会遇到难以构建合适的搜索文本进行有效搜索的问题。针对该问题, 利用GitHub主题潜在的层次结构, 结合Wikipedia软件开发领域知识, 设计GitHub软件开发领域知识图谱, 在此基础上提出一种基于知识图谱的GitHub层次化学习和检索服务。通过对比实验和调查问卷的方式验证了提出的层次化学习和检索服务的可行性和有效性。

  • 吴翠翠, 王维东
    计算机工程. 2024, 50(5): 26-32. https://doi.org/10.19678/j.issn.1000-3428.0067904
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    非视域(NLOS)成像是一种综合成像和计算重构的技术, 指在不直接拍摄场景的情况下通过获取介质上隐藏场景的散射或反射信息对其进行重建。目前的NLOS成像还处于早期发展阶段, 场景模型、目标信息重建等尚无系统研究方法。为此, 提出一种针对无遮挡、非自发光场景的NLOS成像方法。基于光辐射理论, 分析该场景下漫反射面的成像与隐藏物体形状的关系, 确定NLOS成像模型与重建目标。使用渲染软件结合运动图像专家组7(MPEG7)数据集, 生成符合实际物理意义的漫反射被动非视域全影(DS-NLOS)数据集。构建被动非视域重建网络模型(Re-NLOS), 采用视觉Transformer(ViT)结构结合生成式对抗网络(GAN)提取采集的漫反射面图像的全局特征, 并恢复隐藏物体形状。在DS-NLOS数据集上的实验结果表明, 该方法能够从漫反射面上恢复隐藏物体的形状信息, 在测试集20个类别的物体上的峰值信噪比(PSNR)和结构相似性(SSIM)相比漫反射面全影图像平均提高了5.85 dB和0.038 1, 对真实室内场景也具有一定的恢复能力。

  • 曾灵灵, 张敦博, 沈立, 窦强
    计算机工程. 2024, 50(5): 33-40. https://doi.org/10.19678/j.issn.1000-3428.0067271
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现代计算机一直沿用传统的线性数据布局模式, 该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问, 但是增加了高效执行列优先数据访问的复杂性, 造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案是对原始矩阵进行预先转置操作, 将列优先访问的复杂性集中在一次矩阵转置运算中, 然而矩阵转置不仅会引入额外的数据传输操作, 而且会消耗额外的存储空间用于存储转置后的矩阵。为了在不引入额外开销的情况下使行优先与列优先数据访问具有同样高效的访存效率, 提出一种新颖的交错映射(IM)数据布局, 同时在不改变便笺式存储器(SPM)内部结构的基础上, 在SPM的输入和输出(I/O)接口处添加循环移位单元和译码单元2个新组件, 实现交错映射数据布局并定制访存指令, 使程序员可通过定制的访存指令充分利用该数据布局。实验结果表明, 应用交错映射数据布局的SPM在仅额外增加了1.73%面积开销的情况下获得了1.4倍的加速。

  • 周昭辰, 方清茂, 吴晓红, 胡平, 何小海
    计算机工程. 2024, 50(5): 41-50. https://doi.org/10.19678/j.issn.1000-3428.0068121
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    机器阅读理解旨在让机器像人类一样理解自然语言文本, 并据此进行问答任务。近年来, 随着深度学习和大规模数据集的发展, 机器阅读理解引起了广泛关注, 但是在实际应用中输入的问题通常包含各种噪声和干扰, 这些噪声和干扰会影响模型的预测结果。为了提高模型的泛化能力和鲁棒性, 提出一种基于掩码校正的来自Transformer的双向编码器表示(MacBERT)与对抗训练(AT)的机器阅读理解模型。首先利用MacBERT对输入的问题和文本进行词嵌入转化为向量表示; 然后根据原始样本反向传播的梯度变化在原始词向量上添加微小扰动生成对抗样本; 最后将原始样本和对抗样本输入双向长短期记忆(BiLSTM)网络进一步提取文本的上下文特征, 输出预测答案。实验结果表明, 该模型在简体中文数据集CMRC2018上的F1值和精准匹配(EM)值分别较基线模型提高了1.39和3.85个百分点, 在繁体中文数据集DRCD上的F1值和EM值分别较基线模型提高了1.22和1.71个百分点, 在英文数据集SQuADv1.1上的F1值和EM值分别较基线模型提高了2.86和1.85个百分点, 优于已有的大部分机器阅读理解模型, 并且在真实问答结果上与基线模型进行对比, 结果验证了该模型具有更强的鲁棒性和泛化能力, 在输入的问题存在噪声的情况下性能更好。

  • 人工智能与模式识别
  • 胡傲然, 陈晓红
    计算机工程. 2024, 50(5): 51-61. https://doi.org/10.19678/j.issn.1000-3428.0067660
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着数据采集技术的发展, 多视图数据变得越来越常见。与单视图数据相比, 多视图数据包含更丰富的信息, 通常用一致性与多样性来刻画。现有基于图的多视图聚类方法大多只关注视图间的一致性信息, 忽视了视图间的多样性信息, 并且图的构建与聚类过程分离, 从而影响聚类算法的效果。提出基于多样性与一致性的单步多视图聚类算法(OMCDC)。基于“距离较近的数据点成为邻居的可能性较大”这一先验知识构建各个视图的相似性图。不同于以往算法直接融合相似性图获得公共图, OMCDC将每个视图的相似性图分解为一致性图和多样性图, 通过融合一致性图获得更具一致性的公共图。在此基础上, 引入谱旋转, 联合优化低维谱嵌入和聚类概率矩阵, 将图学习和聚类融为一体, 直接获得聚类结果。OMCDC充分利用了多视图数据的一致性信息与多样性信息, 结合谱旋转实现了单步多视图聚类。实验结果表明, 该算法在100L和HW2数据集上的聚类准确率分别为94.62%和99.30%, 相比MVGL、AWP、MCGC等方法具有较优的聚类性能。

  • 孙文洁, 李宗民, 孙浩淼
    计算机工程. 2024, 50(5): 62-70. https://doi.org/10.19678/j.issn.1000-3428.0067919
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    如何在部分可观测的情况下实现智能体之间的协同配合是多智能体强化学习(MARL)中的一个重要问题。值函数分解方法解决了信用分配问题, 是一种实现多智能体之间协同配合的有效方法, 然而在现有的值函数分解方法中, 智能体个体动作值函数仅取决于局部信息, 不允许智能体之间进行显式的信息交换, 阻碍了这一系列算法的性能, 使其无法适用于复杂场景。为了解决这一问题, 在值函数分解方法中引入智能体间的通信, 为智能体提供有效的非局部信息以帮助其理解复杂环境。在此基础上, 提出一个基于图神经网络的分层通信模型, 通过图神经网络提取相邻智能体之间需要交换的有用信息, 同时模型能够实现从非通信向充分通信过渡, 在通信范围有限的情况下实现全局合作, 适用于现实世界中通信范围受约束的情况。在星际争霸Ⅱ多智能体挑战赛(SMAC)环境和捕食者-猎物(PP)环境下进行实验, 结果表明, 在SMAC的4个不同场景下, 该方法与QMIX、VBC等基线算法相比平均胜率提升2~40个百分点, 并且能够有效解决非单调环境下的捕食者-猎物问题。

  • 吴正江, 吕成功, 王梦松
    计算机工程. 2024, 50(5): 71-82. https://doi.org/10.19678/j.issn.1000-3428.0067603
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    拟单层覆盖粗糙集是一种匹配集值信息系统且有高质量和高效率的粗糙集模型。拟单层覆盖近似集的计算过程中存在大量计算密集且逻辑简单的运算, 为此, 提出拟单层覆盖近似集的矩阵化表示方法, 以利用图形处理器(GPU)强大的计算性能加速计算过程。为了实现这一目标, 使用布尔矩阵表示拟单层覆盖近似空间中的元素, 引入与集合运算对应的布尔矩阵算子, 提出拟单层覆盖粗糙近似集(DE、DA、DE0与DA0)的矩阵表示, 并设计矩阵化拟单层覆盖近似集算法(M_SMC)。同时, 相应的定理证明了拟单层覆盖近似集的矩阵表示形式与原始定义的等价性。然而, M_SMC运行过程中出现了矩阵存储和计算步骤的内存消耗过多问题。为了将算法部署到显存有限的GPU上, 优化矩阵存储和计算步骤, 提出分批处理的矩阵化拟单层覆盖近似集算法(BM_SMC)。在10个数据集上的实验结果表明, 融合GPU的BM_SMC算法与单纯使用中央处理器(CPU)的BM_SMC算法相比计算效率提高2.16~11.3倍, BM_SMC算法可以在有限的存储空间条件下充分利用GPU, 能够有效地提高拟单层覆盖近似集的计算效率。

  • 游奔, 李晓红, 姚锦, 冯绍杰
    计算机工程. 2024, 50(5): 83-90. https://doi.org/10.19678/j.issn.1000-3428.0066475
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    短文本语义稀疏模糊、蕴含信息不足、表达不规则等缺陷给短文本分类任务带来了极大的挑战, 且现有短文本分类方法通常忽略词项间的交互信息, 不能充分挖掘隐含的语义信息, 导致分类效率低下。针对上述问题, 提出一种基于多粒度图与注意力机制的半监督短文本分类模型MgGAt。该模型在词粒度和文本粒度基础上构建2种类型的图, 通过充分挖掘语义信息完成分类任务。首先构建词级图, 捕获词嵌入, 进而学习得到文本特征表示。在词级图上引入跳内注意力和跳间注意力, 从多种语义角度有效提取词项间隐含的高阶信息, 捕获语义丰富的词嵌入。同时依据词级子图的特点设计池化策略, 聚合词嵌入, 学习文本表征。其次构建文本级图, 借助部分已知的标签信息, 利用图神经网络的优势, 在图上执行标签传播和推理, 完成半监督短文本分类任务。在4个公开数据集上的实验结果表明, 与基线模型相比, MgGAt模型的短文本分类精确率平均提升了1.18个百分点, F1值平均提升了1.37个百分点, 具有更好的分类性能。

  • 傅明建, 郭福强
    计算机工程. 2024, 50(5): 91-99. https://doi.org/10.19678/j.issn.1000-3428.0068112
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    无信号灯左转路口是自动驾驶场景中最为危险的场景之一, 如何实现高效安全的左转决策是自动驾驶领域的重大难题。深度强化学习(DRL)算法在自动驾驶决策领域具有广阔应用前景。但是, 深度强化学习在自动驾驶场景中存在样本效率低、奖励函数设计困难等问题。提出一种基于专家先验的深度强化学习算法(CBAM-BC SAC)来解决上述问题。首先, 利用SMARTS仿真平台获得专家先验知识; 然后, 使用通道-空间注意力机制(CBAM)改进行为克隆(BC)方法, 在专家先验知识的基础上预训练模仿专家策略; 最后, 使用模仿专家策略指导深度强化学习算法的学习过程, 并在无信号灯路口左转决策中进行验证。实验结果表明, 基于专家先验的DRL算法比传统的DRL算法更具优势, 不仅可以免去人为设置奖励函数的工作量, 而且可以显著提高样本效率从而获得更优性能。在无信号灯路口左转场景下, CBAM-BC SAC算法与传统DRL算法(SAC)、基于传统行为克隆的DRL算法(BC SAC)相比, 平均通行成功率分别提高了14.2和2.2个百分点。

  • 张宝鑫, 杨丹, 聂铁铮, 寇月
    计算机工程. 2024, 50(5): 100-110. https://doi.org/10.19678/j.issn.1000-3428.0067851
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的图协同过滤算法在现实场景中存在数据稀疏问题, 同时在相邻信息聚合的过程中使得特征学习更容易受到交互噪声的影响。为了解决上述问题, 提出一个基于自监督的多视角图协同过滤(SMGCF)推荐方法, 通过图神经网络学习用户和项目节点的嵌入表示。在学习节点嵌入表示的过程中, 考虑到单个节点间的交互关系以及聚类节点间的聚类关系对推荐结果的影响, 引入自监督学习来辅助图协同过滤算法进行多视角关系的挖掘。针对节点交互级关系视角, 通过数据增强得到多个用户-项目交互二分图, 并且提出一种节点交互级关系的对比学习方法; 针对节点聚类级关系视角, 提出一种节点聚类级关系的对比学习方法。通过多视角融合策略将2种类型的对比学习方法进行融合, 从而提升节点嵌入效果。在4个公开的数据集上进行实验, 实验结果证明了SMGCF的可行性和有效性。相比最优基准方法NCL, SMGCF在Recall@10和NDCG@10指标上最高可提升2.1%和4.3%。

  • 曹渝昆, 程宇, 何祯奕, 徐康乐, 颜家洛, 李云峰
    计算机工程. 2024, 50(5): 111-119. https://doi.org/10.19678/j.issn.1000-3428.0067686
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    关系抽取是指从文本中识别2个实体的关系。现有研究利用数据分组处理取得了良好的效果, 但由于组内数据之间交互较少, 因此大多忽略了组内数据之间的关联。此外, 部分方法定义了较多种类的标注信息, 从而导致标注信息冗余。针对上述问题, 提出一种文档上下文异构表示的句子级关系抽取方法。设计基于异构图网络的文档上下文信息模块, 将组内数据中的词和关系建模为图上的节点, 然后通过消息传递机制将组内信息进行交互, 充分表征组内数据间的关联关系; 设计基于异构图网络的关系信息模块用于捕捉关系信息, 其与文档上下文信息模块中异构图网络参数共享, 从而节约了计算资源; 设计融合标记策略, 引入一种逻辑上的虚拟标签减少标签种类, 缓解标注信息冗余问题。实验结果表明, 所构建模型在NYT和WebNLG数据集上的F1值分别为93.2%和94.7%, 在复杂场景下的8个子任务中, 取得了6个子任务的最优表现, 验证了所提方法的有效性。

  • 代巍, 王丰羽, 冀常鹏
    计算机工程. 2024, 50(5): 120-127. https://doi.org/10.19678/j.issn.1000-3428.0067847
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    方面级情感分析旨在检测给定方面句子的情感极性。现有研究大多在句法依存树上构造图卷积网络, 以获取方面词与上下文之间的句法信息。然而这类方法存在提取信息不够丰富、缺乏对句子中情感信息的挖掘等问题。针对上述问题, 提出基于情感增强与双图卷积网络的方面级情感分析模型。该模型由双通道图卷积网络组成, 旨在挖掘句子中的情感信息、句法信息和语义信息。利用位置信息和情感知识在依存树上构造情感增强依存图, 并以此构建情感增强图卷积网络, 增强方面词与上下文之间的情感依赖关系, 同时挖掘句子中丰富的句法信息特征。构建基于多头注意力机制的图卷积网络, 获取句子中的语义特征信息。对双图卷积网络的输出特征进行掩码、平均池化和拼接等操作, 并通过情感分类层进行分类。实验结果表明, 该模型与经典的图卷积网络模型(ASGCN)相比, 在Restaurant、Laptop和Twitter数据集上的准确率和F1值分别提升3.43和5.69、3.13和3.92、3.57和4.02个百分点, 具有较好的情感分类性能。

  • 网络空间安全
  • 梁松林, 林伟, 王珏, 杨庆
    计算机工程. 2024, 50(5): 128-138. https://doi.org/10.19678/j.issn.1000-3428.0067968
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的后渗透行为研究主要针对主机端进行攻击与防御反制, 缺乏对流量侧的模式分析与检测方法。随着后渗透攻击框架与攻击工具的快速发展与广泛使用, 基于统计特征或原始流量输入的恶意流量检测模型难以应对复杂多变场景下的后渗透攻击行为恶意流量, 存在泛化能力弱、检测精度低、误报率高等问题。通过深入分析后渗透攻击恶意流量样本与正常网络流量会话流, 提出后渗透攻击恶意流量的会话流级别粒度划分方法, 挖掘后渗透攻击恶意流量在时间尺度上的交互行为与语义表示。引入一种基于马尔可夫模型的时间向量特征提取方法表征流序列的行为相似度, 对会话流进行全局行为建模, 解决单一粒度特征学习能力不足的问题, 进而构建基于多粒度特征融合的后渗透攻击恶意流量检测框架。实验结果表明, 该方法在后渗透攻击行为恶意流量多分类检测任务上达到了99.98%的准确率, 具有较高的分类准确性与较低的误报率。

  • 旋逸昭, 赵红武, 金瑜
    计算机工程. 2024, 50(5): 139-148. https://doi.org/10.19678/j.issn.1000-3428.0067861
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    共识机制是区块链系统的核心技术, 目前针对“非币”区块链系统提出的基于贡献值证明与工作量证明(PoC+PoW)的共识机制存在共识效率较低、可靠性和安全性不高、算力消耗大的缺点。提出一种新的基于双链的共识机制CON_DC_PBFT。在该共识机制中设计一种业务链-系统链双链结构, 将贡献值等系统数据和主要业务数据分离到双链中各自完成共识处理, 双链的共识表现为半独立的形式, 业务链共识消息流受系统链监督协调, 并且系统链根据贡献值随机指定业务链的记账节点, 双链的分工与协同实现并行化和流水化, 改善共识的效率。由于贡献值数据不能被轻易获取, 通过拜占庭通信机制和节点随机选择算法, 降低节点遭受攻击和系统停滞的风险。通过实验综合分析出块选择概率、单点故障率、节点数、区块传输速率、CPU使用率对共识机制的性能影响, 结果表明, 与PoC+PoW机制相比, CON_DC_PBFT共识机制节省了50%以上内存、存储资源占用, 在综合共识时延上有30%以上的改善。

  • 顾永跟, 李国笑, 吴小红, 陶杰, 张艳琼
    计算机工程. 2024, 50(5): 149-157. https://doi.org/10.19678/j.issn.1000-3428.0067742
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    联邦学习是一种实现数据隐私保护的分布式机器学习范式, 性能取决于数据源的质量和数据规模。客户端是理性个体, 参与联邦学习将耗费计算、通信和隐私等成本, 需要通过激励提高客户端的参与意愿。因此联邦学习能成功应用的关键之一是尽可能多地激励高质量数据客户端参与训练。多任务联邦学习环境下客户端拥有面向不同任务且质量不同的数据, 并具有执行能力的约束。为提高多个学习任务的整体性能, 在预算受限的条件下设计一种面向任务的客户选择和报酬机制。通过分析影响模型精度的重要因素, 提出一种基于客户端数据样本分布特征的质量评估标准, 并结合客户端成本信息, 设计一种逆向拍卖的激励机制(EMD-MQMFL), 实现客户端的任务指派和支付策略。从理论上分析和证明了该机制具有诚实性、个人理性以及预算可行性, 并通过大量实验验证了该方法在联邦学习性能上的有效性。在MNIST、Fashion-MNIST、Cifar-10数据集上的实验结果表明, EMD-MQMFL在数据不平衡的情况下, 平均模型精度比已有的机制至少提高5.6个百分点。

  • 王栋, 王合建, 玄佳兴, 郑尚卓, 陈炳聪
    计算机工程. 2024, 50(5): 158-166. https://doi.org/10.19678/j.issn.1000-3428.0066876
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在区块链上对电力调度指令进行可信存证是解决异议调度追责困难的有效手段。电力调度包含指令发起者、接收者、调度指令等高度敏感内容, 调度指令存证需在保证敏感内容隐私性的同时验证接收者身份及调度指令的合规性, 并在异议调度发生时追踪发起者身份。现有的区块链隐私存证方案大多采用中心化管理方式, 这与区块链分布式设置相违背。针对电力调度指令存证的特定需求, 设计一个支持调度发起者身份隐私且可追踪、接收者身份以及调度指令隐私且合规的区块链存证方案。将接收者身份及调度指令进行编码, 经承诺加密并提供相应的零知识证明保证承诺密文合规后存储至区块链上。采用秘密共享方案对传统的群签名算法进行改进, 在不影响签名与验证效率的前提下, 将群管理员数量由单方拓展至多方。当异议调度发生时, 多名群管理员共同追踪异议调度发起者身份, 揭示接收者身份及调度指令信息。理论分析与实验结果表明, 该方案具有较高的安全性, 执行效率满足实施需求。

  • 卢晓天, 朴春慧, 杨兴雨, 白英杰
    计算机工程. 2024, 50(5): 167-181. https://doi.org/10.19678/j.issn.1000-3428.0067967
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在实现隐私保护的同时提高数据可用性是高维结构化数据发布研究中的挑战性问题, 经典算法PrivBayes针对该问题提供了一种解决方案。为进一步减少计算开销、提高数据可用性, 提出基于贝叶斯网络的差分隐私数据发布算法ELPrivBayes。分析贝叶斯网络结构学习阶段的理论计算开销, 构建存储属性之间互信息的相关矩阵, 避免结构学习算法迭代过程中互信息的冗余计算, 降低了时间复杂度。基于平均互信息优化了节点进入贝叶斯网络的顺序, 提高结构学习迭代过程中指数机制贡献的互信息期望值, 进而提高生成数据集与原始数据集的统计近似度, 并实证分析网络结构质量对首节点选择的低敏感性。在4个典型数据集上的实验结果表明, 与经典算法PrivBayes及其改进方案相比较, 结构学习阶段的计算开销降低了97%~99%, 基于指数机制捕获的互信息提高了14%~67%, 生成数据集与原始数据集的平均变差距离降低了32%~40%, 构建的支持向量机(SVM)分类器的准确率提高了4%~5%, 并且当ε≤0.8时, 采用ELPrivBayes算法生成数据的可用性提升更为显著。

  • 王以良, 周鹏, 叶卫, 戚伟强
    计算机工程. 2024, 50(5): 182-189. https://doi.org/10.19678/j.issn.1000-3428.0067381
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    智能电网融合了信息系统, 能够为能源供应提供更有效的解决方案。智能电表是智能电网的关键部分, 对智能电表数据的深入研究有助于为智能电网的管理和决策提供有效支持。非侵入式负荷辨识(NILM)技术为需求侧管理提供了技术支撑, 但现有方式需要用户和NILM服务端进行数据交互, 在这个过程中泄露了隐私信息。针对上述问题, 设计了基于2D-卷积神经网络(2D-CNN)金字塔网络的NILM, 并采用同态加密和安全多方计算技术进行隐私保护, 针对金字塔网络的卷积、全连接、批标准化、平均池化、ReLU和上采样等算子设计隐私保护协议, 组合隐私保护算子构建隐私保护的2D-CNN金字塔网络。整个过程没有还原数据和中间结果的原始信息, 从而保护了双方隐私。在UK-DALE数据集上的实验结果表明, 基于2D-CNN的金字塔网络能够表现出良好的效果, 准确率达到95.81%, 并且隐私保护的2D-CNN金字塔网络能够在保护客户端数据和服务端模型参数隐私性的情况下保持2D-CNN金字塔网络的推理效果, 精确率、召回率和准确率等保持一致。同时, 隐私保护的2D-CNN金字塔网络在广域网中计算时间不到5 s, 在局域网中不到0.5 s, 并且通信量仅需4.79 MB, 能够适用于NILM任务的现实场景。

  • 图形图像处理
  • 焦世超, 关日鹏, 况立群, 熊风光, 韩燮
    计算机工程. 2024, 50(5): 190-199. https://doi.org/10.19678/j.issn.1000-3428.0067501
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于图像的视觉数据跨域检索任务旨在搜索与输入图像在语义上一致或外形上相似的跨域图像和三维模型数据, 其面临的主要问题是处理跨域数据之间的模态异质性。现有方法通过构建公共特征空间, 采用域适应算法或深度度量学习算法实现跨域特征的域对齐或语义对齐, 其有效性仅在单一类型的跨域检索任务中进行了验证。提出一种基于深度语义关联学习的方法, 以适用多种类型的基于图像的跨域视觉数据检索任务。首先, 使用异构网络提取跨域数据的初始视觉特征; 然后, 通过构建公共特征空间实现初始特征映射, 以便进行后续的域对齐和语义对齐; 最后, 通过域内鉴别性学习、域间一致性学习和跨域相关性学习, 消除跨域数据特征之间的异质性, 探索跨域数据特征之间的语义相关性, 并为检索任务生成鲁棒且统一的特征表示。实验结果表明, 该方法在TU-Berlin、IM2MN和MI3DOR数据集中的平均精度均值(mAP)分别达到0.448、0.689和0.874, 明显优于对比方法。

  • 刘仕兵, 周诗涵
    计算机工程. 2024, 50(5): 200-208. https://doi.org/10.19678/j.issn.1000-3428.0067812
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对已有高速铁路接触网绝缘子目标检测算法通常存在检测精度不高且忽视了绝缘子方向的问题, 为了能更好地满足智能化巡检需求, 提出一种基于改进YOLOv5的绝缘子旋转目标检测算法。首先, 引入协调注意力(CA)和十字交叉注意力机制, 高效提取绝缘子的有效特征及位置信息, 同时利用骨干网络RepVGG架构, 有效提升模型表征力和检测速度; 在检测头的骨干网络中, 采用对齐卷积(AC)模块解决了绝缘子目标的倾斜和特征不对齐问题, 进一步调整了预测框与实际目标的对齐程度; 最后, 采用旋转完全交并比(R-CIoU)计算旋转损失函数, 可以更好地实现对预测框的精准定位。实验结果表明, 该算法可以实现对绝缘子不同方向的检测, 在提升检测速度的同时平均精度均值(mAP)达到97.5%, 能更好地满足绝缘子目标检测的需求。

  • 孙帮勇, 马铭, 于涛
    计算机工程. 2024, 50(5): 209-219. https://doi.org/10.19678/j.issn.1000-3428.0067588
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    伪装目标检测(COD)能够在复杂环境下探测出与背景相似度极高的伪装目标, 在军事侦查和工业检测等领域具有重要的应用价值。针对现有伪装目标检测方法对区域级特征信息利用率低的问题, 提出一种基于区域特征强化的多尺度伪装目标检测网络(RFE-Net)方法, 实现可见光条件下伪装目标的准确探测。RFE-Net主要包含弱语义特征增强模块、空间信息交互模块和上下文信息聚合模块。首先弱语义特征增强模块引入了条状池化和非对称卷积, 通过优化网络的感受野来动态调整搜索区域, 从而加强长距离弱语义特征间的联系; 然后将级联的U型块结构组合为空间信息交互模块, 消除错误预测样本的干扰; 最后设计上下文信息聚合模块, 通过充分融合深层语义信息和浅层细粒度信息以精细化处理目标边缘细节, 从而提升预测准确度。实验结果表明, 所提方法能够加强目标内部的弱语义关联, 提高目标与背景的区分度, 在最大测试集NC4K上的结构性度量、增强对准度量、加权F1值和平均绝对误差4个指标上均取得最优值, 其中结构性度量和平均绝对误差高于第2名方法1.1%和7.7%。

  • 费煜哲, 蔡欣, 赵鸣博, 杨圣豪
    计算机工程. 2024, 50(5): 220-228. https://doi.org/10.19678/j.issn.1000-3428.0067724
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着近年来互联网购物的快速发展, 在各大平台上出现了越来越多的服装商品。通过三维重建技术生成服装的三维模型可以帮助消费者更好地了解服装的姿态信息。针对服装的三维重建技术进行研究, 提出基于隐式表达的服装三维重建模型。使用神经网络学习获得的占用函数作为服装三维模型的隐式表达, 从而建立三维坐标和模型形状的映射。目前已有的三维重建算法需要拟合复杂的曲面模型, 但资源消耗量大, 而基于隐式表达的三维重建算法不需要进行参数化和网格化, 能够提高算法的运行速度。为了进一步提高三维重建效果, 采用目前性能最好的PointMetaBase-L网络模型和偏移注意力模块作为模型的特征提取网络。其中PointMetaBase-L网络模型基于现有的点云特征提取网络提出Set Abstraction层的元架构PointMeta, 并通过分析选择PointMeta元架构中4个模块的最佳实践构成PointMetaBase-L网络模型的Set Abstraction层, 同时引入平面特征投影模块加强特征的局部信息。在特征解码阶段, 利用特征权重网络通过加权平均算法获取三维空间中采样点的占用概率。根据这些采样点的占用概率, 通过基于区域增长的Marching Cubes算法提取高精度网格重建模型。实验结果表明, 与占用网络相比, 改进模型在交并比、倒角距离、法线一致性和F1值上分别提升了48.83%, 55.17%、4.27%和79.10%。

  • 李田芳, 普园媛, 赵征鹏, 徐丹, 钱文华
    计算机工程. 2024, 50(5): 229-240. https://doi.org/10.19678/j.issn.1000-3428.0067524
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有的图像翻译方法大多依赖数据集域标签来完成翻译任务, 这种依赖往往限制了它们的应用范围。针对完全无监督图像翻译任务的方法能够解决域标签的限制问题, 但是普遍存在源域信息丢失的现象。为了解决上述2个问题, 提出一种基于对比学习语言-图像预训练(CLIP)的无监督图像翻译模型。首先, 引入CLIP相似性损失对图像的风格特征施加约束, 以在不使用数据集域标签的情况下增强模型传递图像风格信息的能力和准确性; 其次, 对自适应实例归一化(AdaIN)进行改进, 设计一个新的双空间自适应归一化(DSAdaIN)模块, 在特征的风格化阶段添加网络的学习和自适应交互过程, 以加强对内容源域信息的保留; 最后, 设计一个鉴别器对比损失来平衡对抗网络损失的训练和优化过程。在多个公开数据集上的实验结果表明, 与StarGANv2、StyleDIS等模型相比, 该模型可在准确传递图像风格信息的同时保留一定的源域信息, 且在定量评估指标FID分数和KID分数上分别提升了近3.35和0.57×102, 实现了较好的图像翻译性能。

  • 李晶, 李健, 陈海丰, 张倩, 王丽燕, 裴二成
    计算机工程. 2024, 50(5): 241-249. https://doi.org/10.19678/j.issn.1000-3428.0067538
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了解决自然场景下人脸表情识别任务中的无用信息干扰和遮挡对识别性能的影响问题, 提出一种基于关键区域遮挡与重建的人脸表情识别模型。利用多尺度特征提取网络, 提取人脸图像的全局特征。根据68个人脸关键点划分出68个关键区域, 并通过插值法提取68个关键区域的特征, 同时采用注意力机制学习关键区域特征之间的先验关系。设计自监督的遮挡与重建模块, 对关键区域特征进行随机遮挡, 并利用已知区域信息来预测和重建被遮挡区域的特征, 从而提高模型在自然场景下的表情识别性能。设计多个实验验证了该模型的泛化能力, 并通过消融实验验证了模型中每个模块的有效性。实验结果表明, 该模型在真实世界的情感面孔数据集(RAF-DB)和Occlusion-RAF-DB数据集上分别达到了88.44%和86.09%的识别准确率, 相比于视觉Transformer(ViT)等模型有效地提升了自然场景下人脸表情识别的性能。

  • 周秦源, 邓越平, 张磊, 张陈, 卢日荣, 胡贤哲
    计算机工程. 2024, 50(5): 250-259. https://doi.org/10.19678/j.issn.1000-3428.0067775
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    视觉同步定位与地图构建(SLAM)在动态干扰的情况下, 导致定位精度下降且无法准确构建静态地图, 提出一种结合光流和多视角几何的动态视觉SLAM系统, 该系统是在ORB-SLAM2的基础上进行改进的。在追踪线程中引入处理后的光流信息, 结合多视图几何, 得到动态区域掩码对视野内图像帧进行分割, 实现动态区域检测并滤除动态区域中的特征点, 在保证视觉SLAM系统实时性的同时提高追踪准确度, 替换原本的地图构建线程。在新的地图构建线程中, 引入光流信息及MobileNetV2实例分割网络。利用实例分割网络分割结果结合光流动态区域掩码对获取到的有序点云逐层分割, 解决地图构建中动态物体造成的“拖影”问题。同时对分割后的点云团融合语义信息, 最终构建静态语义八叉树地图。在TUM Dynamic Objects数据集上的实验结果表明, 相较于ORB-SLAM2, 在高动态场景序列测试中, 该算法的定位精度平均提升70.4%, 最高可提升90%。

  • 董峰, 王永欣, 马玉玲, 王奎奎
    计算机工程. 2024, 50(5): 260-271. https://doi.org/10.19678/j.issn.1000-3428.0067994
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了实现对未见类别图像的有效检索, 零样本哈希(ZSH)方法通常将类别属性中的监督知识从已见类转移到未见类。然而, 获取类别属性需要花费额外的计算资源, 并且视觉特征和类别属性之间存在跨模态的异构鸿沟。此外, 现有方法忽视了强偏差问题, 导致模型错误地将已见类样本识别为未见类, 从而降低了检索精度。与此同时, ZSH在保持哈希码和原始数据语义一致性以及实现哈希码的离散优化等方面也面临着挑战。为此, 提出一种原型对齐和域感知的ZSH方法, 其不依赖类别属性等特殊监督知识, 能够节省注释属性的花销同时避免跨模态异构鸿沟的影响。首先计算各类样本在海明空间中的原型, 然后通过对齐哈希码和类原型来学习语义一致的哈希码。为了避免松弛策略造成的量化误差, 提出一种离散优化算法来求解哈希码的离散约束, 并且实现线性的计算复杂度。同时, 设计一个域感知策略用于分离源域和目标域样本, 以缓解强偏差问题的影响。在aPY、AWA2和ImageNet数据集上的实验结果表明, 该方法的检索精度相较对比方法中的最优值分别提升了2.6、9.4和14.9个百分点, 训练时间也远低于大部分对比方法。

  • 开发研究与工程应用
  • 张亚, 王超, 胡闯, 王军, 江娣, 刘彦
    计算机工程. 2024, 50(5): 272-278. https://doi.org/10.19678/j.issn.1000-3428.0068804
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    冲击波超压测试在爆炸威力研究中是一个重要组成部分, 便捷的测试设备和方法能提高冲击波测试效率。使用Qt开发框架设计一款多线程上位机软件, 同时连接多个设备, 解决传统上位机软件与单个设备连接时存在的数据传输效率低、设备接入过程繁琐等问题。该上位机软件主要包含设备管理、参数管理、算法模块和数据管理4个功能模块。通过网络连接, 使用自定义应用层协议与设备进行数据传输, 对采集的电压信号进行数值转化和滤波, 最终形成超压信号并进行数据展示。采用静态电压测试和动态压力测试对上位机软件进行功能评估, 结果表明: 在静态电压测试中, 该上位机软件能准确反映信号发生器幅度为1 V、频率为1 000 Hz的正弦信号; 在动态压力测试中, 3个采集点的第一波峰压力值分别为0.117 8 MPa、0.121 4 MPa和0.117 9 MPa, 与理论激波管计算值0.116 0 MPa之间的误差均在5%以内。该上位机软件能同时对多个设备进行命令控制和数据传输, 简化多台设备的连接操作流程, 同时提高数据传输效率, 具有一定的应用推广价值。

  • 张斯力, 李梓健, 蔡瑞初, 郝志峰, 闫玉光
    计算机工程. 2024, 50(5): 279-290. https://doi.org/10.19678/j.issn.1000-3428.0066384
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    利用历史数据训练强化学习推荐系统已经得到越来越多研究人员的关注, 但是历史数据使得强化学习模型对状态-动作估值错误, 产生数据偏差, 如流行度偏差和选择偏差。造成上述问题的原因是历史数据分布与强化学习策略采集的数据分布不一致以及历史数据本身带有偏差。使用因果机制可以在约束策略采集数据分布的同时解决数据偏差的问题, 提出基于因果机制约束的强化推荐系统, 包含因果机制约束模块和对比策略模块。因果机制约束模块用于约束推荐策略可选择的样本空间以减少策略分布与数据分布误差, 考虑随时间动态变化的物品流行度分布以缓解流行度偏差。对比策略模块通过平衡正负样本的重要性, 缓解选择偏差的影响。在真实数据集Ciao和Epinions上的实验结果表明, 相比深度Q网络(DQN)-r、GAIL、SOFA等, 该算法具有较优的准确性和多样性, 包含加入因果机制约束模块后的模型在F-measure指标上分别提高2%和3%, 进一步验证了因果机制约束模块的有效性。

  • 关明晓, 刘嘉堃, 张鸿锐, 何安平
    计算机工程. 2024, 50(5): 291-297. https://doi.org/10.19678/j.issn.1000-3428.0067233
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    浮点运算是高性能计算(HPC)领域的基础运算。在大数据与云计算的背景下, 高性能计算平台需要处理的数据量与日俱增, 而且浮点数的舍入误差在大规模、长时程的运算中会产生累积, 因此, 在提升浮点运算性能的同时保证计算结果的可靠性非常重要。利用现场可编程门阵列(FPGA)可编程、低功耗、灵活性强的特点, 针对含复杂单项运算的浮点多项式设计一种浮点运算加速器。基于无误差变换的思想, 通过计算得出舍入误差值, 将其补偿到浮点数值上, 从而实现误差可控。采用异步并行的方式实现运算加速, 并通过构建CPU-FPGA平台最大化地利用计算资源, 保证计算任务执行的高效性。数据测试结果表明: 在不限制对称性下的数值相对论模拟运算中, 该加速器在200 MHz的主频下可达到91.85 MFLOPs的峰值性能; 与Intel i7 6700K CPU运行最大线程数的性能相比, 该加速器实现了50.54的加速比, 并在该条件下获得了平均53.6%的精确结果百分比以及更低的相对误差, 表明其具备较高的可靠性。

  • 郑娟毅, 张庆珏, 董嘉豪, 郭梦月, 杨溥江
    计算机工程. 2024, 50(5): 298-305. https://doi.org/10.19678/j.issn.1000-3428.0067711
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在时分双工(TDD)毫米波大规模多输入多输出(MIMO)系统中, 因为波束空间信道具有稀疏性, 导致将低维测量数据重建为原始高维信道时会带来较高的复杂度。针对上行链路, 在不考虑稀疏度的情况下, 将传统优化算法和基于数据驱动的深度学习方法相结合, 提出一种改进的基于深度学习的波束空间信道估计算法。从重建过程入手, 通过交替建立梯度下降模块(GDM)和近端映射模块(PMM)来构建网络。首先根据Saleh-Valenzuela信道模型进行理论公式推导并生成信道数据; 其次构建一个由传统迭代收缩阈值算法(ISTA)的更新步骤所展开的多层网络, 并将数据传输到该网络, 每层对应于一次类似ISTA的迭代; 最后对训练好的模型进行在线测试, 恢复出待估计的信道。构建PyTorch环境, 将该算法与正交匹配追踪(OMP)算法、近似消息传递(AMP)算法、可学习的近似消息传递(LAMP)算法、高斯混合LAMP(GM-LAMP)算法进行对比, 结果表明: 在估计精度方面, 所提算法相对表现较好的深度学习算法LAMP、GM-LAMP分别提升约3.07和2.61 dB, 较传统算法OMP、AMP分别提升约11.12和9.57 dB; 在参数量方面, 所提算法较LAMP、GM-LAMP分别减少约39%和69%。

  • 魏德宾, 杨力, 潘成胜, 沈婷
    计算机工程. 2024, 50(5): 306-312. https://doi.org/10.19678/j.issn.1000-3428.0066870
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    网络流量的自相似性会导致数据突发状态持续, 传统队列管理算法无法对网络流量突发状态进行预测, 从而影响网络端到端时延、丢包率和吞吐性能。针对该问题, 提出一种基于网络流量预测的主动队列管理算法P-ARED。基于网络流量的均值和方差给出网络流量等级的概念, 讨论网络流量等级转移概率与Hurst参数之间的关系, 提出基于贝叶斯估计思想的网络流量等级预测方法。在此基础上, 在对自相似网络流量环境下的平均队列长度、缓存队列长度最小阈值等参数优化设置的基础上, 基于Hurst参数和自相似流量等级预测结果, 重新设计ARED算法中分组丢弃概率的计算方法, 以提高缓存队列长度的稳定性。仿真结果表明, P-ARED算法与对比的主动队列管理算法相比, 降低了网络端到端时延和丢包率, 提高了端到端吞吐性能, 其中平均吞吐量最高提升7.63%, 平均时延最多降低17.52%。

  • 朱志强, 徐朝农, 朱东辉
    计算机工程. 2024, 50(5): 313-322. https://doi.org/10.19678/j.issn.1000-3428.0067076
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    视频服务需求的快速增长对于视频流畅播放提出了巨大挑战, 从用户体验角度分析, 视频播放中的卡顿时间可能是最重要指标之一。随着5G网络技术的发展, 非正交多址接入(NOMA)技术被重点关注, NOMA技术具有叠加编码和连续干扰消除2个特点, 根据这2个特点实现数据的并行传输。利用NOMA技术的并行传输能力来提高基站为用户提供视频的实时性。在用户需求视频名称和视频分辨率给定的情况下, 通过联合基站-用户配对方式和基站功率分配来降低视频播放时的卡顿时间。通过对问题进行建模, 并提出1个两步启发式算法对问题进行求解, 第1步为确定基站与用户的配对方式, 第2步为分配基站的发射功率。实验结果表明, 基于NOMA的传输调度方案与传统的传输调度方案相比, 用户需求的平均卡顿时间有明显的下降, 相对于在不采用NOMA机制时, 在2-SIC接收机情况下, 用户平均卡顿时间减少了55.56%。

  • 赵逸飞, 张俊华
    计算机工程. 2024, 50(5): 323-329. https://doi.org/10.19678/j.issn.1000-3428.0067788
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    统计形状模型(SSM)是一种描述可变形物体形态学变化的模型, 被广泛应用于三维(3D)肝脏分割、3D脊柱生成等任务。针对现有SSM在生成虚拟青少年特发性脊柱侧凸(AIS)腰椎病例数据时存在生成结果不真实且对AIS病例适用性较差的问题, 提出一种基于三维变分自编码生成式对抗注意力网络(3D-VGAN)的虚拟AIS腰椎自动生成方法。3D-VGAN模型由编码器、生成器和判别器组成, 编码器和生成器在变分自编码器(VAE)模型的基础上结合空间注意力机制提取数据特征, 同时利用残差模块解决了神经网络训练过程中的网络退化问题。为了克服生成-判别结构的3D-VGAN模型中存在的稳定性不强、生成器与判别器训练速度不匹配的问题, 使用阈值训练法对3D-VGAN模型进行训练, 提升了稳定性。在基于43例AIS病例腰椎3D模型的数据集上的实验结果表明: 3D-VGAN模型在病例重建实验中的结构相似性(SSIM)系数为0.999 62, 相比3D-VAE、3D-变分自编码生成式对抗注意力网络(VAEGAN)和SSM模型分别提高了0.080 09%、0.002 00%、0.122 20%;在病例生成实验中的弗雷歇初始距离(FID)系数为275.653 48, 相比3D-VAE、3D-VAEGAN和SSM模型分别降低了8.420 55%、0.977 73%、7.319 27%。上述实验结果验证了3D-VGAN模型通过注意力机制、残差模块和阈值训练法取得了更好的虚拟AIS病例腰椎数据生成性能。

  • 蔡毅翔, 秦品乐, 曾建潮, 晋赞霞, 秦佳, 翟双姣
    计算机工程. 2024, 50(5): 330-341. https://doi.org/10.19678/j.issn.1000-3428.0067532
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    行人重识别(Re-ID)也称为行人再识别, 旨在给定一个目标行人, 确定该行人是否出现在不同的摄像机下, 或者是在不同的时间出现在相同的摄像机下。通常由于不同摄像机拍摄到的行人视角不同, 在视角差异过大的情况下会对行人重识别准确率造成严重影响。因此, 针对目标行人相对摄像机的视角不同而带来的识别率下降问题, 提出一种基于外观-步态特征融合的行人重识别算法, 使用视角信息对RGB图像与步态能量图(GEI)进行重要性权重估计后再加权融合, 以此来克服视角不同而带来的影响。具体来讲, 首先利用ResNet-50提取图像序列中每张图像的特征, 采用时间池化的方式将其聚合为外观特征。其次使用另一个ResNet-50对GEI图像提取步态特征。然后对行人进行视角估计之后, 映射函数将估计的角度映射为两种特征的重要性权重。最后基于自编码器结构将两种特征在重要性权重的指导下进行加权融合, 生成对视角鲁棒的融合特征。在CASIA-B数据集上的实验结果表明, 对于具有大角度视角差异的行人Re-ID, 所提出方法在mAP和Rank-1评估指标上都表现出了显著的改进。在大角度差异情况下进行测试, 准确率最高提升了2.7%。

  • 刘仲民, 严梁
    计算机工程. 2024, 50(5): 342-353. https://doi.org/10.19678/j.issn.1000-3428.0067371
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    敦煌壁画图像含有丰富的纹理和结构信息, 在破损壁画修复过程中, 容易忽略受损特征信息与完整特征信息之间的区别, 从而误导修复过程生成不合理的壁画内容。针对该问题, 提出一种融合动态特征选择和像素级通道注意力的壁画修复模型。设计基于U-Net的网络生成器, 实现对破损图像的编码与解码操作; 采用有效可迁移卷积模块, 通过动态选择采样空间位置, 实现对有效特征信息的灵活提取, 采用区域综合归一化模块减少修复区域与完整区域的期望和方差的偏移, 从而加强对有效特征信息的选择和利用; 在解码层设计像素级通道注意力模块, 在增强有效特征权重的同时使模型可从相隔较远的空间位置学习有效特征。在敦煌壁画数据集上的实验结果表明, 该算法能够利用有效信息修复掩膜区域比例不一的不规则破损壁画图像, 相比PConv、PRVS、DSNet算法, 在峰值信噪比(PSNR)指标上平均提升0.502 dB, 在结构相似性(SSIM)指标上平均提升1.384%。

  • 隗昊, 刁宏悦, 孔亮宸, 邓耀臣
    计算机工程. 2024, 50(5): 354-362. https://doi.org/10.19678/j.issn.1000-3428.0068955
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    东北亚地区的国际形势变化与中国的发展密切相关, 面向该地区构建舆情信息知识图谱可以有效地监测舆情热点, 这不仅能够引导社会舆论健康发展及协助政府决策, 而且对防范政治营销、提升国家语言能力、构建和谐稳定国际关系具有重大价值。命名实体识别是构建知识图谱的关键技术和核心任务, 受到研究者广泛的关注。以社交媒体、门户网站与东北亚地区相关的实时热点舆情文本作为数据源, 充分考虑到东北亚地区的区域特点和地缘结构, 建立包含10个大类、35个子类的细粒度命名实体识别数据集, 并提出基于预训练语言模型RoBERTa和多层残差BiLSTM-CRF架构(RoBERTa-ResBiLSTM-CRF)的舆情实体识别模型, 同时在模型完成标签预测后设计基于规则模板的后处理策略, 以提高整体的实体识别性能。实验结果表明, 所提出的舆情命名实体识别模型的性能优于主流的传统神经网络模型, 验证了该方法的有效性。

  • 宫阿娟, 潘天荣
    计算机工程. 2024, 50(5): 363-372. https://doi.org/10.19678/j.issn.1000-3428.0068348
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    深度学习算法可实现精准的眼底疾病诊断, 对眼底疾病的早期诊断和及时干预具有重要意义。近年来涌现出多种深度学习诊断算法, 在数据扩增、图像增强、训练策略、特征提取等方面提出了改进设计, 但对眼底疾病这样的多病种诊断问题, 采用哪种训练策略缺乏系统的分析。从数据处理、训练测量、网络模型、注意力机制等方面分析不同策略的性能, 为多种疾病诊断提供深度学习算法设计依据: 独立训练后综合投票法的结果优于集中训练法, 但训练成本更高; 在训练集上, 集中训练法的表现差异不大, 但在验证集上, ResNeSt50的表现最佳, 具有良好的泛化能力; 单病种独立训练的二分类预测结果明显优于多病种的综合分类, 表明优化分类网络结构有助于提高类别特征的分类效果。未来可考虑设计融合临床知识的专用网络结构进行特定细节增强, 强化类间特征差异, 使模型具有一定的可解释性, 并提高诊断的准确率。这种多层融合网络设计将是眼科疾病诊断的发展方向之一。