作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2021, Vol. 47 ›› Issue (11): 247-253. doi: 10.19678/j.issn.1000-3428.0059427

• 图形图像处理 • 上一篇    下一篇

基于SIMD的并行傅里叶空间图像相似度计算

郭渝洛, 边浩东, 董润婷, 唐嘉豪, 王晓英, 黄建强   

  1. 青海大学 计算机技术与应用系, 西宁 810016
  • 收稿日期:2020-09-03 修回日期:2020-10-31 发布日期:2020-11-12
  • 作者简介:郭渝洛(1999-),女,本科生,主研方向为高性能计算;边浩东、董润婷,硕士研究生;唐嘉豪,本科生;王晓英,教授;黄建强(通信作者),副教授。
  • 基金资助:
    国家自然科学基金“基于GPU异构体系结构的大规模图数据挖掘关键技术研究”(62062059);国家自然科学基金“智能电网影响感知的数据中心需求响应策略与机制研究”(61767024);青海省科技计划项目“GRAPES数值天气预报模式动力框架并行并行算法与优化技术研究”(2019-ZJ-7034);国家重点实验室开放基金“基于三江源数据分析平台的全球数值天气预报系统的性能优化技术研究”(2020-ZZ-03)。

Parallel Fourier Space Image Similarity Calculation Based on SIMD

GUO Yuluo, BIAN Haodong, DONG Runting, TANG Jiahao, WANG Xiaoying, HUANG Jianqiang   

  1. Department of Computer Technology and Application, Qinghai University, Xining 810016, China
  • Received:2020-09-03 Revised:2020-10-31 Published:2020-11-12

摘要: 在冷冻电镜三维重建计算模型中,傅里叶空间图像相似度算法被频繁调用,大量的计算开销导致模型整体运行速度变慢。针对该问题,提出一种基于SIMD的并行傅里叶空间图像相似度算法。通过手动负载均衡方式最大化CPU的线程使用率,添加AVX-512指令集增强CPU矢量寄存器的作用,同时设计高效的数据结构提升内存访问效率。在Intel Xeon Platinum 9242平台上的实验结果表明,与原始的OpenMP并行模型相比,经该算法优化后的程序可获得平均5.132倍的加速比,并且具有较强的鲁棒性。

关键词: 冷冻电镜, 负载均衡, 缓存, 单指令多数据流矢量化, 傅里叶空间, 图像相似度计算, 并行计算

Abstract: The existing models for calculation of three-dimensional cryo-Electron Microscope(cryo-EM) reconstruction frequently call the Fourier space-based image similarity algorithm,and the generated high computational overhead slows the running speed of the model.To solve this problem,a parallel image similarity algorithm using Fourier space is proposed based on Single Instruction Multiple Data(SIMD).By maximizing CPU thread utilization through manual load balancing,an AVX-512 instruction set is added to enhance the role of CPU vector register.Then an efficient data structure is designed to improve memory access efficiency.The experimental results on Intel Xeon Platinum 9242 platform show that compared with the original OpenMP parallel model,the optimized program can obtain an average speedup of 5.132 times and exhibits high robustness.

Key words: cryo-Electron Microscopy(cryo-EM), load balancing, cache, Single Instruction Multiple Data(SIMD) vectorization, Fourier space, image similarity calculation, parallel computing

中图分类号: