作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (13): 24-26,29. doi: 10.3969/j.issn.1000-3428.2010.13.009

• 软件技术与数据库 • 上一篇    下一篇

CPU-GPU并行矩阵乘法的实现与性能分析

程 豪1,2,张云泉1,张先轶1,李玉成1   

  1. (1. 中国科学院软件研究所并行计算实验室,北京 100190;2. 中国科学院研究生院,北京 100190)
  • 出版日期:2010-07-05 发布日期:2010-07-05
  • 作者简介:程 豪(1985-),男,硕士研究生,主研方向:并行软件开发;张云泉,研究员、博士、博士生导师;张先轶,研究实习员、硕士;李玉成,研究员、博士
  • 基金资助:
    国家自然科学基金资助重点项目(60533020);国家“863”计划基金资助项目(2006AA01A125, 2009AA01A129, 2009AA01A134);国家重大科研装备研制项目(ZDYZ2008-2-S01)

Implementation and Performance Analysis of CPU-GPU Parallel Matrix Multiplication

CHENG Hao1,2, ZHANG Yun-quan1, ZHANG Xian-yi1, LI Yu-cheng1   

  1. (1. Lab of Parallel Computing, Institute of Software, Chinese Academy of Sciences, Beijing 100190; 2. Graduate University of Chinese Academy of Sciences, Beijing 100190)
  • Online:2010-07-05 Published:2010-07-05

摘要: 实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。

关键词: 混合并行, GPU技术, DGEMM程序, 加速比

Abstract: The implementation of the CPU-GPU hybrid DGEMM is carried out on the ATI platform to improve the computing performance by computing both on GPU and CPU. Experimental results show that when matrix size is large, its performance on AMD Phenom II X4 940 and ATI FireStream 9270 platform, compared with using GPU alone, can be improved 16% on average. The evaluation method is verified along with the discussion of the factors which impact the hybrid DGEMM performance.

Key words: hybrid parallelization, GPU, DGEMM, speedup ratio

中图分类号: