基于CUDA的矩阵乘法和FFT性能测试

doi:10.3969/j.issn.1000-3428.2009.10.003

计算机工程 ›› 2009, Vol. 35 ›› Issue (10): 7-10. doi: 10.3969/j.issn.1000-3428.2009.10.003

基于CUDA的矩阵乘法和FFT性能测试

肖江，胡柯良，邓元勇

(中国科学院国家天文台，北京 100012)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2009-05-20 发布日期:2009-05-20

Ability Test for Matrix-Multiplication and FFT Based on CUDA

XIAO Jiang, HU Ke-liang, DENG Yuan-yong

(National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012)

Received:1900-01-01 Revised:1900-01-01 Online:2009-05-20 Published:2009-05-20

摘要/Abstract

摘要： 针对NVIDIA公司的CUDA技术用Geforce8800GT在Visual Studio2008环境下进行测试，从程序运行时间比较判断CUBLAS库、CUDA内核程序、CUDA驱动API、C循环程序与Intel MKL库以及FFTW库与CUFFT库运行响应的差异。测试结果表明，在大规模矩阵乘法和快速傅里叶变换的应用方面，相对于CPU，利用GPU运算性能可提高25倍以上。

关键词: 矩阵乘法, 快速傅里叶变换, 并行计算, GPU通用计算

Abstract: This paper introduces the result of a test that evaluates the effectiveness of Compute Unified Device Architecture(CUDA) using NVDIA GeForce8800GT and the compiler Visual Studio 2008. It tests the speed of NVIDIA CUBLAS, CUDA kernel, common C program, Intel MKL BLAS, CUDA driver API program, FFTW and CUFFT Library in matrix-multiplication and Fast Fourier Transform(FFT). Test result of the large scale data shows that the computing ability of GPU is 25 times better than that of CPU.

Key words: matrix-multiplication, Fast Fourier Transform(FFT), parallel computation, GPGPU

中图分类号:

TP312

肖江;胡柯良;邓元勇. 基于CUDA的矩阵乘法和FFT性能测试[J]. 计算机工程, 2009, 35(10): 7-10.

XIAO Jiang; HU Ke-liang; DENG Yuan-yong. Ability Test for Matrix-Multiplication and FFT Based on CUDA[J]. Computer Engineering, 2009, 35(10): 7-10.

http://www.ecice06.com/CN/Y2009/V35/I10/7

[1]	王其涵, 庞建民, 岳峰, 祝迪, 沈莉, 肖谦. 面向申威架构的KNN并行算法实现与优化[J]. 计算机工程, 2023, 49(5): 286-294.
[2]	夏立斌, 刘晓宇, 姜晓巍, 孙功星. 基于分布式数据集的并行计算框架内存优化方法[J]. 计算机工程, 2023, 49(4): 43-51.
[3]	黄瑞, 金光浩, 李磊, 姜文超, 宋庆增. 轻量化神经网络加速器的设计与实现[J]. 计算机工程, 2021, 47(9): 185-190,196.
[4]	易培淮, 李卫东, 林韬, 邹佳恒, 邓子艳, 刘言. GPU在缪子快速模拟中的应用[J]. 计算机工程, 2021, 47(8): 100-108.
[5]	佘鑫, 何震瀛. 复杂属性条件下基于Spark的clique社区搜索算法[J]. 计算机工程, 2021, 47(12): 54-61,70.
[6]	郭渝洛, 边浩东, 董润婷, 唐嘉豪, 王晓英, 黄建强. 基于SIMD的并行傅里叶空间图像相似度计算[J]. 计算机工程, 2021, 47(11): 247-253.
[7]	赵慧, 魏伟波, 潘振宽, 纪连顺. 基于暗原色先验与变分正则化的图像去雾研究[J]. 计算机工程, 2021, 47(10): 214-220.
[8]	勾志杭, 刘剑锋, 胡金龙, 冯雪林, 王宗伟. 基于单一切面的循环平稳检测方法[J]. 计算机工程, 2021, 47(1): 196-202.
[9]	肖成龙, 聂紫阳, 王宁, 张重鹏, 王珊珊. 基于并行约束规划的最大团识别研究[J]. 计算机工程, 2020, 46(4): 53-59,69.
[10]	徐国伟, 陈建, 成怡. 基于GPU并行计算的雷达杂波模拟研究[J]. 计算机工程, 2020, 46(11): 306-314.
[11]	李洁, 朱洪亮, 陈玉玲, 辛阳. 基于哈希存储与事务加权的并行Apriori改进算法[J]. 计算机工程, 2020, 46(11): 109-116.
[12]	宋匡时, 李翀, 张士波. 一个轻量级分布式机器学习系统的设计与实现[J]. 计算机工程, 2020, 46(1): 201-207.
[13]	薛建伟, 姜爱民. 光学综合孔径原理样机的计算与控制系统[J]. 计算机工程, 2019, 45(8): 107-112.
[14]	刘余福,郎文辉,贾光帅. HXDSP平台上矩阵乘法的实现与性能分析[J]. 计算机工程, 2019, 45(4): 25-29.
[15]	沈雁,戴瑜兴. 基于GPU的并行Cholesky分解及其应用[J]. 计算机工程, 2019, 45(2): 284-289.

选择文件类型/文献管理软件名称

选择包含的内容

基于CUDA的矩阵乘法和FFT性能测试

Ability Test for Matrix-Multiplication and FFT Based on CUDA

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于CUDA的矩阵乘法和FFT性能测试

Ability Test for Matrix-Multiplication and FFT Based on CUDA

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价