作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (18): 10-12. doi: 10.3969/j.issn.1000-3428.2010.18.004

• 博士论文 • 上一篇    下一篇

GPU核函数细化研究

焦良葆,陈 瑞   

  1. (南京工程学院通信工程学院,南京 211167)
  • 出版日期:2010-09-20 发布日期:2010-09-30
  • 作者简介:焦良葆(1972-),男,副教授、博士,主研方向:媒体计算,并行计算;陈 瑞,副教授、硕士
  • 基金资助:
    江苏省自然科学基金资助项目(BK2009351);南京工程学院院科研基金资助项目(KXJ08042, KXJ07014);西门子中国研究院基金资助项目

Research on Refinement of GPU Kernel

JIAO Liang-bao, CHEN Rui   

  1. (School of Communication Engineering, Nanjing Institute of Technology, Nanjing 211167, China)
  • Online:2010-09-20 Published:2010-09-30

摘要: GPU上的并行算法效率依赖于核函数在流多处理器上的平均运行效率,基于此,分析GPU核的执行方式,以及网格、线程块和线程之间的关系,采用细化核函数的方法将光线跟踪算法进行细化。实验结果证明,核的大小设置和分布方向影响了线程块内部的一致性,核函数的细化能增加线程块中同时运行的线程捆的数量。

关键词: 图形处理器, 计算统一设备体系结构, 光线跟踪

Abstract: The efficiency of GPU parallel algorithms depends on the average implement efficiency of the kernel on the streaming multiprocessor. This paper introduces the implementation of the kernel and the relationship among the grid, the block and the thread. It refines the GPU kernel size, and applies it to the ray-tracing algorithm. Experimental results show that the size and direction distribution of GPU kernel affects internal consistency of a block, and the refinement of kernel size can increase the number of warps in one block which runs simultaneously.

Key words: Graphics Processing Unit(GPU), Compute Unified Device Architecture(CUDA), ray tracing

中图分类号: