GPU核函数细化研究

doi:10.3969/j.issn.1000-3428.2010.18.004

计算机工程 ›› 2010, Vol. 36 ›› Issue (18): 10-12. doi: 10.3969/j.issn.1000-3428.2010.18.004

GPU核函数细化研究

焦良葆，陈瑞

(南京工程学院通信工程学院，南京 211167)

出版日期:2010-09-20 发布日期:2010-09-30
作者简介:焦良葆(1972－)，男，副教授、博士，主研方向：媒体计算，并行计算；陈瑞，副教授、硕士
基金资助:
江苏省自然科学基金资助项目(BK2009351)；南京工程学院院科研基金资助项目(KXJ08042, KXJ07014)；西门子中国研究院基金资助项目

Research on Refinement of GPU Kernel

JIAO Liang-bao, CHEN Rui

(School of Communication Engineering, Nanjing Institute of Technology, Nanjing 211167, China)

Online:2010-09-20 Published:2010-09-30

摘要/Abstract

摘要： GPU上的并行算法效率依赖于核函数在流多处理器上的平均运行效率，基于此，分析GPU核的执行方式，以及网格、线程块和线程之间的关系，采用细化核函数的方法将光线跟踪算法进行细化。实验结果证明，核的大小设置和分布方向影响了线程块内部的一致性，核函数的细化能增加线程块中同时运行的线程捆的数量。

关键词: 图形处理器, 计算统一设备体系结构, 光线跟踪

Abstract: The efficiency of GPU parallel algorithms depends on the average implement efficiency of the kernel on the streaming multiprocessor. This paper introduces the implementation of the kernel and the relationship among the grid, the block and the thread. It refines the GPU kernel size, and applies it to the ray-tracing algorithm. Experimental results show that the size and direction distribution of GPU kernel affects internal consistency of a block, and the refinement of kernel size can increase the number of warps in one block which runs simultaneously.

Key words: Graphics Processing Unit(GPU), Compute Unified Device Architecture(CUDA), ray tracing

中图分类号:

TP311

焦良葆, 陈瑞. GPU核函数细化研究[J]. 计算机工程, 2010, 36(18): 10-12.

JIAO Liang-Bao, CHEN Rui. Research on Refinement of GPU Kernel[J]. Computer Engineering, 2010, 36(18): 10-12.

http://www.ecice06.com/CN/Y2010/V36/I18/10

[1]	林琳, 祝爱琦, 赵明璨, 张帅, 叶炎昊, 徐骥, 韩林, 赵荣彩, 侯超峰. 晶硅分子动力学模拟的GPU加速算法优化[J]. 计算机工程, 2023, 49(4): 166-173.
[2]	李靖, 祝爱琦, 韩林, 侯超峰. 基于GPU的固态晶体硅分子动力学算法优化[J]. 计算机工程, 2023, 49(3): 288-295.
[3]	肖汉, 郭宝云, 李彩林, 周清雷. 面向异构架构的传递闭包并行算法[J]. 计算机工程, 2021, 47(8): 131-139.
[4]	杨世伟, 蒋国平, 宋玉蓉, 涂潇. 基于GPU的稀疏矩阵存储格式优化研究[J]. 计算机工程, 2019, 45(9): 23-31,39.
[5]	汤佳,龚奕利,李文海. 一种基于GPU的KNN动态扩展查询策略[J]. 计算机工程, 2018, 44(6): 1-7.
[6]	魏渐俊,陈良育. 基于GPGPU的大整数矩阵行列式快速准确计算方法[J]. 计算机工程, 2018, 44(3): 47-54.
[7]	高艺,罗健欣,裘杭萍,吴波. 基于GPU栅格化的任意多边形布尔运算[J]. 计算机工程, 2018, 44(3): 301-306,314.
[8]	王吉军,程华. 通用图形处理器功耗估算模型[J]. 计算机工程, 2017, 43(2): 92-97,104.
[9]	马冬冬,衷璐洁,朱敬茹. 基于GPU的LLVM程序分析信息并行提取[J]. 计算机工程, 2017, 43(10): 23-30.
[10]	陈勇,吴晓民,杨坚,奚宏生. 基于CUDA的H.264并行解码器设计与实现[J]. 计算机工程, 2016, 42(5): 249-252,257.
[11]	王震,许晓航,王静,李圣,郑宏. 多路高清YUV视频GPU实时拼接研究[J]. 计算机工程, 2016, 42(12): 314-320.
[12]	田盼,华蓓,陆李. 基于GPU 的K-近邻算法实现[J]. 计算机工程, 2015, 41(2): 189-192,198.
[13]	余勇, 庞建民, 单征, 刘晓楠. CUDA到异构众核架构的线程映射模型[J]. 计算机工程, 2012, 38(9): 282-284,287.
[14]	崔文科, 徐克付, 李娜娜, 胡玥. 基于CUDA的位并行近似串匹配算法[J]. 计算机工程, 2012, 38(22): 267-270.
[15]	郭绍忠, 王伟, 周刚, 胡艳. 基于GPU的单源最短路径算法设计与实现[J]. 计算机工程, 2012, 38(2): 42-44.

选择文件类型/文献管理软件名称

选择包含的内容

GPU核函数细化研究

Research on Refinement of GPU Kernel

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

GPU核函数细化研究

Research on Refinement of GPU Kernel

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价