Research on Refinement of GPU Kernel

doi:10.3969/j.issn.1000-3428.2010.18.004

Computer Engineering ›› 2010, Vol. 36 ›› Issue (18): 10-12. doi: 10.3969/j.issn.1000-3428.2010.18.004

• Networks and Communications • Previous Articles Next Articles

Research on Refinement of GPU Kernel

JIAO Liang-bao, CHEN Rui

(School of Communication Engineering, Nanjing Institute of Technology, Nanjing 211167, China)

Online:2010-09-20 Published:2010-09-30

GPU核函数细化研究

焦良葆，陈瑞

(南京工程学院通信工程学院，南京 211167)

作者简介:焦良葆(1972－)，男，副教授、博士，主研方向：媒体计算，并行计算；陈瑞，副教授、硕士
基金资助:
江苏省自然科学基金资助项目(BK2009351)；南京工程学院院科研基金资助项目(KXJ08042, KXJ07014)；西门子中国研究院基金资助项目

Abstract

Abstract: The efficiency of GPU parallel algorithms depends on the average implement efficiency of the kernel on the streaming multiprocessor. This paper introduces the implementation of the kernel and the relationship among the grid, the block and the thread. It refines the GPU kernel size, and applies it to the ray-tracing algorithm. Experimental results show that the size and direction distribution of GPU kernel affects internal consistency of a block, and the refinement of kernel size can increase the number of warps in one block which runs simultaneously.

Key words: Graphics Processing Unit(GPU), Compute Unified Device Architecture(CUDA), ray tracing

摘要： GPU上的并行算法效率依赖于核函数在流多处理器上的平均运行效率，基于此，分析GPU核的执行方式，以及网格、线程块和线程之间的关系，采用细化核函数的方法将光线跟踪算法进行细化。实验结果证明，核的大小设置和分布方向影响了线程块内部的一致性，核函数的细化能增加线程块中同时运行的线程捆的数量。

关键词: 图形处理器, 计算统一设备体系结构, 光线跟踪

CLC Number:

TP311

JIAO Liang-Bao, CHEN Rui. Research on Refinement of GPU Kernel[J]. Computer Engineering, 2010, 36(18): 10-12.

焦良葆, 陈瑞. GPU核函数细化研究[J]. 计算机工程, 2010, 36(18): 10-12.

/ / Recommend / Download Citations

URL: http://www.ecice06.com/EN/10.3969/j.issn.1000-3428.2010.18.004

http://www.ecice06.com/EN/Y2010/V36/I18/10

[1]	LI Jing, ZHU Aiqi, HAN Lin, HOU Chaofeng. Optimization of Molecular Dynamics Algorithm for Solid Crystalline Silicon Based on GPU [J]. Computer Engineering, 2023, 49(3): 288-295.
[2]	ZHANG Kun, JIA Jinfang, YAN Wenxin, HUANG Jianqiang, WANG Xiaoying. Parallel Solution and Optimization of Large-Scale Sparse Linear System in GRAPES Dynamic Framework [J]. Computer Engineering, 2022, 48(1): 149-154,162.
[3]	QIAN Shangyun, SHAO Zhiyuan, ZHENG Ran, CHEN Jilin. GPU-based Graph Analysis and Computation Method for Graph Database [J]. Computer Engineering, 2021, 47(6): 52-59.
[4]	YUAN Jiawei, SONG Qingzeng, WANG Xuechun, JIANG Wenchao, JIN Guanghao. Performance and Power Consumption Measurement and Analysis of Edge Computing Devices [J]. Computer Engineering, 2021, 47(2): 233-238,245.
[5]	YANG Shiwei, JIANG Guoping, SONG Yurong, TU Xiao. Research on Storage Format Optimization of Sparse Matrix Based on GPU [J]. Computer Engineering, 2019, 45(9): 23-31,39.
[6]	ZHOU Qi,CHAI Xiaoli,MA Kejie,YU Zeren. Design and Implementation of Tucker Decomposition Module Based on CUDA and CUBLAS [J]. Computer Engineering, 2019, 45(3): 41-46.
[7]	LI Chaofan,CHEN Qingkui. GPU Cluster Power Consumption Collection and Monitoring System Based on Sensor [J]. Computer Engineering, 2019, 45(3): 65-72.
[8]	TANG Jia,GONG Yili,LI Wenhai. A KNN Dynamic Extended Query Strategy Based on GPU [J]. Computer Engineering, 2018, 44(6): 1-7.
[9]	GAO Yi,LUO Jianxin,QIU Hangping,WU Bo. Arbitrary Polygons Boolean Operation Based on GPU Rasterization [J]. Computer Engineering, 2018, 44(3): 301-306,314.
[10]	MA Dongdong,ZHONG Lujie,ZHU Jingru. Parallel Extraction of Program Analysis Information on LLVM Based on GPU [J]. Computer Engineering, 2017, 43(10): 23-30.
[11]	PEI Xin,NIE Jun,CHEN Maozheng,LI Jian. Realization of Dual-channel Real-time Correlator Based on Heterogeneous Architecture [J]. Computer Engineering, 2016, 42(5): 42-46,53.
[12]	CHEN Yong,WU Xiaomin,YANG Jian,XI Hongsheng. Design and Implementation of H.264 Parallel Decoder Based on CUDA [J]. Computer Engineering, 2016, 42(5): 249-252,257.
[13]	WANG Zhen,XU Xiaohang,WANG Jing,LI Sheng,ZHENG Hong. Research on GPU Real-time Stitching of Multi-channel High-definition YUV Video [J]. Computer Engineering, 2016, 42(12): 314-320.
[14]	MENG Xiaohua,QIN Dasheng,ZHENG Dongqin,ZHOU Yuyu. Parallel Simulation of Carbon Nano Tube Molecular Dynamics Based on GPU [J]. Computer Engineering, 2015, 41(4): 288-293.
[15]	YANG Xianfeng,LI Yingjie,LAI Junliang,PENG Bo. Real-time Ultrasound Elastic Imaging Algorithm Based on GPU Parallel Particle Swarm Optimization [J]. Computer Engineering, 2015, 41(12): 220-225,230.

Please choose a citation manager

Content to export

Research on Refinement of GPU Kernel

GPU核函数细化研究

PDF

Knowledge

Cited

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics

Comments

模态框（Modal）标题

Please choose a citation manager

Content to export

Research on Refinement of GPU Kernel

GPU核函数细化研究

PDF

Knowledge

Cited

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics

Comments