%0 Journal Article %A 张琨 %A 贾金芳 %A 严文昕 %A 黄建强 %A 王晓英 %T GRAPES动力框架中大规模稀疏线性系统并行求解及优化 %D %R 10.19678/j.issn.1000-3428.0060080 %J 计算机工程 %P 149-154,162 %V 48 %N 1 %X 赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈。分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解大规模稀疏线性方程组的广义共轭余差法,并利用不完全分解LU预处理子(ILU)优化系数矩阵的条件数,加快迭代法收敛。在CPU并行方案中,MPI负责进程间粗粒度并行和通信,OpenMP结合共享内存实现进程内部的细粒度并行,而在GPU并行方案中,CUDA模型采用数据传输、访存合并及共享存储器方面的优化措施。实验结果表明,通过预处理优化减少迭代次数对计算性能提升明显,MPI+OpenMP混合并行优化较MPI并行优化性能提高约35%,CUDA并行优化较MPI+OpenMP混合并行优化性能提高约50%,优化性能最佳。 %U http://www.ecice06.com/CN/10.19678/j.issn.1000-3428.0060080