摘要: 以高性能计算中的经典问题——多体问题的快速多极子(FMM)算法为例,分析FMM算法的各个步骤,根据计算、通信和存储特性将算法中的子过程归类。在CPU、GPU、FPGA和CELL上分别进行测试,提出执行FMM算法的混合可重构体系结构配置方案,并进一步优化算法,分解任务流。针对不同任务流的特点,提出可行的解决方案。结果证明,该方案可提高算法效率。
中图分类号:
曹旻, 李海强, 曹真. 基于混合架构的FMM算法硬件加速[J]. 计算机工程, 2012, 38(16): 275-278.
CAO Min, LI Hai-Jiang, CAO Zhen. Hardware Acceleration of FMM Algorithm Based on Mixed Architecture[J]. Computer Engineering, 2012, 38(16): 275-278.