密歇根州立大学Kenneth M. Merz团队JCIM | 采用图形处理单元开展量子力学和分子力学模拟
2023/3/14 14:13:18 阅读:113 发布者:
英文原题:
Quantum mechanics/molecular mechanics simulationson NVIDIA and AMD graphics processing units
通讯作者: Kenneth M. Merz,密歇根州立大学;Andreas W. Götz,加州大学圣地亚哥分校
作者:Madushanka Manathunga, Hasan Metin Aktulga
背景介绍
量子和分子力学(QM/MM)模拟通过将体系划分为不同区域,以提高模拟准确性,控制计算成本,使其在计算化学和生物学领域的应用越来越广泛。在模拟过程中,95%以上的计算时间都用在了QM区域。为了充分利用并行处理和图形处理硬件平台的算力,科研工作者持续在开发新QM算法方向上做出努力。随着GPU的快速发展,在新平台上实现计算化学应用的需求也越来越大。
文章亮点
针对上述需求,2023年1月31日,密歇根州立大学Kenneth M. Merz 教授团队在化学信息学和人工智能研究领域的国际权威学术期刊 Journal of Chemical Information and Modeling 上发表了题为“Quantum mechanics/molecular mechanics simulations on NVIDIA and AMD graphics processing units”的研究论文,系统提高了 QUICK/AMBER 软件在 NVIDIA 显卡上的计算性能,并在 AMD 显卡上移植和优化了相关计算,该研究有助于相关软件在最先进计算平台上的部署应用。
图1:光敏黄蛋白的QM/MM模拟体系
基于 QM/MM 的计算理论和 GPU 的工作原理,作者开发了 CUDA 的代码生成器和优化器用于计算原始积分,并挑选出最佳的代码路径,以提高 QUICK 程序在显卡上的计算性能。同时,作者还讨论了 QUICK 程序在显卡上的移植、优化以及对 AMBER 软件的修改。使用翻译器将 QUICK 在 CUDA 上的代码移植到 AMD GPU 上,实现了 QUICK 程序在 AMD 显卡上的部署。作者根据寄存器的利用率和运行时间,发现了最优的代码路径,并根据内核启动参数与内核性能间的关系,优化启动参数,最终对 AmberTools 程序中的构建系统开展了更新。
图2:NVIDIA 和 AMD 显卡上的 QM/MM 计算性能对比
依托光敏黄蛋白模拟体系(如图1),本研究进一步对 NVIDIA 和 AMD 显卡上的 QM/MM 计算性能开展了比较。结果显示,QUICK 性能的改进使 QM 区的计算速度大幅提高(如图2)。在 QM 区最小的模拟体系中,NVIDIA V100 的运行速度比 AMD MI100 快2.3倍。随着 QM 区变大,二者的性能相似。
综上所述,此项研究提高了 QUICK 程序在 NVIDIA 显卡上的计算性能,使其计算速度提高了数倍;并在 AMD 显卡上移植和优化了 QM/MM 计算方法,对于 QM 区中等大小的模拟体系,其性能与 NVIDIA 相似。该项研究为 AMBER 软件在更广泛的硬件平台上开展 QM/MM 模拟打下了坚实的基础。
转自:“ACS美国化学会”微信公众号
如有侵权,请联系本站删除!