杂化泛函计算由于混合了部分的Kohn-Sham轨道,要比纯电子密度的泛函计算量更大,胡伟等人开发了插值密度可分拟合(interpolative separable density fitting algorithm, ISDF)算法来加速杂化泛函电子结构的计算,对于ISDF算法,K-means聚类算法是选取插值点的常用并且效果很好的算法,已经在实数的波函数中得到了很好的效果,但是在带K点的计算和含时密度泛函理论的计算中,使用的波函数往往是复数的,而复数波函数在选取插值点和定义距离时相比实数会变得更加复杂和困难,而K-means聚类的精度很大程度上依赖于初始质心的选择以及距离和质心的定义,因此在复数波函数上实现效果更好的K-means算法是极为需要的。此外分子动力学是一个长时间的模拟过程,使用了杂化泛函的分子动力学模拟更加艰难,使用加速算法加速杂化泛函,让平面波内大规模杂化泛函从头算分子动力学模拟的实现成为可能。
本文提出了一种改进的权函数,定义为K-means聚类中复值Kohn-Sham轨道的平方模量之和(SSM)。数值结果表明,与以前的实值K-means算法中使用的权函数(PSM)相比,采用新的权函数的K-means算法产生的插值采样点更光滑、离域更广,从而使混合AIMD仿真的能量势更平滑、能量漂移更小、时间步长。特别是,我们发现,与之前的K-means算法相比,改进后的算法可以获得更精确的液态水分子中氧-氧径向分布函数和晶体二氧化硅中更精确的功率谱。最后,我们描述了这种ISDF分解的大规模并行实现,以加速包含数千个原子(2,744个原子)的大规模复杂值混合AIMD模拟,该模拟可以在现代超级计算机上扩展到5,504个CPU核。
内容简介
本项工作的核心出发点为ISDF算法,其作用对象为Khatri-Rao(KR)积:
使用ISDF算法拟合的KR积为:
在实数版本中,PSM(product of the square modulus)权重函数被定义为轨道对平方和的乘积:
针对复数版本,我们定义了新的SSM(sum of the square modulus)权重函数:
由两种不同的权重函数选取得到的插值点由图1可看出,新的SSM权重函数相比PSM权重函数选可以取更大范围的数据集点。
图2中介绍了本文中计算的三种体系,半导体Si216,绝缘体(H2O)64以及金属Al176Si24体系:
图1 SSM(c,d)和PSM(e,f)权重函数选取的插值点示意图
图2绝缘体(H2O)64(a) ,半导体Si216(b)以及金属Al176Si24(c)体系
首先我们计算了ISDF方法搭配新的权重函数的数值准确性,测试总能,HF能,原子力的误差分别为:
结果如图3所示,可以看到随着秩参数的增加,误差会降低到小数点后4~7位,实现了不错的精度。
图3绝缘体(H2O)64(a) ,半导体Si216(b)以及金属Al176Si24(c)体系的总能,HF能即原子力误差
此外,我们还计算了不同方法特征值的误差,如图4所示:
图4绝缘体(H2O)64(a) ,半导体Si216(b)以及金属Al176Si24(c)体系的总能,HF特征值误差
随后计算了杂化泛函AIMD的结果,对于不同方法杂化泛函的势能曲线,是比较相似的:
图5 Si64体系不同方法下的势能曲线,SM (α = 1), SSM (α = 2), SCM (α = 3) and SQM (α = 4)
此外我们计算了漂移能量,可以看到SSM权重函数得到的漂移能量误差更低,如图6,7所示:
图6 Si64体系不同方法下的漂移能量,SM (α = 1), SSM (α = 2), SCM (α = 3) and SQM (α = 4)
图6 Si64体系不同方法下的漂移能量,SM (α = 1), SSM (α = 2), SCM (α = 3) and SQM (α = 4),时间步取为更大的12fs
此外,我们还模拟了水体系的径向分布函数RDF以及二氧化硅体系的功率光谱,SSM有着更小的误差,并且在功率谱上更接近实验值:
图6 (H2O)64体系不同方法下径向分布函数
图7 二氧化硅体系不同方法下的功率谱Power spectrum
最后,本工作还进行了计算机强标度和弱标度的扩展性测试,如图8所示,可以在5504CPU核上计算Si2744体系。
图8 计算机性能测试
综上所述,我们提出了一种改进的复值波函数k均值聚类算法,用于在ISDF分解中选择插值采样点。通过将基于SSM的K-means聚类算法应用于混合密度泛函计算,我们证明了对于复值Kohn-Sham轨道,与基于PSM的K-means聚类相比,改进的K-means聚类算法产生的插值采样点更加精确和平滑。特别是,SSM的K-means在AIMD RDF和混合密度泛函的功率谱模拟中表现出更小的精度损失和更好的稳定性。此外,我们还实现了大规模混合泛函计算的并行ISDF分解。我们表明,ISDF可以为包含2,744个原子的系统扩展到5,504个CPU内核。对于多k点采样DFT和RT-TDDFT来说,复值波函数是必不可少的。相对于QRCP方法,K-means聚类算法成本较低,更适合于动态仿真过程。因此,在未来的工作中,我们将把复值k均值聚类算法应用于具有混合泛函的激发态RT-TDDFT。
论文信息
文章题目:Complex-valued K-means clustering of interpolative separable density fitting algorithm for large-scale hybrid functional enabled ab initio molecular dynamics simulations within plane waves
期刊:Journal Of Physical Chemistry A
作者:焦诗哲,李杰岚*,秦新明,万凌云,胡伟*,杨金龙
通讯作者:李杰岚,胡伟,中国科学技术大学
发表日期:2024年3月2日(在线)
论文链接:
https://doi.org/10.1021/acs.jpca.3c07172
PWDFT软件
PWDFT是一款基于平面波基组的密度泛函理论计算软件,主要通过求解Kohn-Sham方程实现固体材料和分子体系的电子结构计算和第一性原理分子动力学模拟。它与目前市场上的主流第一性原理软件属同类软件,并且具有相同的计算精度。
PWDFT使用C/C++语言编写,结合CPU-MPI和GPU-CUDA异构并行框架实现高性能计算,主要致力于实现数百到上千原子的大体系的密度泛函理论计算。目前支持单Gamma点和多k点采样,自旋限制、自旋极化和非线性自旋加自旋轨道耦合(SOC)的密度泛函理论计算,可以提供计算体系基态的总能量、能级、电子密度、态密度、磁性、原子力、能带结构,还支持结构优化以及激发态的电子结构计算、并有第一性原理分子动力学计算模块。
相比较其它国外第一性原理计算软件,PWDFT架构清晰,支持intel/Vtune 热点分析工具,在提高性能以及开发新功能、新算法方面具有独特优势。集成了最新的第一性原理加速算法,包括LOBPCG/PPCG本征值迭代算法、ACE、ISDF和PC-DIIS等加速算法,使得用PWDFT-DCU做大体系杂化密度泛函计算加速快100倍。支持CPU-DCU异构加速和CPU-GPU异构加速,现在可以同时兼容NVIDIA-CUDA和AMD-HIP平台。PWDFT的GPU优化程度比目前世界排名第一的第一性原理软件的GPU版本更高,并比其快了一个数量级以上。且具有非常好的扩展性能,这在平面波基组的第一性原理软件中名列前茅。行业内使用最广泛的第一性原理软件只能做到数百原子数百核并行,而PWDFT可以做到10000原子40000 CPU核并行,以及GPU/DCU上千块卡并行。