论坛

软件开发研究新闻
新兴国产第一性原理软件KSSOLV新算法开发研究取得新进展。研究人员通过引入机器学习中的 K-Means 聚类算法来优化算法性能，并比较了几种权重函数，包括 PSM、PM、SM 以及 SSM，以寻找最有效的策略。这种机器学习方法将计算插值点的复杂度降低到约 O(N_e^2)，有效替代了原有 ACP 算法中成本较高的 QRCP 方法，并加速了在迭代求解 Dyson 方程过程中的收敛速度。该改进算法已在KSSOLV中得到实现，并以“Machine Learning K Means Clustering in Interpolative Separable Density Fitting Algorithm: Advancing Accurate and Efficient Cubic Scaling Density Functional Perturbation Theory Calculations within Plane Waves”为题，近日已经线上发表于物理化学领域国际一流期刊《Journal Of Physical Chemistry A》。

论文内容
  密度泛函理论（DFT）是目前最广泛应用的从头算方法之一。它因在计算精度与处理复杂度之间达到了良好的平衡，使得基于 DFT 的第一性原理计算在计算材料科学中获得了广泛应用。这种方法通过对材料的电子结构进行准确的预测，为理解和设计新材料提供了强大的工具。
晶格动力学是凝聚态物理中的重点关注对象之一，而密度泛函微扰理论（DFPT）在此领域发挥着至关重要的作用。DFPT  在计算电子基态的密度泛函理论的基础上，通过对系统施加微小的扰动，并研究其对这些扰动的响应，从而预测系统的物理和化学性质。这种方法特别适用于预测声子和电子-声子耦合（EPC）等微扰响应特性，这些特性在包括  Bardeen-Cooper-Schrieffer（BCS）超导性、红外光谱、弹性中子散射、比热、热导等多种物理现象中扮演着关键角色。
然而，DFPT 的计算代价较高，其计算复杂度通常为 O(N_e^4)  ，这显著限制了对更大体系声子特性进行计算的能力。为解决这一挑战，基于自适应压缩极化率算符（ACP）的 DFPT  算法应运而生。该算法通过在迭代求解 Dyson 方程的每一步中应用 Chebyshev 插值和插值可分密度拟合（ISDF）分解，有效地简化了  Sternheimer 方程的求解过程。这种创新方法将计算复杂度降低至 O(N_e^3) 的量级，显著加速了 Dyson  方程的收敛速度，从而使得对更大体系的声子计算成为可能。
尽管与传统的密度泛函微扰理论（DFPT）算法相比，自适应压缩极化率算符（ACP）算法已显著降低了计算复杂度，但 ACP  算法中使用的插值可分密度拟合（ISDF）分解计算插值点采用的是 QRCP 方法，在计算复杂度上仍然较高，约为 O(N_e^3)。因此，进一步优化  ACP 算法成为了迫切的需求。
为了克服 QRCP 方法的限制，本文作者通过引入机器学习中的 K-Means  聚类算法来优化算法性能，并比较了几种权重函数，包括 PSM、PM、SM 以及  SSM，以寻找最有效的策略。这种机器学习方法将计算插值点的复杂度降低到约 O(N_e^2)，有效替代了原有 ACP 算法中成本较高的 QRCP  方法，并加速了在迭代求解 Dyson 方程过程中的收敛速度。
该改进算法已在基于 MATLAB 的第一性原理计算软件包 KSSOLV  中得到实现。使用 K-Means 聚类算法计算插值点，在 32 个原子组成的声子计算案例中，速度提升了两个数量级。此外，K-Means  算法有效改善了 QRCP 方法在秩参数较小情况下 Dyson 方程不收敛的问题。在 Si8 体系的案例中，为实现 Dyson  方程的收敛，K-Means 算法所需的秩参数仅为 QRCP 方法的 1/3。作者还验证了 K-Means 算法的计算精度，其得到的声子频率结果与  Quantum ESPRESSO 的计算结果一致。

Chebyshev 节点对精度的影响

当 Chebyshev 节点数 N_c 设定为 15 时，声子频率的计算能达到相当不错的精度。随 N_c 数量的增加，计算精度会进一步提升，但提升的幅度将不会无限制地增长。如下表所示，当 N_c 增至 20 时，计算精度已达上限，而这一精度水平通常足以满足通常情况下的需求。因此，后续测试均固定采用 N_c = 20。

【表格一: Chebyshev 节点数 N_c 对 ACP 算法精度的影响

K-Means 算法对 Dyson 方程求解的收敛性的影响

在测试过程中，作者观察到当秩参数 N_𝜇 较小时，使用 QRCP 进行插值的方法难以使 Dyson 方程实现收敛。与此相比，在相同的秩参数条件下，K-Means 聚类算法在促进收敛性方面展现出更优的性能。如下图所示，当秩参数设为  4 时，QRCP 方法在收敛性上表现较差，而采用 K-Means 方法，特别是结合 PM 权重函数时，能够在 13 步内收敛至设定的  10^−8 精度标准，显著优于标准的密度泛函微扰理论（DFPT）方法（未应用 ACP 算法）所需的 61 步。就计算精度而言，SM 权重函数的表现优于 SSM 和 PSM，而 QRCP 在精度上的表现则是最差的。通过增加秩参数，可以系统地改善 Dyson 方程的收敛性。例如，SM 权重函数在 N_𝜇=5N_e 的设置下便可实现 Dyson 方程的收敛。此外，相较于 K-Means 算法，QRCP 方法对秩参数的依赖性更高。综合多种权重函数的数值结果来看，PM 在收敛性方面的表现最为出色。

图一: Dyson 方程的收敛过程

K-Means 的精度测试

在对 Si8 体系的测试中，作者选用 PM 作为权重函数，以评估 K-Means 算法在计算精度方面的性能。随着秩参数 N_𝜇 的逐步增加，Si8 的声子频率计算误差逐渐减小，直至 N_𝜇 达到 12N_e，此时 ISDF 分解的 M 矩阵达到满秩，计算精度不再随 N_𝜇 的增加而提高。在接下来的图示中，作者也展示了在 N_𝜇=12N_N_e 时采用 QRCP 方法得到的结果，几乎与 K-Means 算法得到的结果一致。这一观察表明，一旦 Dyson 方程成功收敛，在相同的 N_𝜇 下，不同的计算插值点方法所得的计算精度十分接近。

图二：以 PM 作为权重函数的 K-means 算法计算声子计算频率的相对误差

与 Quantum ESPRESSO 软件的计算结果对比

在进行精度对比时，作者将 KSSOLV 软件包中的计算结果与主流的密度泛函微扰理论（DFPT）计算程序 Quantum ESPRESSO（QE）的结果进行了比较。这一比较针对的是同一 Si8 体系的声子频率计算。如下图所示，通过 KSSOLV 计算得到的声子频率与 QE 的 PHonon 模块得到的计算结果非常接近，展现了 KSSOLV 在声子频率计算精度方面与当前主流 DFPT 计算工具的可比性。

图三：KSSOLV 中 ACP 算法计算的声子频率与 QE 软件的结果对比

K-Means 和 QRCP 两种算法的计算效率对比

下图展示的是 K-Means 算法与 QRCP 方法在计算标度上的差异，即随着体系大小增加计算所需时间的变化。从图中可以看出，K-Means 算法的计算标度接近 O(N_e^2)，而 QRCP 方法的计算标度为 O(N_e^3)。特别地，当计算的原子数量达到 32 时，使用 QRCP 方法计算插值点所需的时间比使用 K-Means 算法高出两个数量级。这表明随着体系规模的扩大，Dyson 方程求解过程中每次迭代所需的 QRCP 过程成为了显著的时间开销，而这一开销可以通过应用 K-Means 算法得到大幅减少。

图四：K-Means 算法和 QRCP 方法在 ACP 算法中计算插值点的计算标度。测试结果来自 2~32 个原子的半导体硅体系。

论文信息

文章题目：Machine  Learning K Means Clustering in Interpolative Separable Density Fitting  Algorithm: Advancing Accurate and Efficient Cubic Scaling Density  Functional Perturbation Theory Calculations within Plane Waves
期刊：Journal Of Physical Chemistry A
作者：李杰岚，杨柳，胡伟*，杨金龙*
通讯作者：胡伟，杨金龙，中国科学技术大学
发表日期：2024年3月4日（在线）
论文链接：
https://pubs.acs.org/doi/10.1021/acs.jpca.3c07159
KSSOLV软件

KSSOLV（Kohn-Sham Solver）是一款基于平面波基组的求解Kohn-Sham密度泛函理论的软件，利用MATLAB编程和计算，使用解释性语言，无需额外编译安装，支持Windows、Mac OS 和Linux操作系统，同时支持英伟达GPU加速，能够在个人PC端达到主流计算软件的计算速度。目前KSSOLV中已经实现了分子和固体的结构优化，电子能带结构计算（包括自旋轨道耦合效应SOC），局域密度近似（LDA）、广义梯度近似（GGA）和杂化泛函（HSE06）的交换关联泛函以及激发态电子结构（LR-TDDFT和GW）计算和动力学模拟（RT-TDDFT）等多项功能。
KSSOLV还可以用于验证公式和算法的正确性，其中已经实现的三种加速算法，包括自适应压缩交换算子（ACE）方法、投影的PC-DIIS（PC-DIIS）方法和插值可分密度近似（ISDF）方法，加速了杂化泛函、激发态电子结构计算和动力学模拟，可实现针对数百原子中等尺度的分子固体材料体系激发态光电性质的计算模拟。关于KSSOLV软件的最新发布文章参见Computer Physics Communications 279 (2022) 108424。

作者的其他帖子