谈谈赝势基组的选用

谈谈赝势基组的选用
On the choice of pseudopotential basis sets

First release: 2017-Apr-18 Last update: 2022-Nov-12

1 前言

“算xxx元素该用什么赝势基组”是网上最常问的问题之一，本文说说该怎么选用赝势基组。本文主要面向Gaussian用户的情况，其它程序用户可以择情借鉴。看本文之前一定要非常仔细看《谈谈中基组的选择》（ //www.umsyar.com/336），本文假定读者已经充分理解了那篇文章所讲的全部内容。如果你特别着急做计算，连把本文完整读完的耐心都没有，那就直接看第4节。

笔者之前还写过其它与赝势、赝势基组有关的文章。凡是以下文章里已讲过的内容在本文基本不会再重复，如果对赝势一点都不了解的话一定要先看看。
赝势的函数形式以及在程序中定义的方式（ //www.umsyar.com/188）
在赝势下做波函数分析的一些说明（ //www.umsyar.com/156）
详解Gaussian中混合基组、自定义基组和赝势基组的输入（ //www.umsyar.com/60）

以下两篇文章与赝势基组也有关，若感兴趣可以看看
在线基组和赝势数据库一览（ //www.umsyar.com/309）
用NWChem做SODFT在DFT计算中考虑旋轨耦合效应（ //www.umsyar.com/368）

2 什么时候该用赝势基组？

先看看使用赝势基组计算带来的好处：
(1)计算时不需要直接考虑内层电子，使计算量大幅降低，而且序号越靠后的元素这一点体现得越明显。用赝势基组计算一个很重原子，其省下来的计算量往往相当于全电子基组计算几个轻原子。
(2)相对论效应从第四周期（H,He是第一周期，下同）开始值得关注，但不考虑也问题不大，从第五周期开始则是绝对不能忽略。相对论效应主要来自于内层电子。拟合赝势的时候如果已考虑相对论效应，即使用相对论赝势，则基于赝势计算的时候就可以把相对论效应等效地体现出来，免得用DKH等方法考虑相对论效应了（用DKH等不仅导致额外增加耗时，多数程序还不支持其解析导数，导致做优化等任务极为困难）。

用赝势基组计算也有一些坏处：
(1)由于内层电子没有明确表达，有可能影响计算精度。这一点看你具体用什么赝势和赝势基组以及计算哪些元素了，不能一概而论。对同一系列赝势，大核版本由于这个问题更明显，故精度大多不如小核版本好。
(2)导致直接依赖于内核电子的性质无法计算。对于使用了赝势的原子，就没法计算其NMR、超精细耦合、内核电子激发等依赖于内层电子的量了（不过对其它原子还是可以计算的）。
(3)内层电子的缺失可能有碍一些波函数分析，但也有办法避免，详见《在赝势下做波函数分析的一些说明》中的讨论。

了解了以上信息，什么时候该用赝势基组心里就应该有数了。

前三周期元素：强烈不建议用赝势基组，因为此时使用赝势带来的上述两条优点很不明显，而带来的那些坏处却是实实在在的。而且赝势对前三周期可用的赝势基组比较有限，可选余地很小。
第四周期元素：用不用赝势基组皆可。一般我还是推荐用赝势基组，因为此时它带来的两条优点已经开始显现了，赝势基组可选择余地此时也多了。如果体系中只有很少量第四周期元素，比如配合物当中的过渡金属，并且想在写输入文件时省事或者希望所有元素用的基组都统一，那么都用全电子基组也完全可以。如果体系中有大量第四周期元素，比如计算较大的过渡金属团簇，那么强烈建议用赝势基组，耗时会节约甚巨。
第五周期及之后的元素：除非有特殊原因必须用全电子基组，否则强烈建议用赝势基组，它带来的那两条好处已经重要到必不可少。

3 常用的几种赝势基组

一般计算用得到的赝势基组就下面四类。除下面介绍的，在文献里还容易看到CRENB和SBKJC赝势，但如今用得都不多，CRENB虽然覆盖周期表很全面但是精度不算多好，SBKJC主要也就是GAMESS-US用户才用，因为是其唯一自带的赝势，并没什么特别的优点。所以这俩赝势后文不提。还有个LFK赝势基组是在SBKJC对前六个周期主族（除Ga、In、Tl）的定义基础上增加弥散和极化函数使计算极化率达到较好精度，如果需要赝势下计算极化率可以考虑。

3.1 Lanl系列赝势+标配赝势基组

Lanl (Los Alamos National Laboratory)是Hay和Wadt在上世纪80年代提出的很常用的一种赝势。对第四周期元素并未考虑相对论效应，对更重的元素都考虑了相对论效应。

对s族和过渡金属，Lanl1是大核赝势，Lanl2是小核赝势。对p族二者等价，是大核赝势。都有MB（极小基）和DZ（双分裂价基）两种配套的赝势基组，最常用的是Lanl2DZ。Lanl2DZdp是Lanl2DZ基础上加了层p弥散和d极化。lanl1以及MB都精度太烂，绝对不要用。

2008年提出了Lanl2TZ，是对Lanl2DZ重新进行收缩得到，算是准3-zeta基组。Lanl2TZ+是对第一周期金属增加一层d弥散。Lanl2TZ(f)是对过渡金属增加一层f极化。
Lanl08是对于过渡金属和主族元素在Lanl2DZ基础上都彻底去收缩化。Lanl08+是在Lanl08基础上对于第一周期过渡金属加上d弥散。Lanl08(d)和Lanl08(f)分别是在Lanl08基础上对主族和过渡金属加上d和f极化。

Lanl2DZ目前包含前六个周期绝大部分元素，镧系只支持La自己，锕系只支持U、Np、Pu。其它变体支持的元素明显没有Lanl2DZ广泛，具体支持哪些元素可以在BSE网站（ https://www.basissetexchange.org）上查。

Lanl2DZ曾被用得非常广泛，即便是现在还用得很多。但 笔者强烈不推荐用Lanl2DZ，因为在如今看来其精度明显偏低。如今算过渡金属起码lanl2TZ，其实比Lanl2DZ贵不了多少而精度大有改善，如果计算资源还富裕则建议升到Lanl2TZ(f)。对于主族，lanl2DZ也同样不理想，又没极化又是大核赝势，如今起码用lanl08，条件稍好点就建议用lanl08(d)。

3.2 Stuttgart赝势+标配赝势基组

对于过渡金属和主族的大部分元素都是大核和小核版本都有，是计算镧系和锕系的不二之选，对于其它元素也都比较不错。此系列赝势几乎涵盖整个周期表，甚至120号元素都有。精度较好，可靠度高，不断在发展和完善。Gaussian等程序自带的以及BSE上的Stuttgart赝势及其标配的赝势基组既不新也不全，如果比较讲究的话，建议去其作者官网上下载定义： http://www.tc.uni-koeln.de/PP/clickpse.en.html。

Stuttgart官网上的每种元素往往有许多不同赝势版本，其命名在前面提过的《详解Gaussian中混合基组、自定义基组和赝势基组的输入》里有一些介绍，WB和DF结尾的都是考虑相对论效应的。每种赝势有时候还提供了不同的标配的赝势基组，情况相当复杂，不同元素情况还不一样，三两句话说不清楚。这里只说Gaussian的情况。当你在Gaussian里直接用SDD关键词使用自带的Stuttgart赝势+配套基组时，其特征以及与Lanl系列赝势基组的大小对应关系如下
Sc~Ni：MDF小核赝势，有f极化函数。尺寸略大于Lanl2TZ(f)
Cu、Zn及第二、三周期过渡金属元素：MWB小核赝势，无f极化函数。尺寸略大于Lanl2TZ
主族：对s和p族分别是小核和大核MWB赝势，无d极化函数，尺寸介于Lanl2DZ与Lanl08之间
Stuttgart作者主页上的上面提到的这些过渡金属的赝势的配套基组都有2f,1g极化函数（因此昂贵很多），其它元素的赝势基组定义和Gaussian直接用SDD关键词时多数情况一致。

lanl2DZ的精度明显逊于Gaussian里直接写SDD时的情况。对过渡金属Lanl2TZ(f)和SDD精度相仿佛，对主族lanl08和SDD精度相仿佛。

如果没特殊情况，用Stuttgart赝势基组时就在Gaussian里写SDD就行了，有必要特殊考虑的主要也就两种情况：
(1)计算稀土元素的团簇，用默认的Stuttgart小核赝势耗时太高，SCF收敛比用大核赝势也往往困难得多得多，这时候需要换成大核版本。对于d族过渡金属只有小核版本，所以没得选，ds族倒是也有大核的，不过意义不大
(2)计算主族时，为了结果更好，或者能更好地做波函数分析，可改用小核版本（没内置，需要自行到Stuttgart网站上下）。

3.3 cc-pVnZ-PP系列赝势基组

上述lanl赝势基组和Stuttgart赝势基组（指Gaussian自带的版本）对于DFT计算是很合适的，但对于后HF计算，尤其是CCSD(T)这样高档次后HF方法就显得比较low了。

cc-pVnZ-PP (n=D,T,Q,5)系列是Dunning相关一致性基组的赝势版本，是最适合后HF计算的赝势基组，很适合搭配cc-pVnZ给轻原子使用。结合的是Stuttgart小核MDF赝势。此系列在不断完善中，目前对从Cu到Rn的d,ds,p族元素、从K开始的碱金属、从Ca开始的碱土金属、Th/Pa/U有定义。其中有些在BSE上查不到，在作者的主页上可以下载最新最全版本：http://tyr0.chem.wsu.edu/~kipeters/basis.html。由于此系列赝势基组高角动量函数多，收缩度高，用在DFT计算上较昂贵，不值得。

cc-pVnZ-PP标准的带弥散函数的版本是aug-cc-pVnZ-PP，读过《谈谈弥散函数和“月份”基组》（ //www.umsyar.com/119）一文的人肯定知道，aug包含的大量高角动量弥散函数意义不大。对于aug-cc-pVnZ-PP系列，也完全可以简化成月份基组的版本来节约时间。

另外还有SDB-cc-pVnZ-PP (n=T,Q)系列赝势基组，结合Stuttgart大核MWB赝势，力图达到全电子cc-pVnZ (n=T,Q)的质量。仅对于Ga~Kr和In~Xe有定义。精度略逊于cc-pVnZ-PP，但由于是大核所以更便宜。

3.4 def2系列赝势基组

def2系列基组从def2-SV(P)、def2-SVP、def2-TZVP、def2-TZVPP、def2-QZVP、def2-QZVPP精度逐级增高。对前四周期是全电子基组，从第五周期开始是赝势基组，结合的是Stuttgart小核赝势。def2系列一大优点是除了锕系以及最后一个周期外覆盖了周期表所有元素，因此对绝大多数体系可以只用def2而无需用混合基组。此系列基组既适合DFT也适合后HF计算，但对于后者起码得用def2-TZVP。Gaussian直接内置了def2系列，不过其镧系的定义没有内置（至少对于G16 B.01而言仍是如此），镧系的定义得从BSE或Turbomole基组库（ http://www.cosmologic-services.de/basis-sets/basissets.php）里获得。

def2系列赝势基组虽没有标配的弥散函数，但需要弥散函数时可以按此文方式很容易地加上：《给ahlrichs的def2系列基组加弥散的方法》（ //www.umsyar.com/340）。

搞def2的Weigend等人还搞了dhf系列赝势基组，只包含第五、六周期，主要是把def2对s、d族元素用的Stuttgart赝势从MWB改为了MDF并重新优化了赝势基组，使得精度有一定提升，并且dhf原文中的数据表明dhf系列比同级别cc-pVnZ-PP结果更好。不过dhf没有被Gaussian等主流程序内置，得去Turbomole基组库里拷定义。

def2之前还有def系列基组，同样从第五周期开始是赝势基组。除def2目前支持的元素外还多定义了锕系，但是对镧系锕系只有SVP和TZVP两个级别，而且大小基本一样。

cc-pVnZ-PP系列、def2/dhf系列赝势基组都是基于Stuttgart赝势，比起Stuttgart赝势标配的赝势基组的关键好处就是基组选择余地大，可以根据自己要求的精度来选。

4 赝势基组的选择建议

本文一开始提到的，也是初学者老问的“算xxx元素该用什么赝势基组”这个问题，根本就是个unanswerable的问题，提供的前提太少！要算的元素只是要被考虑的诸多因素之一而已。假设只是计算常规问题，比如几何优化、振动分析、计算反应能量/势垒、价层电子激发之类，那么根据你的计算条件的好坏（显然也要考虑体系大小、有多少原子要用赝势基组），以及所用的理论方法，赝势基组有以下推荐。当然，推荐的赝势基组能用的前提是它对你要算的元素有定义，哪些赝势基组能用于哪些元素前面介绍过了。

DFT计算：
计算条件差：Lanl2DZ
计算条件一般：过渡金属用lanl2TZ，主族用lanl08(d)
计算条件不错：过渡金属用lanl2TZ(f)或SDD，主族用lanl08(d)
计算条件很好：def2-TZVP
计算条件无限好：def2-QZVP（DFT计算用QZ级别其实很浪费）

后HF或多参考方法计算（对于cc-pVnZ-PP不支持的元素只能用def2了）：
计算条件奇差无比：cc-pVDZ-PP或def2-SVP
计算条件一般：过渡金属用Lanl2TZ(f)或SDD，主族用lanl08(d)
计算条件不错：cc-pVTZ-PP或def2-TZVPP
计算条件很好：cc-pVQZ-PP或def2-QZVPP
def2对第四周期还是全电子基组，cc-pVnZ-PP从Cu才开始有定义。因此后HF计算时非要对Cu之前的用赝势基组的话那就只能靠lanl或SDD了。

提示1：对前三周期不要用赝势基组。并且能接受的基组底限是6-31G*。
提示2：做波函数分析时一定要用小核赝势。
提示3：镧系可以用Stuttgart赝势+标配基组也可以用def2系列赝势基组。锕系一般用Stuttgart赝势+标配基组或def-TZVP赝势基组，对Th、Pa、U也可以用cc-pVnZ-PP系列。

如果研究的问题需要基组含有弥散函数才能描述好（见《谈谈弥散函数和“月份”基组》），赝势基组显然必须带弥散函数。cc-pVnZ-PP前面带上aug即可，def2怎么加弥散前面也说了，lanl系列赝势基组直接也有带弥散的版本。而对于SDD标配的赝势基组，可自行用even-tempered方式加弥散（在《给ahlrichs的def2系列基组加弥散的方法》里面说过怎么做）或者把lanl的带弥散版本的弥散函数借过来也可以。

5 关于计算配合物时赝势基组与全电子基组的匹配问题

老有人问计算过渡金属配合物时配体原子用xxx全电子基组，过渡金属原子用yyy赝势基组合不合适，匹配不匹配什么的。我感觉很多人对匹配问题太敏感了，纯粹想多了。在我看来，如果按照基组的价层分裂数（zeta）来划分，给过渡金属用的赝势基组的档次约等于配体的全电子基组，或者前者比后者高一个档，都是完全可以的。比如说，DFT计算二茂铁，可以Fe用lanl2TZ(f)或SDD，茂环原子用6-31G*或者6-311G*。我主张过渡金属用的赝势基组的档次比配体更高一点，毕竟过渡金属在配合物里面占的比例通常极少，基组大点不至于耗时增加多少，而它又处在体系的中心地位，重要性最高，所以给过渡金属用好点的赝势基组，是明显的好钢用在刀刃上的行为。因此，比如Fe用较烂的lanl2DZ，而茂环用较好的TZVP就严重不合理了，明显主次不分。不过，我也不建议过渡金属用的赝势基组高过轻原子太多，比如算个顺铂，Pt用def2-TZVPP，配体用6-31G*，这差距就过于悬殊，配体的烂基组就成为了制约计算精度的严重瓶颈（而且这种基组尺寸的严重不平衡，对于Mulliken等直接基于基函数做的波函数分析也有不良影响）。