上海交通大学周寅宁和天津科技大学闫方友团队JCIM | 用于聚合物性质预测的链结构近似表示新方法
2023/2/28 17:35:58 阅读:119 发布者:
英文原题:
Ring Repeating Unit: An Upgraded Structure Representation of Linear Condensation Polymers for Property Prediction
通讯作者: 周寅宁,上海交通大学化学化工学院;闫方友,天津科技大学化学与材料学院
作者: Mengxian Yu, Yajuan Shi, Qingzhu Jia, QiangWang, Zheng-Hong Luo
背景介绍
聚合物链结构表示方法在以数据驱动建模为基础的聚合物性质预测和新型聚合物设计等方面起关键作用。传统上,单体和重复单元(RU)常用于聚合物链结构的近似表示,由于其存在多样性,无法提供唯一的描述符(特征),从而导致了以数据驱动为基础的定量结构性能关系(QSPR)模型预测值“不唯一”的问题。
文章亮点
2023年01月04日,天津科技大学化学与材料学院闫方友团队和上海交通大学化学化工学院周寅宁团队在化学信息学和人工智能研究领域的国际权威学术期刊 Journal of Chemical Information and Modeling 上发表了题为“Ring Repeating Unit: An Upgraded Structure Representation of Linear Condensation Polymers for Property Prediction”的研究论文,提出了以环状重复单元(RRU)独特地代表线性缩聚物的新方法,成功解决了传统结构表示方法在链结构近似方面存在的缺陷,为准确预测聚合物性质奠定了基础。具体工作流程如图1所示。
图1:分别以 RRU 和 RU 为基础预测聚合物特性的工作流程
对于主链含有杂原子的线性缩聚物而言,由于存在共聚单元序列结构的差异,聚合物链结构的描述相对复杂。受合成路径不同或研究者对 RU 划分方法不同的影响,其反应组分/单体或者 RU 可能是“不唯一”的。因此,当使用反应组分/单体或者RU作为聚合物链的近似表示并用于 QSPR 模型描述符计算时,可能会导致模型预测值“不唯一”的现象,如图2所示。本工作提出的 RRU 方法,通过将 RU 以头尾相连的方式形成环化片段,即构造“周期性边界”,从而唯一地描述了聚合物链结构,同时还能够考虑相邻原子的相互作用。该工作以高性能聚合物——聚酰亚胺(PI)为研究对象,深入地分析了基于 RRU 的链结构近似在以对称或者不对称反应组分体系所合成的 PI 中的应用,结果表明,可以确保“一个缩聚物对应一个 RRU”。
图2:聚合物的不同结构表示。(a)单体,(b)重复单元RU,和(c)环状重复单元RRU
该工作在1321个玻璃化转变温度(Tg)的大数据集上,运用前期工作(Macromolecules 2022, 55, 21, 9397-9410)中所采用的自主开发的范数描述符,分别开发了基于 RRU 和基于 RU 的 QSPR 模型。所开发的模型均经过了严格的验证,包括内部验证(留一交叉验证LOO-CV)、外部验证和Y-随机验证,以确保其预测性和稳定性。验证结果表明,基于RRU的模型表现了唯一的预测值,其测试集相关系数(R2testing)和平均绝对误差(AAEtesting)分别为0.8793和18.62℃。然而,由于相同的聚合物存在不同的 RU,应用 RU 模型时则展现了不同的预测值。以两个不同 RU 为例,RU 模型相关统计参数为R2testing1=0.8735, AAEtesting1=20.00 ℃和R2testing2=0.8087, AAEtesting2=23.95 ℃。可见,这种结构表示的“非唯一性”在一定程度上阻碍了数据驱动模型在聚合物特征工程中的充分应用。
图3:部分聚酰亚胺Tg预测结果
最后,该工作应用基于RRU的模型预测了从文献中收集的多种 PI 的 Tg,结果与实证趋势一致,证明了 QSPR 模型良好的预测能力,可在合成目标聚合物之前快速地获取性能值,如图3所示。在这项工作中,作者提出了 RRU 的结构表示法,有助于促进研究者理解聚合物结构近似方法在模型开发中的重要性。原则上,RRU 结构表示法可以用处理其他具有重复结构单元的线性聚合物体系,帮助实现聚合物性能准确预测和高性能聚合物设计。未来有望在一定程度上推动为以数据驱动为基础的聚合物信息学的发展。
转自:“ACS美国化学会”微信公众号
如有侵权,请联系本站删除!