文献分享 | Nature:三段式人工智能方法用于化学研究:发现优异光伏材料同时产生新化学知识

By
In 文献分享

前言与背景


在人工智能科研研究范式下,已实现了预测、实验、分析的闭环实验。这种方式在加速科学发现方面显示出巨大潜力,但目前还不可能利用闭环优化策略来获取全新的化学知识。在分子功能的前沿,这种基本的理解与人工智能指导的优化策略的实际结果具有同等重要性,并且对于将人工智能指导的发现与人类科学过程相结合至关重要。

光稳定性是一种普遍存在的化学功能,目前缺乏通用的化学设计原则。化学知识的缺乏限制了有机光伏、染色聚合物、太阳能燃料和荧光染料等领域的进展。闭环范式有望在传统方法未能实现的光稳定性方面取得突破。因此,需要从闭环策略中提取知识的新方法,AI才能产生可解释的假设并增强科学家对光稳定性和分子功能的根本理解。

近期,伊利诺伊大学厄巴纳-香槟分校(UIUC)的Angello及其团队在Nature上的提出了一种三段式人工智能的研究方法——闭环转移(CLT),旨在从闭

环优化过程中提取和验证物理与化学新机制假设,并指导新化学原理与优异性能材料发现。基于此,他们发现了光伏电池新材料,为提高稳定性做出了进一步的贡献。


研究内容


闭环转移方法在文章中被描述为一个整合了闭环实验、物理基础特征选择和监督学习的过程,旨在在优化目标函数的同时产生化学洞见。CLT方法的实现分为三个阶段:① 机器学习驱动的假设生成;② 假设检验;③ 物理新机制发现。如图1所示:

图 1:CLT 范式。第一阶段(ML 驱动的假设生成,绿色轨道)描述了 BO 驱动的一轮合成和特征描述,同时使用基于物理特征的可解释 ML。通过 ML 提出基于物理的假设后,第二阶段(假设检验,橙色轨道)对假设进行实验检验,如果验证有效,则产生新的知识,在第三阶段(物理驱动的发现,红色轨道)利用这些知识进行分子优化。

1.机器学习驱动的假设生成

在这一阶段,该团队使用贝叶斯优化(BO)来提升光收集给体-受体分子的光稳定性,直到性能指标达到稳定状态。此时,基于物理的分子特征,通过机器学习模型生成一个假设。这个过程涉及自动化模块合成和实验表征,目的是在广阔的化学空间中快速搜索并优化光稳定性。BO驱动的闭环实验进行了五轮,自动合成了30种新的供体-桥-受体(Donor-Bridge-Acceptor,DBA)收集分子(图2),直到观察到实验光稳定性饱和。

图 2:第一阶段的 ML 驱动假设生成。a,每轮闭环实验 BO 生成的数据,其中显示了具有代表性的高光稳定性分子。b,每轮闭环实验的累积光稳定性性能。c,使用每个分子的 TDOS 预测 T80 的基于物理的 ML 假设与预测任务相关的四个三重态 TDOS 能量作图。

2.假设检验

在假设生成后进入第二阶段,需要使用机器学习进行实验验证。该团队利用DFT计算来生成基于物理的特征,并从这些结果中提取了114个全面的物理和化学分子特征。这些特征随后在每个BO回合后被整合到支持向量回归(SVR)中,以预测实验T80值。

图 3:第二阶段的假设检验。a、实验验证测试集中分子的光稳定性,它们的平均值、标准差(以误差线表示)和相关的 Mann-Whitney 检验的 P 值绘制在中心。b、所有双特征 SVR LOOV 结果,用于从双特征组合预测整个 44 个分子数据集的 T80。c,比较所有可能的四特征模型的预测强度,这些模型包含 4.0 eV 的 TDOS 或 T1 能量,用于预测整个 44 个分子数据集的 T80。d,源自 CLT 第二阶段假设的物理机制,展示了 4.0 eV 处的低 TDOS 如何降低系统间交叉 (ISC) 后的 Dexter 能量转移频率,从而增强五噻吩-C12 (DB_11_A_002) 的光稳定性。

3.物理新机制发现

该团队通过选择了三种不同的溶剂:氯苯(chlorobenzene)、甲苯(toluene)和癸烷(decane),以探究溶剂分子的三重态能量与待测分子三重态之间的能量转移可能性。在第三阶段聚焦于三重态密度的高能部分(TDOS),尤其是4.0电子伏特(eV)处的TDOS,作为分子光稳定性的关键决定因素。基于这一理论,研究人员合成了一系列具有不同TDOS特性的分子,并在不同的化学环境中测试了它们的光稳定性,以排除溶剂效应对实验结果的干扰。结果表明,所有分子在甲苯中的光稳定性提高了90~150%,在癸烷中进一步提高了10~100%,且TDOS在4.0 eV处较高的分子改善更大。这些结果与所提出的光稳定性的溶剂敏化机制完全一致(图3d),并证明了多种阶段三的假设驱动策略,改善光吸收分子的光稳定性超过初始化学空间。


总结与展望


这篇文章提出了闭环转移这种三段式研究方法,将研究分为假设生成、假设检验、实验验证三个阶段。其中,第一阶段利用BO来导航DBA分子定义的化学空间,通过迭代完善有助于光捕获分子的关键特性的光稳定性来优化光稳定性;第二阶段的重点是验证第一阶段产生的假设,经实验验证表明了CLT方法在生成可操作的化学知识方面的有效性;第三阶段研究应用经过验证的假设来指导进一步的发现工作,结果凸显了 CLT 方法的潜力,不仅可以优化分子特性,还可以产生新的分子设计策略。

该文章报道的闭环实验,通过使用基于物理的特征的可解释的机器学习模型进行了增强,阐明了有关分子光稳定性的基本化学知识,同时针对高功能分子目标进行了优化。人工智能引导的活动产生了本文的假设,显著提升了效率,这归功于人工智能引导的探索和利用的平衡与可解释的基于物理的建模的结合。此外,CLT被证明广泛适用于其他前沿应用和研究领域,特别是难以先验预测的低数据状态和多维分子特性。有理由相信,CLT将成为在假设驱动的发现研究中利用BO优势的典型范例,并通过基于物理的见解得到加强。这项研究不仅在化学知识发现方面取得了突破,还为未来的材料设计和优化提供了一个强大的工具。通过结合人工智能、自动化合成和物理洞见,我们有望更快、更高效地开发出具有所需功能的新材料,从而推动多个技术领域的进步。


原文链接:https://www.nature.com/articles/s41586-024-07892-1









编辑:孙华骋

审核:刘玉研