探索化学语言模型的魅力

AIDDPro

2024年07月10日 19:11

今天给大家讲一篇2024年5月在nature machine intelligence期刊发表一篇对利用大语言模型辅助药化专家实现药物发现和材料设计等任务的研究论文。作者设计了一个以GPT-4为基模型，并集成了18个专家设计的工具的平台（ChemCrow），它在一定程度上增强了大语言模型在化学应用上的性能。此外，还自动合成了驱虫剂和三个有机催化剂的合成，并指导发现了满足期望属性的生色团。该方案的提出不仅为药化专家提供了便利，更降低了非专业人士进入该领域的门槛。通过架起实验与计算化学之间的桥梁，有效加速了药物设计的进程。

大语言模型研究背景

大语言模型（LLM）是基于海量数据进行预训练的深度学习模型，这些模型可以实现准确识别、翻译、预测和生成文本等任务。当然，在未见过的新任务上，只需设计任务的语言描述，并给出几个任务实例输入至模型，即可让模型从给定的场景中学习新任务并给出满意的回复。然而，它们在执行简单的任务如基础数学运算和化学操作时效果不尽如人意，例如，GPT-4和GPT-3.5无法始终准确地进行万位数的乘法运算或将IUPAC名称转换为相应的分子图。为了解决这些限制，可以将大语言模型与专门的外部工具相结合，如用计算器或OPSIN工具将IUPAC名字转换成分子结构。这些专业工具可以提供确切的答案从而提高它们的整体性能和适用性。

设计流程

2.1 ChemCrow整体流程

为了简化药物分子设计与合成等常见化学任务的推理过程，作者利用多种专家设计的化学工具并基于特定的任务选择合适的工具来回答用户给出的提示。

当模型得到用户输入后，它会思考整个推理流程，并选择合适的工具，在执行过程中无需与人类的交互，结果以关键词“观察”返回给模型，使其再次进入“思考”步骤。通过不断迭代上述过程从而一步步逼近最终的答案（图1a）。为了丰富其化学功能，作者部署了一系列化学反应，文献搜索，安全性评估等工具。这不仅赋予ChemCrow药物分子属性的相关知识，而且还具有直接在物理实验室中操作的能力。该方案的提出使其成为了药物化学家的得力助手（图1b）。

图1 ChemCrow设计及平台使用流程

实验分析与探究

3.1自动化合成

首先，用户输入“找到一种硫脲有机催化剂加速Diels-Alder反应”给ChemCrow，之后会设计一个完整的催化剂的合成流程（图2b）。ChemCrow依次调用不同的查询工具在RoboRXN平台上合成驱蚊剂分子和三种已知的硫脲有机催化剂，具体而言，通过自主查询平台上的数据，并不断地调整（例如增加溶剂量）直到合成过程顺利进行，从而消除了人工干预。最后这四种方式均得出了预期的化合物，证明了大语言模型自主执行合成化合物的能力，其有效的推理能力有助于挖掘更多有效合成路径，并最大程度地保障实验室安全问题（图2d）。

图2 硫脲类有机催化剂的研究与合成

3.2 人类与AI协作

在药物化学领域往往是基于实验结果来筛选类药分子。作者展示了药化专家与ChemCrow协作筛选候选生色团库的过程。该流程为依次加载、清洗数据，并训练一个随机森林模型用于预测每个分子最大吸收波长，随后为候选分子中最大波长接近于336nm的设计相应的合成路线。以该方案为提示，最终发现了一种新的生色团符合期望属性（图3）。

图3 生色团的筛选流程

3.3 多种化学工具性能评估

为了评估大语言模型在其他化学任务上的性能，作者测试了大语言模型使用特定化学工具解决相应化学任务的能力。其中GPT-4承担专家化学家的角色用于评估这个过程的合理与否，并强调各个方法的优缺点从而指导进一步的决策。如图4a、b所示，ChemCrow在更复杂的任务（设计分子的合成路径）中表现优于没有工具支持的大语言模型。尽管GPT-4无法提供准确的信息，但它倾向于生成更流畅的回答，并且所有关键信息都是GPT-4训练数据的一部分，使其能提供更完整的答案，因此将其作为评估模型。由结果可以发现ChemCrow在多个目标任务上始终提供了更优的解决方案，展现出其作为化学工具的潜力。

尽管人类专家更喜欢基于化学准确性和任务完整性的ChemCrow的反应，但基于GPT-4的大模型通常能生成流畅且完整的回答。然而当大语言模型无法理解提示词时，其生成质量则很难保证。就目前而言，基于大语言模型的方法依旧无法取代专家的评估结果。

图4 在多个化学任务上评估GPT-4 与 ChemCrow的性能

结论

为了方便药理学专家们了解小分子的全激酶多药理学效应，作者研发了一款基于大语言模型且集成药物设计中多个工具的平台ChemCrow。该平台通过将大语言模型的推理能力与化学专家知识相结合，成功设计并合成了一种驱虫剂和三个有机催化剂，并指导合成了具有目标属性的生色团。从简单的药物发现到合成各种复杂分子表明其作为未来化学助手的潜力。

与GPT-4相比，ChemCrow在化学事实性、推理和回答的完整性方面展现出了显著优势，然而基于大语言模型的评估可能不如人类在化学推理中有效可靠。综上所述，ChemCrow的提出展示了其在现实中解决化学问题的能力，未来可将其应用于更多领域从而辅助药化专家进行进一步的决策。

参考文献

Castro Nascimento, C. M. & Pimentel, A. S. Do large language models understand chemistry? A conversation with ChatGPT. J. Chem. Inf. Model. 63, 1649–1655 (2023).

版权信息

本文系AIDD Pro接受的外部投稿，文中所述观点仅代表作者本人观点，不代表AIDD Pro平台，如您发现发布内容有任何版权侵扰或者其他信息错误解读，请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

本文为原创内容，未经授权禁止转载，授权后转载亦需注明出处。有问题可发邮件至sixiali@stonewise.cn

模型化学化学语言化学语言模型

本文为我原创，未经授权禁止转载

cv36030055

分享至

投诉或建议