
随着人工智能技术的飞速发展,其在药物研发领域的应用也在日益增长。研究人员也在积极地使用机器学习模型,通过从海量的分子库中筛选出具有潜在药用价值的分子,来加速新药的研发进程。
然而,新药研发过程中涉及诸多复杂因素,如材料成本、实验风险等,即使借助人工智能,也难以轻松权衡合成最佳候选药物的经济性。
为了协助科学家在药物研发过程中作出更经济的决策,麻省理工学院的研究团队开发出一种新的算法框架——合成计划和基于奖励的路线优化工作流程(SPARROW)。该框架能够智能识别出最具成本效益的分子候选者,旨在降低合成成本的同时,确保候选分子尽可能具备所需的特性。此外,该算法还能明确合成这些分子所需的原材料和实验操作。
MIT的定量框架被称为合成计划和基于奖励的路线优化工作流程(SPARROW),该框架可以从一些相同的化合物中衍生出多个候选分子,从而可以考虑了一次合成一批分子的成本。
值得一提的是,SPARROW不仅可助力制药企业更高效地发现新药,还可应用于农用化学品的创新和有机电子专用材料的探索等领域。
麻省理工学院化学工程、电气工程和计算机科学系的职业发展助理教授Connor Coley表示:“过去,化合物的选择更多依赖于经验和直觉,有时这种选择能带来惊人的成功。但现在,随着各种模型和预测工具的出现,我们能够获取更多关于分子性能和合成方法的信息。因此,我们应该利用这些信息来指导我们的决策过程。”Coley与主要作者Jenna Fromer共同参与了这项研究,其成果已发表在《自然计算科学》杂志上。
在药物研发过程中,科学家是否选择合成和测试某种分子,归根结底取决于合成成本与实验价值之间的权衡。而确定这两者本身就是一项复杂任务。例如,实验材料可能价格昂贵,或者实验失败的风险较高。在评估价值时,还需考虑分子特性的实用性以及预测结果的不确定性。

图1:SPARROW及其在分子设计周期中的作用概述。候选集中的每个分子,包括来自算法或专家来源的任何组合的分子想法,用其预期的性质和潜在的合成路线进行注释。然后,SPARROW将每个候选项的效用与其合成成本进行权衡,并选择候选项的最佳子集进行合成和测试。
此外,制药企业为提高效率,越来越多地采用间歇式合成方法,即同时测试多个由化学构建块组合而成的候选分子。然而,这意味着化学反应必须都需要相同的实验条件。这使得估算研发成本更具挑战性。
SPARROW通过综合考虑合成过程中涉及的共享中间化合物,并将这些信息纳入其成本与价值函数中,从而有效应对了这一挑战。Coley指出:“在设计一批分子的优化过程中,新增结构的成本会受到已选分子的影响。”该框架还综合考虑了起始材料的成本、每条合成路线中的反应数量以及这些反应首次尝试的成功率等因素。
科学家在使用SPARROW时,只需提供一组待测试的分子化合物以及他们希望发现的特性定义。随后,SPARROW会收集有关分子及其合成途径的信息,并权衡每个分子的价值与合成一批候选分子的成本。最终,它会自动筛选出符合用户标准的最佳候选化合物子集,并为这些化合物确定最具成本效益的合成路线。
SPARROW框架的推出,在药物发现领域掀起了一场革命。其独特之处在于,它能够灵活地结合人类手工设计的分子结构、虚拟目录(virtual catalogs)中的分子结构,以及生成式AI模型发明的全新分子,打破了传统药物研发的限制。
“SPARROW的魅力在于,它为所有不同的创意来源提供了一个公平的竞争平台,”Coley教授补充道。
为了验证SPARROW的实用性和高效性,研究人员在三个基于化学家实际挑战的案例中进行了测试。这些案例旨在评估SPARROW在处理多样化输入分子时,找到成本效益合成方案的能力。

图2:Koscher等人将SPARROW应用于自主分子设计循环的结果。35.(a,B)SPARROW确定了与基线相比具有更高回报和更低成本的解决方案。(C)增加奖励权重λ 1会增加累积奖励和起始材料成本。(D)较大的λ 1值减少了与反应成本相关的相对惩罚,导致具有更多反应的解决方案和具有较低置信度分数的反应。(E)SPARROW的向下选择可以可视化为选定和未选定节点的网络(λ 1=5)。所有示例均使用λ 2=λ 3=1。请注意,报告的起始材料成本是所选起始材料每克价格的总和,并不考虑所需的量。
测试结果显示,SPARROW不仅能够有效捕捉间歇合成的边际成本,还能精准识别常见的实验步骤和中间化学品。此外,SPARROW还具备处理数百种潜在候选分子的能力,展现了其强大的可扩展性和灵活性。
展望未来,研究团队计划将更多复杂性纳入SPARROW中。他们希望算法能够考虑到测试一种化合物的价值可能并非一成不变,以及将更多并行化学元素融入其成本与价值函数中。
Relay Therapeutics的人工智能高级副总裁Patrick Riley表示:“Fromer和Coley的工作将算法决策与化学合成的实际情况紧密结合。传统的计算设计算法在确定如何最佳合成设计集时,往往依赖于药物化学家的判断,这既增加了药物化学家的工作负担,也可能影响最佳药物分子的选择。这篇论文提出了一条原则性的道路,包括了对联合综合的考虑,我期望这将引领更高质量和更广泛接受的算法设计。”
参考资料:https://news.mit.edu/2024/smarter-way-streamline-drug-discovery-0617
本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。
本文为原创内容,未经授权禁止转载,授权后转载亦需注明出处。有问题可发邮件至sixiali@stonewise.cn