
药物再利用是可以替代昂贵且耗时的新药开发过程,特别是对于有效治疗有限的严重、广泛的疾病,例如阿尔茨海默氏病(AD)。ChatGPT 等新兴的生成人工智能 (GAI) 技术有望加快科学知识的审查和总结。为了检验使用 GAI 识别药物再利用候选药物的可行性,作者反复委托 ChatGPT 提出 20 种最有希望在 AD 中再利用的药物,并在两个大的 65 岁以上暴露和未暴露个体中测试前 10 种药物的 AD 事件风险。临床数据集:(1)范德比尔特大学医学中心和(2)作者所有人研究计划。在 ChatGPT 推荐的候选药物中,荟萃分析显示二甲双胍、辛伐他汀和氯沙坦与较低的 AD 风险相关。这些发现表明,GAI 技术可以从广泛的互联网搜索空间中吸收科学见解,有助于确定药物再利用候选药物的优先顺序并促进疾病的治疗。
阿尔茨海默病 (AD) 是一种进行性神经退行性疾病,由于其不可逆性和在老年人中的高患病率,引起了医疗保健领域的重大关注。尽管进行了数十年的研究,AD 的治疗选择仍然有限,使患者和家庭希望渺茫。与单独的新药开发过程昂贵且耗时的过程相比,重新利用药物来确定现有药物的新治疗应用是发现治疗方案的一种有吸引力的替代方法,特别是对于仍然缺乏有效治疗的严重、广泛的疾病。除了加快整个发现到市场过程的时间表和降低成本之外,该方法还提供了完善的药物安全性概况并加快了临床转化,并增强了患者的可及性。然而,药物再利用的成功取决于在大量药物中迅速、准确地识别出有前途的候选药物。
寻找药物再利用候选药物通常依赖于对科学文献的全面审查,重点关注为某些药物或其组成成分提供功效证据的研究。机制见解、临床前实验、临床报告、大规模观察研究和药物再利用数据库共同构成了搜索的空间。然而,这一审查过程是劳动力和时间密集型的,需要研究人员结合疾病机制、分子生物学、药理学、临床研究和生物信息学等跨学科专业知识。例如,使用关键字“(阿尔茨海默病或神经退行性疾病)AND(治疗或药物或重新利用)”进行搜索,会在 PubMed 上找到大约 233,000 篇已发表的论文,在 Google Scholar 上找到超过 100 万篇论文。领域专家不太可能从如此巨大的空间中全面阅读并综合有意义的假设。因此,简化这一过程的方法在重新利用工作方面具有优势。
生成人工智能 (GAI) 的最新进展(以 OpenAI 的 ChatGPT 3为代表)展示了人工智能理解和响应不同查询的卓越能力。GAI 的理解和响应能力源自对互联网庞大语料库的广泛接触、细致入微的知识编码以及随后对显示推理过程的响应的优化。除了回答一般问题外,GAI 还证明了在专业医疗环境中的有效性,包括回答美国医疗执照考试问题、临床决策咨询和药物发现。例如,ChatGPT 因为医疗程序生成知情同意文件而获得认可,这些文件比外科医生编写的文件更易于患者阅读、完整且准确。此外,ChatGPT 作为提供患者管理建议的临床决策支持工具已显示出前景。此外,生物技术公司已经利用 ChatGPT 为药物靶点提出新的途径。
然而,鉴于其尚处于起步阶段以及对信息伪造的担忧,在医疗环境中负责任地部署该工具需要利用现实世界中的临床数据对其功能实用性和可靠性进行全面验证。
作者假设 ChatGPT 可以作为人工智能驱动的筛选工具来生成 AD 药物再利用候选药物。为了评估这一假设,作者为 ChatGPT(模型 GPT-4)提供了两个连续的提示。首先,作者促使 ChatGPT 提供 20 种最有希望的 AD 药物再利用候选药物。接下来,作者提示 ChatGPT 确认其之前的输出并返回最终的药物列表(图1a)。为了解释 ChatGPT 响应的概率性质,作者重复此过程十次,总共产生了 59 种独特的候选药物。作者确认每个候选药物至少出现在一篇出版物中讨论其在 AD 中的潜在用途。然后,作者确定了十种最常出现的药物,用于随后的临床数据测试(最小频率N = 7,最大频率N = 10)。
图1:研究设计图示

a使用 ChatGPT 的迭代查询来推荐 20 种用于 AD 重新利用的药物。b使用来自两个大型临床数据库的电子健康记录 (EHR) 数据评估十种最常建议的药物的潜在疗效。
对于每个生成的候选药物,作者使用来自大型临床数据集的去识别化电子健康记录 (EHR) 数据组成了两个队列:(1) 范德比尔特大学医学中心 (VUMC),以及 (2) 美国国立卫生研究院 (NIH)所有美国研究计划(图1b)。作者采用 Cox 比例风险回归来比较先前接触过药物的个体和从未接触过该药物的个体之间发生 AD 的风险。作者用 65 岁作为时间零;既往药物暴露定义为用药年龄≤65岁。每个药物暴露队列根据倾向评分 (PS) 与未暴露组相匹配,使用性别、种族、65 岁后的 EHR 时长以及 65 岁时(即进入队列时)的药物特异性合并症作为协变量。根据主要临床指征选择药物特异性合并症。鉴于独立数据集中特定药物的队列规模可能不够大,作者还进行了荟萃分析,以得出每种药物风险比的统计稳健估计。
作者观察到,使用 VUMC 数据进行十年随访后,ChatGPT 前十项建议中的三项与显着降低 AD 风险相关:抗糖尿病药物二甲双胍(风险比 (HR) = 0.67,95% 置信区间 (CI)) : 0.54–0.82, p < 1.5 × 10 −4 )、抗高血压药氯沙坦 (HR = 0.73, 95% CI: 0.57–0.92, p = 0.009) 和抗生素米诺环素 (HR = 0.34, 95% CI: 0.13 –0.89,p = 0.028)(图2)。尽管作者对All of Us的研究受到较小样本量的限制,但二甲双胍显示了预期方向的治疗效果(即 HR < 1)。虽然p < 0.05时不具有统计学显着性 ,但降脂药物辛伐他汀和抗糖尿病药物吡格列酮在 VUMC 和All of Us数据中也表现出有益的治疗效果。
在荟萃分析中,作者证实了二甲双胍的保护作用(HR = 0.67,95% CI:0.55–0.81,p = 6.4 × 10 -5)。荟萃分析还揭示了辛伐他汀具有统计学上显着的保护性治疗效果(HR = 0.84,95% CI:0.73-0.98,p = 0.024),这一效果在 VUMC 或All of Us数据中均未单独发现。荟萃分析发现氯沙坦也具有显着的保护性治疗效果(HR = 0.76,95% CI:0.60–0.95,p = 0.017);然而,VUMC 和All of Us的效果估计在方向性上是相反的。AD 病例数不足 ( N < 5) 阻碍了 VUMC 和All of Us 中贝沙罗汀和尼洛替尼的评估。出于同样的原因,米诺环素、坎地沙坦、雷帕霉素和锂的作用无法在进行测试。
作者发现 ChatGPT 作为药物再利用工具的实用性在于它能够遵循与药物再利用相关的说明并快速合成相关文献中的信息。ChatGPT 没有提出任何 FDA 批准的治疗 AD 的药物,这表明它准确地解释了药物重新利用的前提。在这项研究中,ChatGPT 推荐频率最高的药物并不是 AD 的新用途候选药物,而是文献中经常与 AD 一起提及的药物。由于越来越多的证据表明胰岛素抵抗与 AD 发病机制有关,二甲双胍和吡格列酮等抗糖尿病药物作为 AD 的潜在治疗候选药物受到了相当多的关注。同样,据报道 AD 和心血管疾病之间的关联引发了对 AD 心血管药物重新利用的大量研究,包括他汀类药物和抗高血压药物,如氯沙坦和坎地沙坦。雷帕霉素、尼洛替尼、锂和贝沙罗汀也在 AD 药物再利用研究中得到了深入探索。
在结合两个大规模 EHR 数据的荟萃分析中,作者观察到 ChatGPT 最常建议的十种药物中的三种药物(二甲双胍、辛伐他汀和氯沙坦)对 AD 的保护作用。使用二甲双胍在作者的荟萃分析中产生了最强的信号,与 65 岁后 AD 风险降低 33% 相关。辛伐他汀和氯沙坦的效果较为温和。在荟萃分析中,辛伐他汀与 AD 风险降低 16% 相关,而氯沙坦与 AD 风险降低 24% 相关。尽管发现二甲双胍和辛伐他汀在 VUMC 和All of Us中具有一致的治疗效果 (HR < 1),但氯沙坦的治疗效果相互矛盾(使用 VUMC 数据,统计显着性 HR < 1,使用All of Us数据,非显着性 HR > 1 )。这表明荟萃分析中氯沙坦的保护性治疗效果可能是由 VUMC 较大的样本量驱动的。尽管之前的研究结果支持了这三种药物的发现,但这些药物影响 AD 病理生理学和病理学的机制仍然未知,并且基于人群的研究尚未提供结论性结果。需要在临床前和临床研究中进行进一步调查,以确定这些药物在降低 AD 风险方面的可行性。
图 2:接触 ChatGPT 建议的药物再利用候选药物与 AD 风险之间的关联

显示了 VUMC(蓝色方块)、NIH All of Us研究计划(红色方块)和组合荟萃分析(灰色方块)的风险比 (HR) 和 95% 置信区间 (CI)。** 表示使用 VUMC 数据可显着降低 AD 风险的药物 ( p < 0.05);* 表示荟萃分析中与显着降低 AD 风险相关的药物 ( p < 0.05)。为了确保足够的统计功效,作者没有报告研究队列中 AD 病例少于 5 例的药物(即 VUMC 和All of Us中的贝沙罗汀和尼洛替尼;All of Us 中的米诺环素、坎地沙坦、雷帕霉素和锂)。
作者的研究结果表明 ChatGPT 可以为药物再利用产生高质量的假设。ChatGPT 加快了广泛的文献综述的过程,而这对于人类单独执行来说已经变得不可行。自 2012 年以来,各种策略已导致对超过 573 种 AD 药物的重新利用建议。用于建议这些重新利用候选药物的数据类型存在差异,特别是在数据质量和与 AD 相关性方面,因此很难快速、准确地确定这一长长的药物清单中最有希望的候选药物,从而减缓了药物重新利用的进展。使用 ChatGPT,作者能够快速生成一份简短的药物清单,用于使用真实世界的临床数据进行测试,根据作者的荟萃分析,十分之三的药物显示出对 AD 的保护作用。这些发现表明,ChatGPT 有潜力在大的药物空间中有效地进行优先排序,在识别有希望的药物再利用假设方面表现出相对于传统方法的优势。ChatGPT 以最低的成本,具有显着加速审查过程的能力和可扩展性,使研究人员能够专注于测试和验证假设。此外,ChatGPT(提供对新互联网内容的访问)及其搜索引擎插件的预期定期更新允许持续更新且不间断的药物再利用研究。此外,将 ChatGPT 支持的假设与使用真实世界临床数据集的可靠验证相结合,提供了一个经济有效的管道,可以在分配额外资源进行广泛的研究和临床试验之前调查初步信号。这一验证过程充当了反驳无效假设的关键平衡力量,从而提高了结果的可信度,并减轻了对人工智能幻觉不利后果的担忧——这是对 ChatGPT 使用的主要批评。尽管有这些优势,任何包含 ChatGPT 的管道都必须考虑到被忽视但有前途的重新利用候选药物的可能性,当候选药物在文献中表现出较低的出现率或需要基于超越 ChatGPT 能力的间接证据的复杂推理能力时,就会发生这种情况。
作者的研究有几个值得注意的局限性。首先,作者依靠频率来优先考虑候选药物;然而,重新利用候选药物在 ChatGPT 查询中出现的次数可能与其治疗疾病的承诺没有直接关系。其次,电子病历可能包含缺失或不完整的数据,并且药物依从性的不连续性可能无法以完美的保真度报告,从而可能导致结果或暴露的错误分类。第三,尽管使用了两个大型电子病历,作者仍然没有足够的统计能力来对不太常见的药物(例如尼洛替尼)进行假设检验。第四,虽然作者的研究广泛评估了≤65岁的任何时间、任何剂量的药物暴露,但在表征药物暴露方面存在许多更深入的表型分析的机会。第五,作者试图使用 MEDI 控制每种药物的单一主要适应症;然而,作者无法确定几种药物(即尼罗替尼、贝沙罗汀、米诺环素和雷帕霉素)的明确主要适应症。此外,二甲双胍和辛伐他汀未实现完全平衡的协变量分布(65 岁后 EHR 长度和药物特异性合并症的标准化平均差 >0.1),表明可能存在一些残留的混杂因素(尽管可能偏向于零)。与所有基于 EHR 的观察性研究一样,作者的研究很容易受到无法测量的混杂因素的影响,这可能会使检测到的药物暴露与 AD 之间的关联产生偏差。虽然作者试图通过在 PS 匹配时考虑每种药物的主要临床适应症来控制适应症的混杂,但这并不是所有可能的药物适应症和药物相关合并症的详尽列表。作者也无法控制 EHR 中未一致报告的可能影响 AD 风险的协变量,例如健康的社会决定因素。第六,这项研究无法像临床试验中那样确定因果效应或机制。此外,尽管 ChatGPT 对一般查询表现出卓越的响应质量,但仍需要进一步研究来对一系列 GAI 模型及其微调变体进行基准测试,以在支持生物医学任务(特别是药物再利用)方面实现最大的有效性和可靠性。最后,法学硕士生成的药物再利用响应的质量可能会随着时间的推移而变化29,受到模型训练中数据、学习技术和评估指标的持续更新的影响。持续监测法学硕士的表现,并结合使用更大规模的数据集进行验证,对于确保这种药物再利用方法的持续有效性至关重要。
尽管如此,这项概念验证研究还是展示了使用 ChatGPT 作为人工智能驱动的药物再利用假设生成器的可行性,以 AD 作为案例研究,能够迅速生成一份有希望的药物清单,用于随后在 EHR 中进行测试。作者的研究结果表明,ChatGPT 能够通过全面综合文献来编码有关现有药物新的潜在治疗用途的有价值的见解,并随后在响应查询时解码这些知识。利用 ChatGPT 功能的管道为药物再利用提供了一个简化的新框架,可应用于多种疾病。
参考资料:Yan, C., Grabowska, M.E., Dickson, A.L. et al. Leveraging generative AI to prioritize drug repurposing candidates for Alzheimer’s disease with real-world clinical validation. npj Digit. Med. 7, 46 (2024). https://doi.org/10.1038/s41746-024-01038-3
本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。
本文为原创内容,未经授权禁止转载,授权后转载亦需注明出处。有问题可发邮件至sixiali@stonewise.cn