微信扫码
添加专属顾问
我要投稿
AI如何助力药物研发,突破人类认知边界?本文深入解析AI在药物开发全流程的创新应用。 核心内容: 1. AI在药物研发中的底层范式变革作用 2. AI如何通过人机协同提升靶点识别和分子优化效率 3. De Novo药物设计:AI从头开始创造全新药物分子结构的潜力与挑战
关于AI制药,常听到的一个观点是,AI药物研发(AIDD)公司的管线根本就不是AI做出来的,或者很难评估AI究竟起到多大作用,主要还是靠人。
这么讲也是事实,AIDD领域确实存在AI贡献难以量化的问题。药物研发是一个高度复杂、系统性极强的流程,AI目前主要在特定环节发挥作用,而最终成果仍需依赖人工验证和决策。许多AIDD公司的管线确实依赖“人机协同”,并非由AI主导。
但这个观点低估了AI在底层范式变革中的作用。AI通过人机协同构建了一种新型的生物医学研究范式,例如通过分析海量数据发现人类难以察觉的靶点关联性,或设计传统化学方法难以构想的分子结构。AI的价值不仅在于“替代人力”,更在于突破人类认知和实验能力的边界。
药物研发的流程如此复杂,期待AI完成所有的事情恐怕过于超前了。药物研发涉及生物学复杂性、临床风险控制和伦理监管,其容错率极低,所以人机互动是必然的过渡阶段,而现在正处于人机交互的初期,AI正在快速学习人类专家的经验和思维方式。此后AI是否在某个时刻超越人类,出现类似于大语言模型的“智能涌现”,非常令人期待。
AI的应用覆盖了从靶点识别到上市后监测的各个环节。在新事物面前,各位肯定不希望经历看不见、看不起、看不懂,最后跟不上的尴尬。尽管拿出来的成果还没有让人感觉到惊艳,但我们需要保持一个开放的心态,去了解它,为我所用。
AI 在药物开发全流程中的应用
1、靶点识别是药物研发的起点
在药物发现过程中,找到疾病相关的靶点至关重要。AI能对基因、蛋白质等大量生物数据进行深度分析,构建出复杂的生物网络关系图。借助自然语言处理(NLP)技术如 word2vec 嵌入,将基因功能映射到高维空间,让靶点识别的准确率大大提升。
AI 还能把这些生物数据和医学文献整合成一个超级数据库(知识图谱),从中找出疾病发生的关键分子规律和因果关系,帮我们挖掘出潜在的药物靶点。如英矽智能的PandaOmics 平台,通过语义推理引擎分析20万篇文献与50个组学数据库,发现TGF-β通路中的TRAINK蛋白作为特发性肺纤维化新靶点。
2、虚拟筛选与分子优化
虚拟筛选是快速发现潜在药物的重要手段,尤其在面对庞大化合物库时,AI不仅能加速筛选进程,还能通过预测分子间的相互作用,提高筛选效率和准确性。当不清楚靶点的具体结构时,AI 可以通过分析靶点的序列信息来进行预测。而对于那些发病机制不明确的疾病,AI 还能通过观察细胞的表型变化(比如细胞核形态),筛选出能诱导癌细胞衰老的化合物,为药物发现提供新思路。
但虚拟筛选模型通常只专注于特定任务,如评分、构象优化或筛选,因此行业需要开发出能够处理多任务的通用模型。
3、De Novo设计,创造全新药物分子
De Novo药物设计就是让 AI 从头开始设计全新的药物分子结构。传统设计方法多依赖专家经验和手动操作,而 AI,尤其是深度学习技术,打破了这一局限,实现了对特定要求的新型分子结构的自动识别。这一技术已在小分子抑制剂、PROTACs、肽和功能性蛋白的开发中大显身手,并经湿实验验证,开启了药物发现的高效创新时代。
在深度学习驱动的 De Novo 设计中,分子生成是核心环节,主要借助化学语言模型或基于图的模型来实现。化学语言模型将分子生成转化为序列生成任务,如 SMILES 字符串。
例如Exscientia利用生成式AI设计用于治疗强迫症的DSP-1181,是全球首个完全由AI设计的药物分子,仅合成350个分子即进入临床,用时12个月,而传统则需要至少4-5年。但遗憾的是,2022年披露的I期临床数据显示疗效未达预期。此外,C4 Therapeutics研发的靶向IKZF1/3的PROTAC药物(CFT7455),通过AI优化linker长度,将生物利用度从30%提升至60%。
4、ADMET预测,评估药物安全性和有效性
ADMET 指的是药物在体内的吸收、分布、代谢、排泄和毒性,这是决定药物能否成功上市的关键因素。虽然湿实验不可或缺,但AI可以通过分子指纹或描述符等预定义特征来预测ADMET 特性,有效降低风险。
例如拜耳公司开发的计算 ADMET 平台,就运用了“随机森林”和“支持向量机”等机器学习技术,利用扩展连接性指纹等描述符,来确保预测的准确性和相关性。然而,这些基于特征的方法仍然较为复杂,限制了通用性和灵活性。
近期研究指出,尽管 SMILES 语言并未直接编码分子拓扑结构,但自监督训练结合具备线性注意力机制的Transformer,可以有效学习隐含的结构特性关系,从而增强大规模自监督模型在ADMET 预测中的应用潜力。
5、合成规划与自动化合成
化学合成是小分子药物发现中的关键瓶颈,计算机辅助合成规划(CASP)与有机化合物自动化合成技术,通过逆合成分析协助化学家确定反应路线,将目标分子递归转化为更简单的前体,大大减轻了化学家的重复性劳动负担。近期,transformer模型也被应用于逆合成分析、反应位点选择性和异构体选择性预测,以及反应指纹提取。
自动化合成与设计、测试和分析技术相结合,形成了药物发现的自动化核心流程:设计-合成-测试-分析(DMTA)循环。借助深度学习,DMTA循环的效率显著提升,加速苗头和先导化合物的发现。
然而,大多数当前的逆向合成深度学习方法难以解释,也就是常说的“黑匣子”。为应对这一挑战,山东大学魏乐义团队推出了一个叫做RetroExplainer的逆合成预测模型。这个模型最大特点是可解释性强,同时解决了单步预测局限性等问题,并支持多步合成路径规划。
AI在临床试验与实际应用中的作用
AI可以用于临床试验的多个环节,通过对患者数据,如基因信息、临床病史和生活方式因素等进行分析,为试验提供指导,有助于识别影响药物反应的生物标志物和患者特征,从优化试验设计。AI 通过优化患者选择、治疗方案和结果测量等参数,有望提高试验成功率,加快候选药物向临床实践的转化进程。
1、发现生物标志物
生物标志物是衡量和评估身体正常及病理过程,以及对治疗反应的指标。在药物研发中,识别预测性生物标志物对选择患者、提高临床成功率至关重要。
AI在识别诊断标志物方面表现出色,为临床病理学提供诊断参考。如“Nuclei.io” 数字病理,将主动学习与实时人机交互结合,为外科病理学任务提供精准反馈,提升诊断准确性和效率。
在识别预后生物标志物方面,AI同样也有不俗的表现。深度学习模型可理解血液样本中 CD8+ T 细胞形态,作为败血症预后指标;区分标记细胞衰老的核特征;识别蛋白质组学标志物精准预测肝病结果。AI 还能预测多种癌症的预后生物标志物,为生存、复发和转移提供精确风险评分。
2、预测药代动力学特性
AI 和大数据工具在处理药代动力学问题上表现出色,尤其擅长应对高维数据及风险函数中的非线性关系。AI 通过优化量效关系、改善药物安全特性以及精细化治疗窗口,解决了精准医疗中药代动力学的核心难题。
多组学变分自编码器(MOVE)框架整合多组学数据,揭示了如二甲双胍与肠道微生物群相互作用等药物相互作用,并能比较不同组学模态下的药物反应。PharmBERT 这一专业语言模型则通过从处方标签中提取关键药代动力学信息,增强了药物安全性评估,助力发现不良反应和药物相互作用。此外,AI 还能通过分析遗传和生理数据来优化药物剂量,并基于患者的遗传信息、生理特征及过往治疗反应,为医生提供个性化剂量调整建议,进一步改善治疗效果。
3、老药新用
除了助力新药发现外,AI 还通过大规模生物医学数据集,对已获批药物进行再利用AI利用真实世界数据,包括电子健康记录和保险索赔数据,AI可以模拟临床试验,发现老药新用机会。一个典型的案例是,AI 极大加速了COVID-19药物再利用进程。
MitoReID 模型通过线粒体表型分析识别药物作用机制,成本低、通量高。通过分析 57 万张细胞图像,模型识别 FDA 批准药物作用机制的准确率达 76.32%,还验证了儿茶素对环氧化酶-2 的抑制作用。
4、提高试验效率与预测结果
AI能优化试验设计、简化招募流程、预测患者反应,从而提高试验效率和成功率。AI还能预测 I 期 /II 期临床试验结果,提高准确率并发现潜在风险。
在真实世界研究中,通过分析电子健康记录、保险索赔和可穿戴设备数据,AI可以评估药物有效性和安全性。例如在一项真实世界数据研究中,从晚期肺癌患者的电子健康记录中模拟试验发现,放宽特定标准,不仅能大幅增加符合试验条件的患者数量,还可以有效延长患者生存期。
此外,Unlearn.ai 公司创建参与者虚拟副本,充当对照组,提高试验效率。这项技术基于基因表达和临床数据建模,结合深度学习和生成对抗网络,提供定量见解、健康指导和优化治疗策略。
AIDD的未来发展方向
AI正通过解析多组学生物医学数据、识别新型生物标志物与治疗靶点,加速药物研发进程。其在先导化合物发现、药物重定位及毒性预测等环节展现显著优势,大幅降低时间成本与安全风险。然而,AI驱动的药物研发仍面临数据瓶颈与方法学挑战,需重点突破以下方向。
首要任务是破解数据稀缺难题。一个有效途径是,开发支持小样本学习的稀疏算法、构建多模态预训练模型(融合文本与化学信息)。整合基因组学、蛋白互作网络与临床数据,可挖掘现有药物治疗罕见病的潜力。当前单一数据类型的分析方法难以捕捉生物系统的复杂关联,亟需发展多模态融合技术,结合GPU算力处理文本、图像等多源异构数据。
突破纯数据驱动的局限是另一关键。生命系统遵循物理基本定律,将物理法则融入AI模型可增强预测可靠性,降低对海量数据的依赖。同时,开发兼具精准性与可解释性的AI系统对构建多方信任至关重要,这类模型能优化研发资源配置,确保合规性并加速审批流程。
未来数十年,AI将在医学仿真领域引发变革。构建高精度虚拟人体模型以解析疾病机制与个体差异,优化临床试验设计并实现个性化医疗决策。AI赋能的虚拟现实技术还将重塑医学教育,通过沉浸式训练提升医疗服务水平。这些突破将推动药物研发从“试错模式”转向“计算驱动”。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-27
知识体系管理|1个方法教你从搜集到循环运用整套方法流程
2025-05-27
Z Product|前麦肯锡员工创办AI尽职调查公司,专注原始数据收集,赋能企业24小时完成尽调,获数千万美元融资
2025-05-27
开源协作新神器Docmost:团队知识管理的高效低成本解决方案!
2025-05-27
AI问答系统的挑战之语义鸿沟与知识盲点,让大模型理解行业黑话
2025-05-26
大模型落地的 “确定性答案”,藏在知识库里?
2025-05-26
飞书知识问答 | 企业级知识管理进入AI时代
2025-05-26
企业知识管理体系与应用
2025-05-26
深度解析:企业必看的AI能力金字塔,90%的人还停留在第1层!
2024-09-14
2025-01-23
2024-11-07
2024-07-10
2025-02-17
2024-04-24
2024-08-04
2024-06-23
2025-03-09
2024-05-15
2025-05-26
2025-05-14
2025-05-07
2025-05-07
2025-04-27
2025-04-20
2025-04-17
2025-04-17