AI知识库 AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AlphaFold 3 发布:今天起,AI 已能预测生命分子的组成
浏览次数: 1576

发了啥

在一个小时前,Google 的 DeepMind AlphaFold 团队,发布了 AlphaFold 3。就此,AI 已能预测生命分子的组成。


我们知道,在每一个植物、动物和人类的细胞内部,存在着无数的微型“工厂”,这些工厂由蛋白质、DNA 和其他分子构成。这些分子不是单独工作的,它们通过复杂的相互作用才能驱动生命的各种生理过程。


AlphaFold 3 让我们首次能够精确预测包括蛋白质(proteins)、核酸(nucleic acids)、小分子(small molecules)、离子(ions)和修饰残基(modified residues)在内的复杂生物分子的结构。


为了发挥 AlphaFold 3 在药物设计方面的潜力,Isomorphic 实验室已经开始与制药公司合作,应用这一技术解决现实世界中的药物设计挑战,旨在为患者开发出改变生活的新疗法。


相关的论文发表在《Nature》杂志,可以在这里访问:https://www.nature.com/articles/s41586-024-07487-w


论文PDF:https://www.nature.com/articles/s41586-024-07487-w_reference.pdf



还有啥

除论文外,DeepMind 还发了一堆别的,查看这里:https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/


我也尝试把博文改写的更易读些,如下:

01
揭秘生命分子的面纱

在我们的细胞内部,有无数分子像小机器一样运作,这些包括蛋白质、DNA 和 RNA 等大分子,还有很多作为药物基础的小分子,被称为配体。AlphaFold 3 就是通过输入这些分子的信息,来预测它们在三维空间中如何组合和相互作用的。


这个模型的强大之处,在于它采用了一种全新的架构和训练方法,覆盖了所有类型的生命分子。其核心是一个升级版的 Evoformer 模块,这是一种深度学习架构,为 AlphaFold 2 提供了强大的支持。在处理了输入数据后,AlphaFold 3 会用所谓的 Diffusion网络来整合预测结果。这个过程开始于一个由原子云组成的模型,然后经过多个步骤,逐步精细化,最终形成一个精确的分子结构。


AlphaFold 3 的预测能力远超现有的任何系统。它能以一种全局的方式,计算整个分子复合体,从而统一整合科学研究中的洞见。


以一个具体的例子来说,编号为 7R6R 的 DNA 结合蛋白,AlphaFold 3 预测出的分子复合物,几乎完美地与实验中发现的真实结构吻合。这个预测展示了一个蛋白质(用蓝色标示)与 DNA 双螺旋(用粉色标示)的精确结合方式。 通过这种方式,AlphaFold 3 不仅推动了科学界对生命基本构造的理解,也为疾病治疗和新药开发提供了可能。

02
Isomorphic 实验室引领药物发现

Isomorphic实验室正在用 AlphaFold 3 重塑药物设计领域。这个高级模型专门预测那些药物中常用的分子,如配体和抗体,这些分子通过与蛋白质结合,影响人体健康和疾病中的生物活动。 


在 PoseBusters 的基准测试中,AlphaFold 3 的预测准确性超过了传统最佳方法50%,成为首个超越传统物理模型的 AI 系统。它能够精确模拟配体与蛋白质以及抗体与目标蛋白的结合,这对于理解人体免疫反应的关键方面和开发新型抗体治疗尤为重要。 


Isomorphic实验室将 AlphaFold 3 与其他内部 AI 模型结合使用,支持公司内部药物开发项目,并与制药合作伙伴一起推进药物研发。这种创新方法不仅加速了药物设计进程,还提高了其成功率。Isomorphic 实验室正探索针对新的疾病靶点的策略,并开发之前难以达到的现有靶点的新方法。

03
免费科研工具

Google DeepMind 最近推出的 AlphaFold 服务器已经成为全球最准确的工具,专门用于预测蛋白质如何在细胞中与其他分子相互作用。这个平台完全免费,供全球科学家进行非商业性研究使用。


生物学家只需简单几步,就能利用 AlphaFold 3 对蛋白质、DNA、RNA 及多种配体、离子和化学修饰的复杂结构进行建模。例如,对于编号为 8AW3 的 RNA 修饰蛋白质,AlphaFold 3 预测出的分子复合物,包括蓝色的蛋白质、紫色的 RNA 链和黄色的两个离子,这与实验得到的灰色真实结构极为相似。这种复合物在细胞内生成其他蛋白质的过程中起着关键作用,这一过程对生命和健康至关重要。 


AlphaFold 服务器不仅加快了科学家们在实验室测试新假设的流程,还推动了科学创新的进一步发展。这个平台为研究人员提供了一种无论其计算资源和机器学习知识如何都能轻松生成预测的方式。 


此外,传统的蛋白质结构预测不仅耗时长、成本高,相当于一个博士学位的工作量并且需要花费数十万美元。之前的模型 AlphaFold 2 已被用来预测数亿个结构,如果按照当前实验性结构生物学的进度,将需要数亿研究人员年的时间。

04
 负责地推广

随着 AlphaFold 系列技术的不断推出,Google DeepMind 一直与研究及安全社区紧密合作,深入探讨这项技术的广泛影响。通过以科学为导向的方法,DeepMind 进行了广泛的风险评估,并致力于共享其对生物学和人类福祉的积极贡献。 


特别地,在 AlphaFold 2 之后,DeepMind 增加了与超过 50 名来自生物安全、研究和工业领域的领域专家的合作,共同评估 AlphaFold 模型连续进化的能力及其潜在风险。在 AlphaFold 3 发布前,还参与了广泛的社区论坛和讨论,确保其科技成果能够安全、有效地服务于科研。 


AlphaFold 服务器的推出体现了 DeepMind 对开放科学的承诺。服务器不仅提供了包含 2 亿个蛋白质结构的免费数据库,还与 EMBL-EBI 等机构合作扩展了在线教育课程,特别是在全球南方,帮助当地科学家加速采纳和研究,尤其关注那些资金不足的领域,如被忽视的疾病和食品安全问题。DeepMind 持续与全球科学界和政策制定者合作,负责任地推动 AI 技术的发展和应用。 


通过 AlphaFold 3,科学家们可以更清晰地观察到生物世界的复杂性,如细胞系统中的结构、相互作用和化学修饰。这一技术不仅揭示了生命分子如何相互连接,还阐明了这些连接如何影响生物功能——包括药物作用机理、激素产生和 DNA 修复过程。例如,编号为 7BBV 的酶预测模型,揭示了该酶如何与植物细胞互动,这对开发更健康、更具抗逆性的作物具有重要意义。


推荐新闻
RAG系列04:使用ReRank进行重排序
本文介绍了重排序的原理和两种主流的重排序方法:基于重排模型和基于 LLM。文章指出,重排序是对检索到的上下文进行再次筛选的过程,类似于排序过程中的粗排和精排。在检索增强生成中,精排的术语就叫重排序。文章还介绍了使用 Cohere 提供的在线模型、bge-reranker-base 和 bge-reranker-large 等开源模型以及 LLM 实现重排序的方法。最后,文章得出结论:使用重排模型的方法轻量级、开销较小;而使用 LLM 的方法在多个基准测试上表现良好,但成本较高,且只有在使用 ChatGPT 和 GPT-4 时表现良好,如使用其他开源模型,如 FLAN-T5 和 Vicuna-13B 时,其性能就不那么理想。因此,在实际项目中,需要做出特定的权衡。
LangGPT论文:面向大语言模型的自然语言编程框架(中文版)
大语言模型 (Large Language Models, LLMs) 在不同领域都表现出了优异的性能。然而,对于非AI专家来说,制定高质量的提示来引导 LLMs 是目前AI应用领域的一项重要挑战。
第三篇:要真正入门AI,OpenAI的官方Prompt工程指南肯定还不够,您必须了解的强大方法论和框架!!!
自从ChatGPT(全名:Chat Generative Pre-trained Transformer)于2022年11月30日发布以来,一个新兴的行业突然兴起,那就是提示工程(Prompt engineering),可谓如日冲天。从简单的文章扩写,到RAG,ChatGPT展现了前所未有的惊人能力。
(三)12个RAG痛点及其解决方案
痛点9:结构化数据QA 痛点10:从复杂 PDF 中提取数据 痛点11:后备模型 痛点12:LLM安全
(二)12个RAG痛点及其解决方案
痛点5:格式错误 痛点6:不正确的特异性 痛点7:不完整 痛点8:数据摄取可扩展性

联系我们

售前咨询
186 6662 7370
产品演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询