微信扫码
添加专属顾问
我要投稿
蚂蚁·安诊儿医疗大模型开源登顶,树立AI医疗新标杆,展现专业性与安全性双优表现。 核心内容: 1. 蚂蚁·安诊儿医疗大模型的技术架构与训练流程 2. 在国内外权威医疗评测中的领先表现 3. 为AI医疗应用树立高效、专业、安全的新标准
近日,蚂蚁集团联合浙江省卫生健康委正式开源其自研的蚂蚁·安诊儿医疗大模型(AntAngelMed)。该模型基于蚂蚁百灵大模型的高效混合专家(MoE)架构,结合真实、全面的医疗数据深度训练而成,是迄今为止参数规模最大的开源医疗模型(100B 总参数)。
用户价值:领先的医学能力
AntAngelMed 已在 OpenAI 发起的 HealthBench 和国家人工智能应用中试基地(医疗)的 MedAIBench 等评测基准中表现出色,树立了开源 AI 医疗模型 “高效、专业、安全” 的新标杆。
在由 OpenAI 主导、全球 262 名医生参与构建的 HealthBench 评测中,AntAngelMed 在 HealthBench 上的评分达到开源模型第一,超过DeepSeek-R1、Qwen3、OpenAI GPT-OSS 等模型,并且在极具挑战性的 HealthBench-Hard 子集上展现出尤为显著的优势,充分证明了其在真实、复杂医疗环境中的可靠性与专业性。
在由国家人工智能应用中试基地(医疗)·浙江联合中国医学科学院北京协和医学院、中国信息通信研究院三方共建的权威测评体系 MedAIBench 中,AntAngelMed 同样展现出强大的综合专业性与安全性,在医疗知识问答、医疗伦理安全等多个核心维度表现突出。这种 “通用智能+医疗专长” 的全栈能力闭环,标志着开源 AI 医疗模型进入了“高效、专业、安全”三者兼顾的新阶段,为 AI 技术在医疗领域的应用树立了新的标杆。
对于面向中文医疗场景医疗大模型评测体系 MedBench(36 个自主评测集,覆盖约 70 万条样本),AntAngelMed 位列自测榜单第一,在医学知识问答、医学语言理解、医学语言生成、复杂医学推理、医疗安全与伦理五大核心维度也都表现出领先水平,体现出 AntAngelMed 医疗大模型的专业性、安全性与临床适用性。
技术解析:三阶段专业训练
AntAngelMed 卓越的医疗能力源于其专业、精细的三阶段训练流程。
首先,通过持续预训练对通用基座模型 Ling-flash-2.0-base 注入大规模、高质量的医学语料,构建了深厚的医疗知识底蕴;
随后,在监督微调阶段,通过多源异构的高质量指令数据,一方面强化了模型的通用核心思维链,另一方面针对医患问答、诊断推理等真实医疗场景进行深度适配;
最后,AntAngelMed 采用先进的 GRPO 强化学习算法,并通过双阶段强化学习路径对模型能力进一步优化提升:首先以“推理强化学习”锻造其逻辑推理的核心能力,再以“通用强化学习”打磨其同理心与安全边界意识,最终实现了医疗专业性与人文关怀的高度统一。
(专业三阶段训练流程)
高效架构、高速推理
作为蚂蚁在医疗 AI 领域的关键突破,AntAngelMed 大模型在模型架构设计、训练效率与推理性能上实现了技术引领。AntAngelMed 继承了百灵大模型 Ling-flash-2.0 的高效混合专家(MoE)架构,并在一系列核心设计上进行了全面优化,包括 1/32 激活比例、无辅助损失 + Sigmoid 路由策略、MTP 层及 Partial-RoPE 等。这些精细的改进使得模型相比同等规模的 Dense 架构实现了 7 倍的效率提升。换言之,AntAngelMed 仅需 6.1B 激活参数,即可媲美约 40B 稠密模型的性能,并在 H20 硬件上实现超过 200 tokens/s 的推理速度,展现了极致的性能与效率。
(Ling-flash-2.0 模型架构)
我们还专为 AntAngelMed 进行推理加速,采用 FP8 量化 + EAGLE3 优化,在 32 并发场景下,推理吞吐量较 FP8 显著提升:在 HumanEval 提升 71%,GSM8K 提升 45%,Math-500 提升高达 94%,实现了推理性能与模型稳定性的深度平衡。
使用体验:推理效果展示
蚂蚁·安诊儿医疗大模型不管是在您身体抱恙需要诊断的场景,还是在平时生活中的健康管理场景,都可以使用,为您的健康保驾护航,相关能力可通过模型调用在下游应用中快速上线。
症状/疾病诊治类
提问:为什么肝硬化切除部分肝脏的手术要做肝癌的检查,肝硬化肝腹水等于肝癌吗?做肝癌检查的目的是什么?
思考过程:
上下滑动查看更多
回答:
上下滑动查看更多
泛健康与生活方式类
提问:早起就喝水能缓解便秘吗?
思考过程:
上下滑动查看更多
回答:
上下滑动查看更多
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-09
英伟达开源上瘾了!推出了一款实时语音智能体的终极 ASR:24ms 极速锁定。
2026-01-08
手机上同步用 Claude Code 和 Codex,666啊~
2026-01-07
谷歌FunctionGemma:轻量化函数调用AI模型的创新与实践
2026-01-07
智元在CES发布业内首个大语言模型驱动的开源仿真平台 Genie Sim 3.0
2026-01-07
从开源框架到深度研究,构建全栈量化知识体系
2026-01-07
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能
2026-01-06
Claude Code最强开源对手!GitHub 50.2k Star了,作者为它烧掉2.4w美元。
2026-01-06
英伟达发布并开源Alpamayo:自动驾驶终于开始讲道理了|甲子光年
2025-11-19
2025-10-20
2025-10-27
2025-10-27
2025-12-10
2025-11-17
2025-10-29
2025-11-07
2025-12-22
2025-10-21
2026-01-02
2025-12-24
2025-12-22
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28