微信扫码
添加专属顾问
我要投稿
普林斯顿大学最新研究证明,医生与AI大模型的协同诊断准确率远超单独使用,开创医疗决策新范式。 核心内容: 1. 混合集体智能方法显著提升诊断准确率 2. AI与医生错误类型的互补性分析 3. 加权融合算法与临床验证结果
在高风险的医疗诊断领域,单纯依赖大型语言模型(LLMs)或人类医生都存在局限——LLMs 会幻觉、缺乏常识且有偏见;人类则受经验局限与知识覆盖面的限制。本研究提出一种混合集体智能(Hybrid Collective Intelligence, HCI)方法,将医生的临床推理与 LLM 的信息处理能力结合,对 2,133 个真实感病例(含 40,762 份医生诊断与 5 个最先进 LLM 的诊断输出)进行加权融合。结果显示,混合集体在所有专业与经验层级下的诊断准确率均显著优于人类单独、AI 单独及各自的集体形式。
每年美国约 79.5 万例死亡或永久伤残与诊断错误相关。尽管 LLM 在自然语言处理与多领域问答中表现出色,包括医学在内的众多场景,但它们的结构性缺陷(如幻觉、偏见、缺乏常识让其在临床高风险应用中存在安全隐患。
研究表明,“集体智能”能通过不同专家独立判断的组合提升整体准确性。本研究创新地将人类专家与多个 LLM 视为“同台评审”,利用各自优势与互补性,构建混合集体智能体系。
将多个 LLM 输出组合成 AI 集体,在 Top-5 与 Top-3 准确率上均优于任何单一 LLM,并在多个专科中保持稳定领先。
结论
混合集体智能不是要取代医生,而是利用人类的临床洞察与 AI 的信息整合能力互补,让医疗诊断更精准、更安全、更公平。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-02
告别相机!OpenAI用Sora2重新发明了短视频!
2025-10-02
Doubao-Seed-1.6-Vision首发评测:硬核实测18个案例,看懂原生VisualCoT有多强!
2025-10-02
实测 Sora 2 :AI视频的“ChatGPT时刻”来了?八大场景教你解锁各种玩法(附邀请码)
2025-10-02
Sora 2带来3个颠覆性创新,这个行业或将被彻底重构
2025-10-02
Sora2 也许有 3 个月热度,但对电影工业的影响将是永恒
2025-10-01
Sora 2 发布:第一时间详解
2025-10-01
AI三巨头节前扎堆“交作业”:DeepSeek像蜜雪冰城,Claude像喜茶
2025-09-30
智谱旗舰模型GLM-4.6上线,代码能力全面进阶
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-07-29
2025-09-08
2025-09-17
2025-08-19
2025-08-20
2025-09-14
2025-09-30
2025-09-29
2025-09-28
2025-09-27
2025-09-27
2025-09-25
2025-09-23
2025-09-22