微信扫码
添加专属顾问
我要投稿
DeepSeek-Prover-V2-671B 悄然上线,或为 R2 铺路?这款新模型的神秘面纱即将揭开。 核心内容: 1. DeepSeek-Prover-V2-671B 的神秘上线与参数规模 2. V1.5 的历史与创新亮点回顾 3. V2 上线对 DeepSeek R2 的潜在影响与未来展望
五一没等来 DeepSeek R2,DeepSeek 却悄悄放出了一个超级炸裂的新模型:DeepSeek-Prover-V2-671B!这究竟是什么?对 DeepSeek 的未来又意味着什么?
时间回到 2024 年 8 月,DeepSeek 发布了论文 ? DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search[1]
同时还开源了对应的基座模型:DeepSeek-Prover-V1.5-Base[2]。
V1.5 主要亮点:
一句话总结:不仅懂语言,还会“思考”怎么去证明!
虽然官方暂未公布论文或细节,但从模型命名「V2」以及参数规模「671B」来看,这或许是 DeepSeek 正在为 R2 做能力验证或预热。
回顾 V1.5 的定位,它更多是面向形式化定理证明这个细分领域。而 V2 的上线,很可能意味着:
DeepSeek-Prover-V2-671B 目前已在 HuggingFace 上架,但尚未大张旗鼓地宣传。 这款“隐秘发布”的模型,也许正是 DeepSeek R2 前夜的“预告片”。
HuggingFace 地址:https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B
,速度围观!
R2 没来,但 Prover-V2 先行。下一步,值得期待的,不只是更强的模型,而是语言智能在“思维”与“证明”之间的那条路。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
DeepSeek Prover-V2,这才是探索AGI 的正确姿势!
2025-04-30
“Qwen3之后,我才真正敢投AI应用”
2025-04-30
真·开源MCP平台来了!ACI.dev能一站直连600+工具,让你的智能体秒变全能王!
2025-04-30
n8n:免费+开源的自动化神器,比dify更简单,比Make更强大!
2025-04-30
宝藏发现:Sim Studio,一款让AI工作流搭建变简单的开源利器
2025-04-29
我们有必要使用 Qwen3 吗?
2025-04-29
Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!
2025-04-29
阿里 Qwen3 技术详解: 4B 参数媲美 72B,MoE 架构的开源突破
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-08-13
2024-12-26
2025-04-30
2025-04-29
2025-04-28
2025-04-28
2025-04-28
2025-04-21
2025-04-19
2025-04-17