我要投稿

DeepSeek V3.1 Base / Instruct 发布

发布日期：2025-08-20 19:30:24 浏览次数： 12906

作者：Renee 创业随笔

微信搜一搜，关注“Renee 创业随笔”

昨晚 DeepSeek V3.1 Base / Instruct 在 Hugging Face 上低调发布，但引起了巨大的社区反响。

🔑 更新亮点

双版本发布：V3.1 Base（MIT开源许可）与 Instruct。
架构基本未改：与 V3 架构/配置差别不大，此次主要是 后训练优化，并可能在尝试 Anthropic 风格的 “no-think / think” 混合模式。
MIT 开源许可：罕见的大体量基础模型采用宽松许可证，极具战略意义。

📊 参数规模

Hugging Face 卡片显示 参数规模 >685B，是目前最大的开源模型之一，远超主流 LLaMA / Mistral 系列。
社区普遍认为这是对 GPT-5 等闭源模型的“对标性开源举措”。

🧪 早期评测

SVGBench：V3.1 Base（无思考模式）在代码评测中 超过 V3.1 Thinking 与 R1-0528。
Aider Polyglot Benchmark：据称在多语言代码基准上 击败 Claude 4 Opus。
整体趋势：表现强于 V3，尤其是在 编码与指令遵循 方面。

💡 开发者社区观察

行为特征：输出比 V3 更冗长、解释性更强，说明其 指令对齐度和创造性 提升明显。
混合架构推测：有人注意到 UI 里“think 按钮”消失，猜测已融合“思考模式”与普通模式。
应用场景：128k 上下文已确认上线，适合长文档、代码库分析。

🌍 影响与意义

开源格局升级：MIT 许可 + 超大参数量 → 吸引学术与商业社区，可能成为 未来 R2 系列的基座。
对标闭源巨头：性能据称已在部分编码任务超越 Claude 4 Opus，成为少数能与 GPT-5 级模型竞争的开源产品。
研究价值：Base 模型放出，便于复用、二次训练和基准对比，有助于探索 后 Transformer 时代架构。

x上的一些网友评测

@scaling01

DeepSeek V3.1 在 Aider Polyglot 基准上击败了 Claude 4 Opus，成为目前表现最强的非-TTC 编码模型，而其成本仅约 1 美元。

@swyx

看起来 @deepseek_ai 依旧稳步推进，DeepSeek V4 很可能已经在路上了！

我这边整理了一下目前关于 V3.1 Base 的要点（毕竟现在没有一个地方能一次性看到所有信息）：

架构和 V3 基本一致，但进行了 持续后训练，逐步演变为 混合模型，同时引入了 搜索与思考（search + think）能力。
在 Aider Polyglot 基准上 击败 Claude 4 Opus。
极高的性价比，成本远低于同类闭源大模型。

可以预见，今年 11-12 月的模型大战会非常精彩。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-19

腾讯云开源DeepSeek量化部署方案：性能最高提升3.9X！

2025-11-19

全新AI编程工具 Google Antigravity 实测，特别适合产品经理

2025-11-19

20M小模型的数学公式OCR，复杂公式截图秒转LaTeX代码！

2025-11-18

高瓴、红杉一起投了一家出海销售Agent

2025-11-18

第一次用 Ollama 跑视觉模型：Qwen2.5-VL 7B 给了我一个意外惊喜

2025-11-18

MiroMind 最新模型发布！深度交互Scaling！模拟人类处理复杂问题的智能体基座模型 MiroThinker v1.0

2025-11-17

4.5K Star！文档管理AI神器Paperless-AI：自动分类打标签，语义搜索秒找文件！

2025-11-17

Memori：让 AI 拥有 "持久记忆" 的开源RAG引擎

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

重磅开源！通义万相最新模型来了

2025-08-26

开源发布！适合中国宝宝的 LangGraph 智能体开发模板！

2025-09-06

DeepSeek又开源，这次是OCR模型！附论文解读！

2025-10-20

Claude不让用，有哪些国产模型能迎头赶上？

2025-09-08

发现一个超神的Github开源OCR项目，国产多模态杀疯了

2025-10-27

MiniMax悄悄发布M2，8%价格打出Claude级性能

2025-10-27

如愿以偿！Qwen3-VL再开源30B-A3B，附实测！

2025-10-03

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

1.9K Star 微软开源TTS王炸！90分钟超长语音合成，4人对话自然切换！

2025-08-28

大家都在问

我们为什么选择 Spring AI 开发智能体，而不是 Dify？

2025-11-12

开源安全审核模型终极PK：Qwen3Guard、OpenAI-SafeGuard、Llama4-Guard谁才是王者？

2025-11-10

DeepSeek-OCR到底厉害在哪？

2025-11-03

n8n如何调用最近爆火的deepseek OCR？

2025-10-29

小红书入局AI智能体开源DeepAgent，在计划什么更新？

2025-10-28

埃森哲的大裁员，向市场发出了什么信号？

2025-10-13

DeepSeek-V3.2背后的国产算子编程语言TileLang是什么？如何保持性能领先的同时减少6倍代码量？

2025-09-29

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部