我要投稿

DeepSeek-V3.1发布，拿下全球开源第一，确实可以封神了！（附一手实测）

发布日期：2025-08-22 07:59:55 浏览次数： 3674

作者：郭震AI

微信搜一搜，关注“郭震AI”

DeepSeek迎来升级，发布V3.1，在Aider编程榜单拿下了76.3%高分，超过Claude 4 Opus，

开源大模型中，编程再次拿下第一名，是目前最好的开源编程大模型：

这篇文章通俗总结下，它是如何做到的，以及一手实测了DeepSeek-V3.1接入到智能体的编程能力，感兴趣的可以看看。

进入DeepSeek官网，先做个身份鉴定：

它的回复清晰明了。

同样的问题，如果提问GPT4o，问它你是GPT-5吗，它会说是的，很明显这是错误：

大模型认清自身是谁的问题，尤其模型升级次数多了后，准确回答难度就会变大。

1 整体升级

根据DeepSeek介绍，本次主要升级了三个方面：

1）支持思考和非思考模式

2）输出token减少，但同时取得了同等或更好的答案

3）更强的智能体能力，标志着迈出智能体时代第一步。

效率就是生产力，回复快质量高，永远都是软件升级的方向，这次升级后在推理效率方面，V3.1也与OpenAI相当，如下网友评价所示：

具体分析后两个升级，先看第二个：

V3.1 思考模式，输出Token数减少了20%以上，但是如下图所示得到答案与R1相比更好：

怎么理解这些背后的逻辑呢？为啥DeepSeek要强调输出Token数变少，但是答案还是很好？

首先，我们要理解这里的Token数变少，指代输出的答案Token数变少，而不是思维链的Token数变少；

其次，为啥输出Token变少，问题难度就变大了呢？举个通俗的例子：

想象一下两个任务：

任务A（原版）： 用500字写一篇影评，要求观点清晰、论据充分。
任务B（压缩版）： 用150字写一篇同样水平的影评。

显然，任务B要难得多。你需要更深入地理解电影，精准地捕捉核心观点，并找到最精炼的词句来表达，任何废话和冗余都是不允许的。这对作者的概括能力、语言功底和逻辑组织能力是更大的考验。

最后，想清楚以上问题后，上面如何做到的呢？官方给出的解释，技术就是思维链压缩。

如何理解思维链压缩呢？举个通俗的例子：

传统CoT: “约翰有5个苹果，他吃了2个，所以还剩下5-2=3个。然后他又买了4个，所以现在有3+4=7个。因此，答案是7。”

压缩后输出: “约翰吃完剩3个，加上新买的4个，总共7个。”

然后生成很多个压缩思维链并拿去训练，使用强化学习技术，奖励答案的正确性，同时奖励回复的简洁性，一顿训练后，就得到了回复更简洁的回答。

其实这背后还有一个很让人深思的问题，为啥不直接通过回复简洁性奖励来训练，而是还要特意间接通过压缩思维链。“压缩思维链”训练是一种更聪明、更稳定、效果更好的方法，它解决了“单纯奖励简洁性”所带来的根本性问题。

测试下官网，实际验证下，输入如下问题，不选择DeepThink模式，我看了回答不仅完整：

语言确实也更加精炼，如下红线所示，最后总结相当符合人性化：

如果选择DeepThink模式，看到它的思考思维链变得更加精简了：

2 更强智能体

从DeepSeek升级看，智能体也是重点方向，再次论证了AIGC的重要一步必然是智能体能力的提升。

在编码智能体测试中，DeepSeek-V3.1性能碾压自己的R1、V3，实现对自己的全面超越：

大概解释下这些评测框，感兴趣的可以大概了解。SWE：全称是 Software Engineering Agent benchmark，用于测试智能体完成软件开发任务的能力。TerminalBench：是另一个评估编程能力的标准测试集合（benchmark），侧重命令行环境中的编程任务。

同时在搜索智能体（Search Agent） 能力上，V3.1也是得到了巨大飞跃。

接下来重点说说，这意味着什么？能给我们带来哪些好处？

大模型作为智能体的大脑，如果它能更好辅助智能体的其他部分，那就意味着它更加agentic了。因此，DeepSeek-V3.1的进步，使得智能体开发者，能够更轻松地构建出更强大、更可靠、更智能的Agent。

具体来说，举一个例子，DeepSeek-V3.1的进步，使得智能体不再需要与用户或系统进行冗长的“来回确认”，它能更快地理解意图、诊断问题并生成正确方案。

3 体验智能体

接下来和大家一起体验下DeepSeek-V3.1的智能体能力，因为根据DeepSeek介绍，支持轻松接入Claude Code智能体，好，咱们完整实践一遍。

第一步，打开命令窗口或cmd窗口，输入下面命令：

npm install -g @anthropic-ai/claude-code

全局安装Claude code智能体

第二步，配置环境变量：

具体命令如下所示：

export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropicexport ANTHROPIC_AUTH_TOKEN=DEEPSEEK_API_KEYexport ANTHROPIC_MODEL=deepseek-chatexport ANTHROPIC_SMALL_FAST_MODEL=deepseek-chat

第三步，定位到文件目录，直接输入claude，启动编程智能体：