免费POC,零成本试错

AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


DeepSeek V3.1 悄然上线:128k上下文、代码能力直逼Claude,价格却只有1/65!

发布日期:2025-08-20 13:07:58 浏览次数: 1897
作者:5ycode

微信搜一搜,关注“5ycode”

推荐语

DeepSeek V3.1以1/65的价格带来128k上下文和接近Claude的代码能力,性价比惊人!

核心内容:
1. 128k超长上下文支持的实际测试表现
2. 代码能力评测数据对比与成本优势分析
3. 精准知识检索功能的突破性提升

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

昨天DeepSeek又悄咪咪的更新了,这次是继3-28以后,再次更新了deepseek v 系列模型。


然后我到官方去问,已经发布了。

我比较关注3个更新点:

  • • 超长上下文支持(128k):代表着我不管写代码还是处理问题,能够承载的上下文越多,连贯性越好
  • • 更强的代码推理能力:更方便写代码
  • • 更精准的知识问答:我理解为文档处理。

超长上下文支持

我在网上随便找了一篇小说《了不起的盖茨》,212kb的文本,106788 characters
按照官方的token计算方法
实际上只有65k tokens

然后我让deepseek进行计算

大概只有95k~100k tokens, 如果这个是准确的,输入占用87/128 ≈ 68% ,大约预留了1/3给响应。所以输入上下文知识只有87kb左右。

更精准的知识问答

deepseek v3.1 能根据文档进行精准的回答,并告知引用了哪里。

然后我在文档中加载了一些信息,比如:盖茨比改名为鱼翔空。


然后问它改名了几次。能精准地回答到。

然后出现几次都精准定位到了。

代码能力

在aider 的多语言代码评测的github上,有一个deepseek v3.1的 pr,
https://github.com/Aider-AI/aider/pull/4464/commits/9d9625623484969ff327a2542446a94be7f37e66

我用chatgpt将该pr的指标转成和官网上的一致。https://aider.chat/docs/leaderboards/


已经接近于claude-opus-4-20250514 (32k thinking)模型了,就差了0.4%,但是成本只有它的1/65。

代码能力,评测是一回事,实际使用是另一回事,后续只能在实战过程中慢慢体会。

数学逻辑


数学题理解错误了,按照上面的语义,A和B同时开的,它直接把A给关闭了,按照他的推理,如果严谨的话应该2个答案,直接给了一个答案,而且是我理解不应该的答案。

另外一个题推理正确了。

需要注意的是,以前深度思考R1 现在是深度思考,猜测deepseek 后续会将两个模型合并。大家期待的R2估计会改名了。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询