微信扫码
添加专属顾问
我要投稿
DeepSeek V3.1震撼发布,性能超越Claude 4 Opus,成为开源模型新标杆! 核心内容: 1. V3.1 Base与Instruct双版本发布,采用MIT开源许可 2. 在多项基准测试中表现优异,尤其在编码任务上超越顶级闭源模型 3. 128k长上下文支持,适合复杂应用场景
昨晚 DeepSeek V3.1 Base / Instruct 在 Hugging Face 上低调发布,但引起了巨大的社区反响。
@scaling01
DeepSeek V3.1 在 Aider Polyglot 基准上击败了 Claude 4 Opus,成为目前表现最强的非-TTC 编码模型,而其成本仅约 1 美元。
@swyx
看起来 @deepseek_ai 依旧稳步推进,DeepSeek V4 很可能已经在路上了!
我这边整理了一下目前关于 V3.1 Base 的要点(毕竟现在没有一个地方能一次性看到所有信息):
可以预见,今年 11-12 月的模型大战会非常精彩。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-05
Dify + RustFS + Milvus,构建文档多语言翻译 AI Workflow
2025-10-03
如愿以偿!Qwen3-VL再开源30B-A3B,附实测!
2025-10-03
开源神器 OpenDataLoader PDF:RAG 数据预处理终结者,告别“垃圾进,垃圾出”!
2025-10-03
告别散装!蚂蚁金服新模型,一个模型搞定图像理解生成与编辑!
2025-09-29
DeepSeek-V3.2背后的国产算子编程语言TileLang是什么?如何保持性能领先的同时减少6倍代码量?
2025-09-29
DeepSeek-V3.2-Exp开源,附论文细节解读!
2025-09-29
独家 | 帆软首次掀起盖头,万字访谈揭密BI巨头的出海之路
2025-09-29
2 分钟搞定官方文档没写的隐藏功能?99%的人还没掌握这种AI学习法!
2025-07-23
2025-08-20
2025-09-07
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12
2025-07-31
2025-09-29
2025-09-17
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16
2025-08-13