微信扫码
添加专属顾问
我要投稿
DeepSeek R1新版本开源,性能直逼OpenAI顶级o3模型。 核心内容: 1. DeepSeek R1最新0528版本开源,性能测试媲美o3模型 2. R1-05-28在风格、响应和编程任务中表现出色 3. 社区期待DeepSeek R2的发布,R1已展现出惊人智能
今天凌晨,全球著名开源大模型平台DeepSeek开源了R1最新0528版本。
DeepSeek目前没有对该版本进行任何说明,又只是“悄悄”地开放了模型。估计很快会放出模型卡介绍更多功能。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
但已经有网友迫不及待的对新版R1进行测试,在著名代码测试平台Live CodeBench中显示,其性能可以媲美OpenAI最新的o3模型高版本。
也有网友对新版R1的风格进行了测试,几乎和OpenAI的o3差不多。
R1-05-28具有 o3-2.5 专业风格的响应。箭头/星号的使用与 o3 风格非常一致,结尾处 “why it works”的表述更具说服力。
尽管 OpenAI付出了努力,但DeepSeek依然出色地完成了这一点。如果这就是 o3 水平,那么 R2 将会有多智能呢?
Hyperbolic Labs联合创始人兼首席执行官表示,新版R1仍然是唯一能回答9.9和9.11哪个最大的模型。
知名AI评论、分享人Haider表示,大师兄DeepSeek又回来了~
新版本的 DeepSeek R1 在编程方面简直令人难以置信。
我进行了一项编程挑战,要求模型构建一个单词评分系统。模型短暂推理后,给了我两个文件:整洁的代码和可运行的测试用例。两者第一次运行就完美通过。
此前只有 o3 模型能做到这一点,但现在没有其他模型能做到了。这是我在这项任务中测试过的最佳模型。
我一直在测试它,它非常智能,但现在似乎思考时间更长了。
如果这能被其他基准测试证实,我可以想象原本DeekSeek是想把新版R1作为R2发布的,但鉴于最近发布的产品已经远远领先,若再用 R2 这个标签可能会让人失望。
因此,他们可能决定将其作为新的 R1 版本发布。那么唯一的问题就是,我们还要等多久才能看到真正的 R2 呢。
新的 DeepSeek R1实际上相当不错。它现在能够像 o3一样纠正自己的思维链(CoT),并能像Claude一样创造性地构建世界观。这在之前的R1版本中是做不到的。
看到新版R1的编程能力这么好,我很震惊。用同样的提示测试了最新的Opus 4,结果 Opus 4 只是稍好一点。这太可怕了……
在DeepSeek放出官方模型卡之后,「AIGC开放社区」会为大家做更深的解读。
本文素材来源网络,如有侵权请联系删除
END
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-06
ollama v0.17.6 发布:重大解析修复与 Qwen3.5 完整支持,全链路优化模型渲染与工具调用
2026-03-06
Codex重磅更新:在CLI中语音Vibe Coding
2026-03-05
AReaL v1.0 正式发布:面向 Agent 的全异步强化学习训练框架
2026-03-05
Qwen 和钉钉,无招和俊旸
2026-03-04
开启极简养虾,用 TRAE 快速部署 OpenClaw
2026-03-04
ollama v0.17.5正式发布:新增Qwen3.5系列模型,全方位优化GPU/CPU分配、采样惩罚与内存管理机制详解
2026-03-03
4 天 6.8K Star,这个 AI 漫剧项目火了:waoowaoo!
2026-03-02
FireRed-OCR 开源发布:端到端方案新SOTA!小红书提出低成本文档识别训练范式
2026-01-27
2026-01-30
2026-01-12
2026-01-29
2025-12-22
2026-01-27
2026-01-28
2026-01-21
2025-12-10
2025-12-23
2026-03-02
2026-02-05
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16