微信扫码
添加专属顾问
我要投稿
Claude 3.7在代码编写和SVG卡片生成上超越Deepseek-R1和Grok3,展示AI模型的新高度。 核心内容: 1. Claude 3.7 Sonnet模型的介绍及其推理能力的提升 2. 比较Claude 3.7、Deepseek-R1和Grok3在代码能力测试的表现 3. SVG卡片生成能力对比,Claude 3.7的明显优势
Claude 3.7 Sonnet 是 Anthropic 最新的 AI 模型,定位为推理、编码和现实世界问题解决方面的重大进步。最大的变化是 Claude 3.7 Sonnet 现在支持思考模式,让我们可以看到模型的逐步推理过程。下面从代码能力测试和svg卡片生成两个维度跟最近火热发布的两个模型deepseek-R1和grok3做一下对比测试。
使用claude3.7实现一个前端页面,响应时长基本是秒回
创建一个包含CSS和JavaScript的单个HTML文件,用于生成一个带有动画的天气卡片。卡片应通过不同的动画直观地展示以下天气情况:
风:例如移动的云、摇摆的树木或风线。
雨:例如下落的雨滴、积水形成。
晴:例如闪烁的阳光、明亮的背景。
雪:例如飘落的雪花、积雪。
将所有天气卡片并排放置。卡片应有一个深色背景。提供所有HTML、CSS和JavaScript代码,全部包含在同一个文件中。JavaScript应包含一种方式,用于在不同的天气条件下切换(例如一个函数或一组按钮),以展示每种天气的动画效果。
切换到Deepseek-R1
响应时长111s,生成的html通过在线解析工具中看一下渲染效果
思考响应时长114s
看下代码效果:
三个前端代码能力相比哪个更强不言而喻
先让deepseek-r1生成一个关于MOE大模型的工作原理,然后绘制成svg图
以上就是跟大家分享的关于claude3.7、deepseek-r1以及grok3的代码能力和svg卡片生成能力的对比测试。总的来说claude3.7完胜另外两个大模型,这也能解释为什么现在最火的Cursor代码编辑器为什么会集成claude3.5的原因。当然以上的测试仅仅是从两个维度来做对比,还有其他维度比如逻辑推理、数学测试、语义理解、图文生成、性能等等。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
通俗易懂的梳理MCP的工作流程(以高德地图MCP为例)
2025-04-30
一文说明 Function Calling、MCP、A2A 的区别!
2025-04-30
MCP很好,但它不是万灵药|一文读懂 MCP
2025-04-30
旅行规划太难做?5 分钟构建智能Agent,集成地图 MCP Server
2025-04-29
10万元跑满血版DeepSeek,这家公司掀了一体机市场的桌子|甲子光年
2025-04-29
谷歌大神首次揭秘Gemini预训练秘密:52页PPT干货,推理成本成最重要因素
2025-04-29
一文说清:什么是算法备案、大模型备案、大模型登记 2.0
2025-04-29
MCP:AI时代的“万能插座”,大厂竞逐的焦点
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-04-29
2025-04-29
2025-04-29
2025-04-28
2025-04-28
2025-04-28
2025-04-28
2025-04-28