推荐语
马斯克的 AI 革命!20万块 GPU 炼出史上最强 AI 模型 Grok-3,彻底碾压 OpenAI
核心内容:
1. Grok-3 计算地球到火星的发射窗口,生成 3D 轨道模拟,得到 NASA 工程师认可
2. Grok-3 在数学、科学问答、编码等基准测试中全面夺冠,刷新 AIME 2025 数学测试纪录
3. Grok-3 训练计算量是 Grok-2 的 10倍,在全球最大超算集群 Colossus 上训练,Elo 评分突破 1400
杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
马斯克自信表示:“Grok-3 是地球上最聪明的 AI 大模型!”
刚刚,直播发布的 Grok-3 太强了!马斯克的 xAI 团队用 20万块 GPU 训练出史上最强 AI 模型,一举超越 DeepSeek-R1、GPT-4o、o1 等热门 AI 大模型。

研究人员向 Grok-3 提出一个高难度问题:“计算地球到火星的发射窗口,并生成 3D 轨道模拟。”Think 模式(高级推理模式)下,Grok-3 详细计算:
使用开普勒定律,计算火星到地球的最优转移轨道。
生成完整 3D 动画,展示飞船航行路径。
提供精确返回窗口,并得到 NASA 工程师的认可:“Grok-3 的计算完全正确!”
相比之下,GPT-4、o1、o3-mini(high)等模型在相同任务上全部失败。不仅如此,Grok-3 的推理能力惊人,在数学、科学问答、编码等基准测试中全面夺冠,甚至刷新了 AIME 2025 数学测试纪录。20万块 GPU 训练,Grok-3 真的无敌!xAI 团队披露,Grok-3 的训练计算量达到了 Grok-2 的 10倍,并且是在全球最大超算集群 Colossus 上训练:
10万块 H100 GPU,第一阶段耗时 122 天20万块 H100 GPU,第二阶段耗时 92 天最新 LMSYS Arena 排行榜显示 Grok-3 数学能力封神!
Grok-3 Elo 评分突破 1400,当前全球 AI 之巅!在 数学基准 AIME 2025 测试中,Grok-3 取得 93 分(满分 100),几乎达到数学专业级别。科学问答(GPQA)、编码(LCB)等多个领域全面刷新 SOTA(最先进水平)。DeepSeek-R1、Gemini-2 Pro、GPT-4o 在这些测试中,全部被拉开差距。DeepSearch:Grok-3 的 AI 版 Google,搜索能力惊艳!马斯克不仅要做最聪明的 AI,这次还带来了一个搜索神器——DeepSearch。这个 AI 智能体不仅能搜索全网信息,还能结合 AI 推理,提供高质量答案。DeepSearch 立刻联网检索,并在左侧显示整个搜索和推理过程,最终精准回答:“2025年2月24日。”(数据来源:SpaceX 官网)订阅 Premium Plus,提前体验 Grok-3!
想第一时间体验 Grok-3?现在订阅 X 平台的 Premium Plus 会员即可解锁!
高级推理 & DeepSearch 体验:需订阅 SuperGrok 版本马斯克承诺:一周内,Grok-3 所有功能上线,几个月内全面开源!