免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


NVIDIA DGX Spark来了,3999美元,是智商税吗 | 含详细参数,建议收藏

发布日期:2025-10-16 12:13:39 浏览次数: 1528
作者:Epoch0

微信搜一搜,关注“Epoch0”

推荐语

NVIDIA DGX Spark以3999美元的价格带来桌面级AI超级计算机,让开发者轻松运行2000亿参数模型!

核心内容:
1. DGX Spark的突破性设计:128GB统一内存与1 PFLOP算力
2. 双机直连可运行400B参数模型,接近开源模型最大尺寸
3. 黄仁勋揭秘:从DGX-1到Spark的AI超级计算机进化史

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

From a single spark,A world of intelligence!To Jensen, Ad astra!

由一束火花,点燃智慧的世界!致黄仁勋,奔向星辰!

——埃隆马斯克致黄仁勋


沉寂已久的英伟达终于在10月13号给大家带来了新消息:英伟达推出了全球迄今为止最小的AI超级计算机 NVDIA DGX  Spark。


从发布会的图片来看,DGX Spark的体积确实小,只有巴掌这么大,跟Mac mini差不多。


当前,数百万开发者日常依赖的 PC、工作站及笔记本电脑,其内存与软件性能已无法匹配快速增长的 AI 工作负载需求,迫使团队不得不将相关工作迁移至云端或本地数据中心。

而作为新一代计算机,DGX Spark 以紧凑的桌面形态打破这一限制 —— 它搭载 1 PFLOP AI 算力与 128GB 统一内存。

让开发者能在本地完成两大核心任务:一是运行参数规模高达 2000 亿(200B)的 AI 模型推理,二是对 700 亿参数模型进行微调;同时,还可本地创建 AI 智能体、运行高级软件堆栈。

DGX Spark 的核心优势在于 128GB 一致性统一内存设计 ——CPU 和 GPU 共用物理内存,数据可在两者间无缝流转。
这一设计的关键价值在于,Spark 运行超大规模模型时,无需额外进行系统内存与显存的数据拷贝,彻底避免了数据搬移的额外开销。
更夸张的是,Spark还具备拓展性:借助背后的双QSFP网络接口(200Gb/s 带宽),两台Spark能直连组成双机集群。
双机可以直接运行400B参数量的模型,接近目前开源模型的最大尺寸!说到这里,酥酥不得不为英伟达竖起大拇指。

NVIDIA 创始人兼首席执行官黄仁勋指出:

“2016 年,我们为给 AI 研究者提供专属超级计算机,研发了 DGX-1。我曾亲手将首台 DGX-1 送到当时还是小型初创公司的 OpenAI,交给埃隆


正是这台设备为 ChatGPT 的诞生奠定基础,点燃了 AI 变革的火种。


DGX-1 不仅开启了 AI 超级计算机时代,更揭示了驱动现代 AI 发展的规模化法则。如今,DGX Spark 让我们重拾初心:


把 AI 计算机交到每位开发者手中,以此催生下一轮技术突破。”

从技术架构来看,DGX Spark 将完整的 NVIDIA AI 平台(涵盖 GPU、CPU、网络、CUDA库及 NVIDIA AI 软件堆栈)整合为一台小型系统,可直接放置于实验室或办公室,且具备加速代理式 AI 与物理 AI 开发的强劲性能。

不得不提的是,Spark 大胆采用 USB-C 接口供电,这在台式机上几乎是前所未有的设计。要知道,像 Mac mini、Mac Studio 这类主流高性能主机,至今仍普遍依赖传统三孔电源线实现稳定供电。

而英伟达之所以这么做,核心目的就是将电源适配器移至机外,从而为内部散热模块争取更多安装空间。

硬件层面,它搭载 NVIDIA GB10 Grace Blackwell 超级芯片、NVIDIA ConnectX-7 200Gb/s 网卡及 NVIDIA NVLink-C2C 技术,AI 性能峰值可达 1 PFLOP,带宽为第五代 PCIe 的 5 倍,还配备 128GB CPU-GPU 一致性内存。

从产品的参数上来看,酥酥觉得最大的震撼,在于工作站体积和功率的变化,DGX-1的重达60.8Kg,功率达到3200W,而DGX Spark在算力提升数倍的情况下,重量缺瘦身到了1.2Kg,功率降低到了240W。

制程工艺的进步,功高至伟!

软件体验上,DGX Spark 进一步降低开发门槛:系统预装 NVIDIA AI 软件堆栈,开发者开箱即可投入 AI 项目开发;同时可访问 NVIDIA AI 生态系统的全套工具 —— 包括各类模型、库及 NVIDIA NIM 微服务,轻松搭建本地工作流。

例如,可定制 Black Forest Labs 的 Flux.1 模型优化图像生成效果,用 NVIDIA Cosmos Reason 视觉语言模型创建视觉搜索与摘要智能体,或基于为 DGX Spark 优化的 Qwen3 开发 AI 聊天机器人。

在全球交付环节,这场发布颇具 “传承感”:为纪念 DGX Spark 全球交付,黄仁勋专程前往德克萨斯州星舰基地,亲手将首批设备之一交付给 SpaceX 首席工程师埃隆・马斯克。

这既是对超级计算机起源的致敬,也呼应了 2016 年马斯克团队从黄仁勋手中接过首台 NVIDIA DGX™-1 的历史时刻。

除 SpaceX 外,Anaconda、Cadence、ComfyUI、Docker、谷歌、Hugging Face、JetBrains、LM Studio、Meta、微软、Ollama 及 Roboflow 等企业也收到首批设备,正针对 DGX Spark 测试、验证并优化自身工具与模型;

目前,NVIDIA DGX Spark 已正式开启交付。合作销售渠道包括宏碁、华硕、戴尔科技、技嘉、惠普、联想、微星,以及各 Micro Center 门店与全球 NVIDIA 渠道合作伙伴。

在酥酥的读者群里,也有供应商已经在提供DGX Spark的现货,酥酥为这些供应商点赞:速度真快,中国的开发者有福了!

不过需要注意的是,DGX Spark的操作系统并不是Windows,而是英伟达自己的定制系统(魔改版的Ubuntu Linux)。

搭载的 LPDDR5x 内存也是个问题,总带宽被限制在约 273GB/s。对于依赖高数据吞吐的 GPU 而言,该带宽远低于专业显卡独立显存的水平(如数据中心级 H100 GPU 显存带宽达近 3TB/s)。

带宽不足导致数据吞吐能力无法满足需求,进而使内存成为 Spark 处理重负载 AI 推理任务的主要瓶颈。

那么问题来了,3999刀的DGX Spark,你还会买吗?


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询