2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

一台不到两万的小怪兽:AMD锐龙395真能撑起千亿大模型吗?| 前沿在线

发布日期:2025-11-17 22:05:28 浏览次数: 3222
作者:前沿在线

微信搜一搜,关注“前沿在线”

推荐语

AMD锐龙395以不到两万的价格挑战千亿级大模型,打破显存焦虑,重新定义AI工作站的边界。

核心内容:
1. AMD锐龙395在小型媒体沙龙上展示运行千亿级模型的惊人能力
2. 行业显存焦虑的现状与AMD提供的解决方案
3. 云算力的局限性与本地AI工作站的优势对比

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


台小盒子,为何引发围观


沙龙现场并不张扬。

没有炫目的舞台布景,也没有大型展板。

几台黑色的小主机静静放在桌子上,看上去和市面常见的迷你 PC 并无二致。


直到 AMD 工程师点开演示画面,屏幕上赫然出现了 GPT-OSS-120B 的运行界面。


动辄百亿、千亿参数的模型,在这样一台台“小盒子”上跑了起来。

会场安静了几秒。随后,有人举起手机拍照,有记者低声和同伴确认:“这东西真能跑起来?”


在绝大多数人的认知里,亿级模型的门槛就是“服务器”。


动辄几十万元,体积庞大、功耗惊人,还得配备专业的机房、电源与运维团队。


AMD 却拿出了一台售价不到两万的小型工作站,把这个场景搬回了桌面。

这种“反差感”,在一个被“显存焦虑”困扰了一整年的行业里,格外让人震撼。

显存焦虑,终于有人给出答案


如果给 2025 年的 AI 行业做一份年度热词榜,“Agent” 和 “显存” 必然高居前列。


模型的参数量不断膨胀,从 7B 到 30B,再到 100B+;


场景的复杂度也在升级,从单一的文生文,到跨模态输入,再到多个 Agent 串联完成复杂任务。


所有这些进展,都在吞噬显存。

但现实极其残酷:

  • 消费级显卡,大多停留在 24GB;

  • 商用显卡,顶多也就是 32GB;

  • 真要跑亿级模型?直接超纲。


这就像是一条“算力分水岭”。


谁能跨过去,谁就有机会进入 Agent 的下一阶段;


谁跨不过去,就只能望而兴叹。

这便是所谓的“显存焦虑”。


开发者知道 AI Agent 的潜力,却发现手里的硬件无法承载。


企业想要试水,却发现成本高得难以承受。


科研机构更清楚模型的价值,却往往被资源限制绑住了手脚。


纪朝晖(AMD 大中华区市场营销副总裁)在现场点明了这一点:


“今天一张普通显卡跑不了亿模型,但 395 能。”


他的话让在场的媒体人频频点头。


因为在这个节点,不仅能跑,而且还要跑得快!MoE架构的千亿参数模型如GPT-OSS-120B在这些mini AI 工作站上也能跑到40个tokens每秒的推理速度!

云算力不是万能解药


那么问题来了:如果本地跑不动,为什么不去用云呢?


过去两年,云 GPU 租赁几乎成了创业公司和科研机构的“标配”。A100、H100 被炒成算力短缺时代的「硬通货」,谁掌握了算力,谁就掌握了研发主动权。


但真正在云上跑过大模型的人都知道:云并没有解决根本问题,反而暴露出三大局限。


1. 成本过高,难以长期承受


算一笔简单的账:

  • 一张 80GB 的 A100,租赁价格最低几十元一小时;

  • 长期实验下来,一个月轻松就是十万元级别;

  • 如果要并行多个实验,成本还会成倍增长。


对于需要反复迭代的中小团队,这几乎是不可承受之重。很多团队并不是不想做实验,而是被价格劝退。


2. 调度不稳,供需缺口明显

 GPU 的另一个痛点是“抢”。


在学术大赛、热门 benchmark 节点,经常出现排队数小时的情况。甚至有人遇到过模型跑到一半,云资源被系统强制回收,前功尽弃。


科研和开发需要稳定的环境,但云的波动性让实验随时可能被打断。对很多初创公司来说,这种不确定性几乎是致命的。


3. 数据约束,合规与安全的双重难题

AI 正快速进入垂直行业,而这些行业的数据天然敏感:


  • 医疗影像、金融账单、工业设计文件,都是核心知识产权;

  • 上传到云端,不仅要付带宽费,还可能触碰隐私和跨境合规风险。


很多企业 CTO 在评估云方案时,都被法务和合规部门反复拦下。


所以,云 GPU 不是“不行”,而是代价太大。

成本、稳定性、数据安全三座大山,正在逼着行业追问:有没有可能把百亿模型跑在本地?


这不是一个噱头,而是出于安全、成本、效率 三重考量的必然需求。

395 的出现,正是这一追问的具象化回应。

一台“小怪兽”,真能跑亿模型


那么,锐龙 AI Max+395 到底凭什么?

它的秘密武器很直白:96GB 独享显存

这并不是单纯把大容量内存堆上去,而是通过AMD统一内存架构(UMA)技术,把 128GB 系统内存灵活分配给 CPU、GPU、NPU 使用。

其中,96GB 可专供显卡。


这里的 CPU 是新的 Zen 5 架构,16 核 32 线程、主频高达 5.1GHz,本来只会出现在顶级游戏本上;GPU 拥有 40CU,相当于 4060/4070 级别独显的性能;再加上 50+ TOPS 的 NPU,完全符合 Windows 11  AI+ PC 标准。


换句话说,它等效于一张 4060/4070 级别的独立显卡,却带着服务器级别的显存空间。


这一点在本地大模型部署时尤为关键。


传统显卡常见的“瓶颈”在于:算力够了,显存却不够。


结果就是:模型放不下,跑不起来。


锐龙AI Max+ 395 通过 UMA 技术打破了这道“物理门槛”:


  • 大模型能装下:千亿参数不再是服务器专属;

  • 算力能调度CPU、GPU、NPU 协同,避免资源浪费;

  • 灵活能扩展:显存可动态调整,更适合 Agent 长上下文与并行任务。


在演示中,根据实际估算及模型官方文档,AMD 给出了几组显存占用数据

  • Qwen3-30B需要18GB 就能跑,轻松通过。

  • Llama4-109B需要66GB 显存跑通。

  • Mistral Large 123B需要68GB 显存。

  • GPT-OSS-120B:需要 80GB 显存,实测达到了 40+ Tok/s


这些模型的共同点是:不是“671B”那样的庞然大物,但都是百亿乃至一千亿级里极具可用性的“黄金模型”。


科研需要它们,企业项目需要它们,开发者更想在本地复现实验。


而此前,24GB/32GB 显卡完全无力触碰。


一句话:395 把服务器才能玩的“大模型实验”,搬了桌面。

它不是 PC,也不是服务器


为什么 AMD 要把它叫做 “Mini AI 工作站”

纪朝晖在现场说了一句掷地有声的话:


“希望它能像互联网时代的树莓派一样,成为 AI 时代的普及推动者


这并不是一句简单的营销口号。


树莓派在互联网时代的意义,从来不是性能,而是普及与可玩


它把计算带进了每一个极客的书桌,让数以百万计的人第一次真正有机会“动手试一试”。

锐龙 AI Max+395 延续的正是这种逻辑:

  • 它不是传统 PC——性能太弱,跑不动亿模型;

  • 它也不是服务器——价格太高,中小企业用不起;

  • 它是夹在中间的“新物种”:一台能被个人、团队、小企业负担得起的 工作组级 AI 工作站


换句话说,它不是替代机房,而是让算力下沉到更接近用户的地方。

纪朝晖的另一句话也很关键:


Windows 11 AI+PC 已经让每个员工人手一个 AI 助手;

下一步,就是 Mini AI 工作站,让团队、小企业、超级个体都有属于自己的 Agent 引擎。”


这既是对锐龙AI MAX+ 395 的定位,也是对市场未来的判断。

Agent 元十年,需要这样的机器


2025 年被业界称为“AI Agent 元年”

但正如 Karpathy 泼过的冷水:“真正成熟要十年。”

这意味着,我们刚刚进入的是一个“元十年”:未来十年,Agent 的每一步成长,都离不开可靠的本地算力。

Lisa Su 博士在公开发言中,曾经把 AI 定义为:


“过去 50 年里最重要的技术变革”


她强调,未来几十年的科技创新将高度围绕 AI 展开。


从科研突破到企业流程重构,从教育到娱乐,AI 会成为每个行业的基础设施。

在这样的背景下,Agent 并不是一个可有可无的附加功能,而是下一代生产力的入口。


但是:

  • 云端 Agent 面临 数据安全与合规挑战,尤其是涉及知识产权和隐私的场景;

  • 动辄几十万的 AI 一体机服务器,中小企业与开发者根本负担不起;

  • 小模型虽便宜,却撑不起复杂任务,更无法满足长上下文和多 Agent 协作。


因此,市场确实缺少一个新的定位:既能跑千亿参数模型,又足够便宜好用


锐龙 AI Max+395 恰好踩在了这个关键点上。

场景里的锐龙AI MAX+395,比参数更有说服力


硬件规格永远冰冷。


真正让人信服的,是它能不能跑起来、能不能进到真实场景。

在沙龙现场,AMD 与合作伙伴一起展示了几个典型Demo

1. 个人开发者


过去写 Demo,需要会代码。


现在借助锐龙AI MAX+ 395,哪怕是没有编程经验的朋友,也能在 LM Studio 作为本地大模型平台 N8N 自动化工作流工具提供大模型API调用,做出一键分析 B 站数据的“小助手”。

或者快速用AI协助制作真实工作需要的便利小工具如 KPI 检查工具:输入表格,选择对应的时间和活动,工具帮你核查逻辑合理性,输出结论。


2. 小企业


一家制造公司,把几千个零件的 BOM 批量分析交给 395 上的大模型。


以前人工检查,出错就是灾难;现在 AI 不仅快,还精准。


HR 场景同样现实:1000 份简历,AI 先筛一遍,再把合适的推给面试官。


3. 社区/物业


某物业服务的公开区域摄像视频流数据,以前需要昂贵的服务器来处理抽帧、识别、报警。


借助 395 可以多模并行:YOLO 做目标检测,VLM 做场景分析,ML 算法做预测。火情、入侵、电瓶车过热,甚至垃圾溢满,都能实时告警。


算力从“机房”下沉到“小盒子”,成本直接砍掉一半。


4. 家庭


孩子踢被子、冰箱物品不足、家庭相册智能检索。


这些过去依赖云端的“智能家居幻想”,如今能在本地落地。


而且数据留在家里,不必担心隐私泄露。


5. 会议室


会议是最典型的长上下文场景。


395 能处理 100K+ 上下文,配合 MCP,做会议纪要、跨语种翻译、代办任务分配。


过去靠秘书,现在靠 Agent。


这些场景,展示了 395 从“个人到团队,从社区到家庭”的广阔适用性。


比起参数,这些故事更有说服力。


纪朝晖也在现场强调:


“今天市场上确实缺少一合适的平台。我们希望 395 成为那个解决方案。”


八家厂商押注,生态开始发芽


锐龙AI MAX+ 395 并不是孤军作战。


7月的Mini AI工作站行业解决方案峰会上,AMD携合作伙伴展出了超过20款的AMD锐龙 AI Max+395 Mini AI工作站产品

在这场媒体沙龙上,就有 八家合作厂商 同台亮相,展示了搭载锐龙 AI Max+ 395 的多样化产品:

AbeeAI Station 395 Max

惠普ZMini G1a

希未AideaStation R1

零刻GTRPro

首届玲珑六联智能AXB35-02-H02-BQ

极摩客EVO-X2

天钡NEX395

铭凡MS-SMax


在生态层面Ripple AI、魔搭社区、Wisemodel 等伙伴则更强调软件与社区:

  • Ripple AI Station 已经正式上线,提供开发者套件、远程调试、教程模板和社区互助,定位直白——把 395 打造成“AI 版树莓派”;

  • 魔搭社区 Wisemodel 始智 AI 陆续开展了例如 MCP/Agent 挑战赛与NPU应用开发编程赛。

纪朝晖在现场强调:

“AI 的普及,不只是卖硬件,更要让开发者、学生、小企业有工具可用,有社区可依赖。”


这种打法和树莓派当年的路子如出一辙:硬件、软件、社区三位一体,推动生态滚雪球式成长。

品牌野心:从苏妈到全栈 AI


如果把这次沙龙只看成一场产品秀,那就低估了 AMD 的野心。

过去几年,AMD 的品牌势能正在快速上升:

  • 过去四年,AMD 品牌价值提升了 8 倍

  • Lisa Su 博士去年被《时代》杂志评为 年度 CEO

  • 今年,她又在《财富》全球商业领袖榜排名 14 位

  •  BrandZ 最新全球最有价值品牌榜中,AMD 已经跻身  50,排名第 47。

这意味着,AMD 已经不再是过去那个被视为“挑战者”的角色,而是在逐渐塑造 AI 时代的 领导者心智

Lisa Su 在多个公开场合都明确表示:


“AI 是过去 50 年里最重要的技术变革,甚至超过互联网的诞生。”


在她的带领下,AMD 构建的 AI 版图覆盖了从 数据中心到边缘再到终端 的完整链路。今天又通过mini AI 工作站覆盖端侧、边缘侧,打通AI Agent赋能实体应用的最后一公里。

而锐龙 AI Max+ 395,就是这条战略链路里最贴近用户的那一环。


它的意义不只在于一台机器,更在于心智:告诉市场,AMD 不只是芯片供应商,而是在为 AI Agent 元十年 铺设地基。


未来的可能性


纪朝晖在现场总结时说:


“今天一张普通显卡跑不了亿模型,但 395 能。我们希望它成为团队、部门、小企业的 AI 引擎。”

这句话,道出了 395 的定位——它是 算力下沉的拐点


如果说Windows 11 AI+ PC  AI 助手走进了每个员工的桌面,那么 Mini AI 工作站 的意义,就是把Agent 引擎 交到团队、小企业、超级个体的手里。


它既不像服务器那样昂贵,也不像普通 PC 那样捉襟见肘,而是恰好踩在了那个“空白带”。

未来,我们或许会看到:

  • 学生 在课堂上用 395 学习 AI 原型开发,成为真正的 AI 原生人才;

  • 开发者 在家里用 395 搭建工作流,不再依赖昂贵的云服务;

  • 小企业  395 承载内部 Agent 系统,从简历筛选到业务数据分析;

  • 家庭  395 做智能中枢,把安全、健康、生活的琐事交给本地 AI;

  • 一人公司 借助 395,跑起百万级任务,构建属于自己的业务引擎。


所有这些场景的背后,是一个共同的逻辑:算力普惠


这场没有大屏幕、没有灯光秀的沙龙,留下的最大记忆点,不是热闹,而是冷静的冲击感。


 GPT-OSS-120B 在一台不到两万块的小主机上跑起来时,所有在场的人都明白:某些东西真的变了

纪朝晖说过一句话:


“AI Agent 元十年不会等人,但 AMD 希望把门槛降下来,让更多人能参与其中。”


锐龙 AI Max+ 395 也许不是最强大的机器,但它极有可能是最“及时”的那台。


AI Agent 的大幕正在拉开,而 AMD 用一台小怪兽,把未来推到了我们眼前。

- END -

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅