微信扫码
添加专属顾问
我要投稿
AWS re:Invent揭示了智能体时代的商业价值与技术路径,亚马逊云科技从芯片到模型的全栈重构让AI落地更可信。核心内容: 1. 智能体从技术概念到商业工具的转变关键 2. 亚马逊云科技全栈技术升级(Trainium芯片/Nova模型/Agent工具链) 3. 企业级专属模型解决方案Nova Forge的创新实践
Hi,我是银海。
这几天我在跟朋友聊 AWS re:Invent 上关于智能体的发布,几乎每一页PPT我都反复翻了几遍。
不是为了追技术参数,而是因为这次他们真的把“智能体”这件事讲得很透,也给到了完整、可信的落地路径。
我一开始看到 Matt Garman 的那段开场发言就觉得很清晰:
AI 正在从一个“技术奇迹”转变为提供“真实商业回报”的工具。
而这个转变的核心,是“智能体”。
那些可以理解意图、完成任务、长期运行在系统里的AI,他预测未来将出现数十亿智能体,其影响堪比互联网或云的诞生。
这并不是喊口号。
因为亚马逊云科技确实从底层芯片、模型平台、数据能力、Agent 工具链每一层都做了系统性更新。
他们是真的把底层全重构了一遍。
Trainium 3 是亚马逊云科技推出的第三代 AI 训练芯片,3nm 工艺(行业先进),相比前代性能提升 4.4 倍,内存带宽提升 3.9 倍,能效提升 5 倍。
可以简单理解成是“专为 AI 模型设计的超级芯片”,训练更快、成本更低。
而下一代 Trainium 4 也在路上,FP4 精度下将带来 6 倍性能提升。
同时他们和 NVIDIA 合作,推出了基于 GB300 超级芯片 的 P6e 实例,适用于高强度大模型推理任务。
如果你是有合规、主权要求的企业用户(比如金融政务),亚马逊云科技还发布了 AI Factory 模式,可以把 AI 基础设施“搬”进你自己的数据中心,本地部署,也能用到这些能力。
模型能力更分层、更灵活。
亚马逊云科技这次推出了 Nova 2 系列模型,名词很多,但其实是覆盖了不同类型的业务场景:
Nova 2 Lite:用于快速响应、成本敏感场景;
Nova 2 Pro:专为复杂任务设计;
Nova 2 Sonic:优化语音交互场景;
Nova 2 Omni:是一个“统一多模态模型”,同时支持文本、图片、音频、视频输入,并能输出文字或图片。
这些模型都可以在 Amazon Bedrock(一个大模型平台)上直接调用,同时亚马逊云科技也支持了更多第三方模型,比如 MiniMax、Mistral Large、NVIDIA Nemotron、Google Gemma 等,满足不同行业的性能偏好。
Bedrock 目前已经服务了 50 多家企业,处理的 tokens(大模型的最小处理单元)累计超过 1 万亿。
让模型懂你会是未来企业专属模型的新方式。
很多公司说“通用大模型不懂我们业务”,这不是个新问题,但亚马逊云科技给了一个比较彻底的解法。
这次他们发布的 Amazon Nova Forge,提出“开放训练模型”的方式。
你可以把你公司的业务数据、知识库、操作流程参与到预训练阶段,和亚马逊云科技自己的数据混合使用,训练出真正懂你业务的专属模型,他们叫它“Novellas”。
对比微调,这种方式更底层,意味着你不用再担心模型“答得像外人”,它一出生就知道你是谁、你怎么运营、你的流程是什么样的。
说到底,AI Agent 才是关键主角。
前面讲的所有芯片、模型、数据,最终都是为AI Agent 服务的。
Bedrock AgentCore 提供了智能体运行需要的一整套基础设施。
AgentCore Policy:比如你可以设置“退款超过1000元必须人工处理”,AI不能自己决定;
AgentCore Evaluations:能持续评估智能体行为的正确性、是否有效、有无帮助,辅助开发者持续改进。
这部分听起来像“企业内部的合规系统+绩效系统”,但它是为AI智能体量身打造的。
接下来亚马逊云科技有三款智能体直接进入实战场景。
这次发布会真正的高潮,是三款智能体不再是“技术演示”,而是可以直接落地用的产品:
Kiro Autonomous Agent:能自主处理跨多个微服务库的升级和修复任务,深度理解代码库和协作流程,相当于一位“永不休息”的 AI 研发同事。
AWS Security Agent:将安全审查“前置”,在代码写出来前就审查设计文档,把过去靠手工测试才能发现的风险自动化处理。
AWS DevOps Agent:分析遥测、部署、日志数据,帮助快速定位系统问题,在故障发生前给出修复建议,适合运维团队使用。
智能体怎么才能真正用起来呢?
Swami Sivasubramanian 提出几个核心能力拼图:
Strands Agent SDK:可以快速开发智能体的工具包,支持 TypeScript 和机器人设备。
情景记忆(Contextual Memory):Agent 能记住你过去的行为,比如你上次旅行航班晚点太累,下次它会自动优先推荐白天航班。
RFT(强化微调):用强化学习方式优化模型效果,即使你没ML背景也能用,平均准确率可提升 66%。
SageMaker 的 AI 定制体验:你只需要说“我想训练一个理解我们公司采购流程的模型”,剩下的选模型、配数据、跑训练都由AI帮你搞定。
为了让AI更靠谱,他们还加了一层“逻辑保障”。
亚马逊云科技内部的形式化验证现在也开始用于 Agent,配合神经符号AI,可以帮你从逻辑层面检验Agent是不是“瞎说”。
比如:在Kiro IDE 里生成的代码规范会自动被检查、AgentCore 里的策略规则也会通过形式化语言验证,确保权限控制无误。
此外,Amazon Nova Act 正式发布,这是一种 UI 自动化能力,不是传统RPA模拟点击,而是强化学习训练出来的 Agent。
在“数字健身房”中模拟成千上万次企业流程,已达到 90% 的任务完成率,适用于HR、CRM 等实际工作流。
那么问题来了,这些更新对我们有什么用?
对我来说,这不是一个“好像很远的大趋势”,而是一些可以现在就落地的小路径。
我总结了三个最值得马上试试的方向:
一是自动化繁琐任务。
Kiro Agent 可以接入代码仓,自动跑“依赖升级+Bug修复”,还能理解CI/CD流程,推荐一线研发同学都可以尝试一下。
我自己前段时间就一直在使用Kiro去构建非常多的应用了,而且新用户注册了就送 500 credits 免费额度。
Kiro下载地址:https://kiro.dev/
二是让数据“教”模型懂业务。
Nova Forge 提供的是“从底层定制专属模型”的路径,适合你们公司已经有一定结构化数据或操作流程,比如做SaaS、平台型业务、电商、售后等,Vercel其实就在用...
三是做“能上线”的智能体。
有了策略控制+行为评估+记忆功能,你就可以不止做个聊天Demo,而是真正构建一个长期稳定运行的Agent系统。适合产品、AI中台、业务流程团队推进落地。
最后一句话总结这次AWS re:Invent给我的感受:
让构建者真的能“把智能体做起来”。
如果你也正在考虑如何让AI在公司里真正“干活”,这次的发布值得你认真看看。
如果你想了解关于 Kiro 的实战体验和部署实践,欢迎留言,我后面会也继续更新相关教程。
以上就是本期的所有分享内容啦,我是银海,我们下次再见 👋
© THE END
都是对我最好的认可!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-07
奥特曼仓促亮剑GPT-5.2!一张图爆火全网,全面碾压Gemini 3
2025-12-07
Ray开启AI原生时代的到来:这是AI领域的“Hadoop时刻”
2025-12-06
比Gemini 3记得更多,谷歌新框架将上下文记忆干到了200万!
2025-12-05
觉醒与跃迁:一文详解AI自主行动的技术演进与产业未来式
2025-12-05
Palantir发布新产品Chain Reaction:面向美国人工智能基础设施的操作系统
2025-12-05
OpenAI内部代码泄露!最强模型「皇帝」登基,0思考延时吓人
2025-12-04
一文看懂AI智能体系统背后的重要技术——上下文工程(Context Engineering)
2025-12-04
大模型“落地三件套”:Ollama本地部署、API 调用和LLM封装
2025-09-19
2025-10-26
2025-10-02
2025-09-16
2025-09-17
2025-09-29
2025-09-14
2025-10-07
2025-09-30
2025-09-14