免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

千问打通阿里生态后,会发生什么?

发布日期:2026-01-15 11:01:01 浏览次数: 1533
作者:十字路口Crossing

微信搜一搜,关注“十字路口Crossing”

推荐语

阿里千问打通生态,AI助手从"回答问题"升级为"解决生活问题"的智能入口。

核心内容:
1. 千问深度接入淘宝、高德、飞猪等阿里核心生态
2. 实测展示AI处理外卖、购物等真实场景的能力
3. 办公助理模块与轻量对话双入口设计解析

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

我有,你没有。


loading

👦🏻 作者: 镜山

🥷 编辑: Koji

🧑‍🎨 排版: NCon


loading

最近,大洋彼岸传来一条令大家都很关注消息Google 宣布,旗下的 Gemini 正在与全球零售巨头沃尔玛展开更深层的整合,还发布了全新的 AI 购物协议 UCP。


在谷歌眼里,AI 不再只是一个负责「回答问题」的对话框。


loading


最近,阿里旗下的千问 App 也同样针对这样的「真实任务」场景 进行了一次关键更新。


我们注意到,它已经打通了淘宝、高德、飞猪、支付宝等一系列底层服务接口。换句话说,它不仅接入了阿里的模型能力,还直接连上了这个生态里最核心、也最高频的生活与交易系统。

🚥

为此,我们做了一次相对深入的实测,想看看一个尝试做「懂生活、能行动」的 AI 入口,究竟已经走到了哪一步。


AI 是如何通过打通生态,来处理「真实场景」的?

这回千问 App 的更新,大概都做了什么?


这次更新并不花哨,真正的变化集中在两个点上:一是上线了一个新的「办公助理」模块,二是更深度地接入了阿里内部的一整套生态能力:包括淘宝、闪购、飞猪、高德和支付宝。


先说「办公助理」。它被单独放在了一个明确的入口里,定位也很清晰:主要负责那些链路更长、步骤更复杂的任务。


loading


另一个变化的入口则要轻量得多,也更符合大多数人的直觉使用习惯,在千问 App 的主页面,直接对话就可以触发相关能力。


这两个入口都接入了阿里的完整生态。


你可以试着在通义千问 App 的主页上随机执行一些指令。你会发现,一旦涉及阿里生态内部的联动,系统就会触发一个逻辑前提:绑定淘宝账号。


比如你想直接通过它点外卖,系统会提示你先完成账号关联。


loading

1)帮我点杯奶茶 / 吉野家

我们可以从一个更轻量的入口开始体验:在千问 App 的主页面,直接用自然语言提问就行。比如你可以让它帮你点一杯奶茶,或者点一份吉野家的照烧鸡排饭。


接下来你会发现,它会自动读取并连通你的淘宝地址体系,让你选择一个外卖接收地址,也就是淘宝闪购对应的配送地址。


地址确认之后,千问会跳转到目标商家,自动帮你定位到对应的商品,并以商品卡片的形式展示出来。


在这个过程中,你还可以继续补充需求。比如已经选好一杯奶茶后,你可以再说明不额外加糖,或者更偏好含咖啡因的口味,它会基于这些条件重新筛选并调整结果。


loading
loading


一个比较细节的点是,在走淘宝闪购流程时,它会顺带帮你匹配可用的优惠信息,把折扣一起算进来。


它给出的这些商品卡片,本质上是和淘宝闪购的商品数据深度连通的。你点进卡片之后,可以像在原生外卖页面里一样继续操作。


比如,你可以直接在卡片里修改商品配置,切换不同的规格或口味,增加配料,甚至再顺手点几样同店的其他商品:


loading

2)打通淘宝

当然,能力并不只停留在淘宝闪购这一层。千问已经接入了阿里体系下的多个核心平台,包括淘宝,很多场景都可以在同一个对话里完成衔接。


比如,让它去淘宝看下空调,输入提示词:




帮我看看淘宝上,有没有性价比高点的空调


现在的千问会先去调查网上关于空调性价比的各种评论,然后整理出一个结构化的回答,里面嵌入了淘宝的商品卡片:


loading


而且,在这份回答里,还给出了一个表格化的总结,点击这些商品卡片的话,会跳转到浏览相关商品的商品框里:


loading


我还发现,我可以直接上传小红书上被种草的图片,直接给它,然后它就能直接进行画面识别,再去淘宝上搜索到相关结果:


loading

3)「复杂」任务场景

前面提到的这一两个例子,其实都属于比较基础的生态联通场景,更多是在验证千问如何把现有的平台能力顺畅地接进一次对话流程里。


如果想体验更复杂一些的任务场景,可以换一个入口,从千问的「办公助手」进入。


这里覆盖的通常是多步骤、强规划型的需求,对 AI 的理解、拆解和调用能力要求也会更高。


像是:




帮我点 20 份吉野家套餐,作为我们团队的工作餐,鸡肉、牛肉的都要,再来点饮料


进入「办公助手」之后,整体反馈方式会更接近你在 AI chatbot 里做深度任务时的体验。它会先确认你的核心需求,并自动结合已有的信息,比如配送地址,然后再一步步把任务往下拆解。


在这个过程中,它会主动追问关键细节,确保后续操作不会出错。


比如我一次性点了 20 份吉野家的套餐,它就会继续确认鸡肉和牛肉各需要多少份、饮料是否需要搭配、数量如何分配:


loading


当这些需求逐一确认完成后,你会发现它背后的工作流被展示得相当清晰。


比如,它会先基于你的地址去匹配周边可用的商家范围,像幸运咖、吉野家这类符合条件的门店都会被纳入候选。


接着,再在这些商家内部继续做商品层面的搜索和筛选:


loading


最终,它会基于前面所有确认过的信息,给出一份能够覆盖 20 份餐食需求的完整方案。


在我的体验里,它会同时给出三种不同的组合方案,每一份方案都会在侧重点上有不同:


loading


每一份方案本身都是可继续操作的。你既可以直接选择其中一个完成付款,也可以在方案基础上再做调整,比如改动商品组合或数量。


同时,它还会在后台自动帮你匹配可用的优惠信息,把折扣一并算进去。


loading

4)吃穿住行的大闭环

除了外卖这种相对高频、即时的场景之外,我还注意到它在更长链路的任务上同样成立,比如一句话就让 AI 去定制一整套旅行的吃、住、行安排。


这类体验整体下来会更完整,也更有“闭环感”。


举个例子,如果你只是告诉它,想带爸妈来北京玩一趟,再简单补充一些需求偏好,它就可以围绕这个目标开始做整体规划,把行程、住宿、出行方式以及用餐选择逐步串联起来。


提示词如下:




我爸妈 60 多岁,第一次来北京,不想走太多路、不排队、不折腾,帮我规划 3 天游玩和住宿。


loading


在我提出这个需求之后,它会继续和我交互,逐步把关键信息补齐。


在这样一个复杂闭环的任务里,它的执行逻辑会变得非常清晰。举例来说,它会先结合我父母的年龄,去整理适合带父母在北京游玩的思路和注意事项,这部分信息主要来自各类公开网站。


随后,再调用高德地图,去核对从上海到北京的出行方式,包括高铁、飞机以及对应的站点或机场安排。


在此基础上,才会继续生成类似「北京 3 日游」这样的行程结构,把吃、住、行逐步填充进去。


loading


在前面这些基础步骤完成之后,它还会继续往下推进,调用飞猪去细化「具体玩什么」的问题。这个阶段会进入到更细的游览层级。


比如在故宫博物馆的场景下,它会进一步拆分到午门、珍宝馆等具体参观点:


loading


最终呈现出来的结果,会更接近一份结构化的页面,而不是零散的对话回复。整体形式有点像一个 HTML 网页,把所有规划内容集中在一起展示。


在这份详细的旅行规划中,会包含一个地图卡片,规划好了三条不同的路线:


loading


当然,作为一份完整的攻略,交通信息也被自然地整合进来了。比如从上海到北京的出行方案,会直接给出对应的航班信息,包含时间、班次等要素。


如果你在这个页面里点击购票相关的选项,它会直接跳转到真实可用的机票购买页面


loading


另外,在这份完整的页面里,我还注意到一个比较细节的设计。很多景点条目下面,其实都会配有一些功能模块,比如导航、打车详情之类。可以直接点进去使用的。


loading


比如,当我点开其中的「导航」功能时,它会直接跳转到高德地图,路线已经提前帮我设定好了。如果是涉及门票的场景,也可以顺着入口进入对应的购票页面。


loading


住宿这一块其实给人的感觉也挺顺的。它会直接在行程里帮你列出几种不同的住宿方案,有近一点的,也有性价比高一点的,选择面不会太窄。


loading


下面是这个完整任务的录屏,我已经放在下方了,可以整体看一遍,过程做了加速处理:


5)复杂的办公场景

现在的千问 App,在这两个入口下,对相对复杂的图片解析能力表现得会更成熟一些,也已经和这次升级的核心能力打通了。


比如,我可以直接上传一张信息密度很高的图片。


前段时间我试过一张 2026 年 1 月 14 日 NBA 比赛的伤停名单,图片本身非常复杂:


loading


然后在「办公助理」这个入口里,你可以直接用一句话让它把事情做完。比如让它基于这张图片,先完成信息识别,再整理成一份完整的 Excel 表格。


在这个基础上,它还可以进一步把结果做成一个可视化的 HTML 页面:


loading


最终给出的结果,其实完成度相当高,是一份具备完整交互能力的可视化报告。我截了几张图放在下面,可以直观看到它把不同层次的内容都整合到了一起:


loading
loading
loading
loading


里面有结构化的数据表格,也有对应的数量统计和状态分布的环状图,甚至还生成了一个可以拖拽查看的 3D 数据可视化,已经算是非常成熟了。

🚥

过去很多年里,人和系统的关系是「你去适应工具」。我们在手机里装满 App,记住每个入口的位置,按既定流程一步步点完。


而在 AI 时代所呈现出来的逻辑,将会反过来:用户不需要理解系统结构,只需要清楚表达自己的「意图(Intent)」,剩下的「行动(Action)」交给 AI 去完成。


你不必关心先打开哪个 App、再跳转到哪一步。系统结构被压缩到后台,对用户来说,只剩下一次自然的表达。


而目前,推动这个趋势往前走的还是 AI 入口背后的生态。阿里生态的优势,在这里被放大得很明显,它背后连接的是真实、密集、高频的生活系统。


客观地说,千问这次更新仍然处在邀测和灰度阶段,距离成熟形态还有不少打磨空间。


但它已经表示出一个方向:AI 的角色,正在从工具型应用向统一入口转变。



loading



loading



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询