免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


京东零售总监胡浩:大模型技术在京东供应链的探索和实践

发布日期:2025-10-16 05:25:13 浏览次数: 1518
作者:AI早餐汇

微信搜一搜,关注“AI早餐汇”

推荐语

京东零售总监胡浩揭秘大模型如何重塑供应链,从需求预测到智能决策的全面升级。

核心内容:
1. 大模型与运筹优化的双轮驱动,构建下一代智能供应链
2. 京东千万级SKU数据支撑的时序大模型突破性应用
3. 未来供应链数字人愿景与人类员工协同新模式

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

AI大模型技术席卷各行业的当下,供应链领域也迎来了深刻变革。京东零售智能供应链技术负责人 胡浩 在2025京东全球科技探索者大会上,围绕大模型在京东供应链的应用实践,从需求预测、智能决策两大核心环节,到技术挑战与未来愿景,展开了全面分享,为行业呈现了供应链智能化的清晰路径。 

演讲视频

胡浩的一些精彩观点:

1.双轮驱动定义下一代供应链。大模型与运筹优化非替换而是互补。大模型解决工业建模中模型多、迭代慢、泛化弱的痛点,让供应链更聪明灵活;运筹优化坚守精准求解底线,让决策更高效可靠。两者共同构成下一代智能供应链核心。 

2.大模型实现供应链通用预测。凭借海量跨领域数据预训练,大模型突破传统模型表征能力,无需大量微调即可适配新场景,让通用预测成为可能。 

3.京东数据是时序大模型关键。公开数据集无法发挥大模型规模定律,京东千万级SKU涵盖的多元需求,为百亿级时序大模型提供了核心数据基础。 

4.运筹大模型破解决策难题。结合大模型认知推理与运筹优化精确求解,可实现自动化建模、加速求解,并转化语言提升方案采纳度,破解三大决策难题。

5.未来目标是供应链数字人。京东智能供应链未来愿景是构建自主协同的数字人,形成数字员工与人类员工高度协同的供应链新模式。 



京东零售智能供应链技术负责人 胡浩

一、需求预测:供应链的“发动机”,从传统模型到大模型的跨越 

需求预测是供应链的源头与“发动机”,直接驱动库存计划、采购、履约等下游所有运营动作。目前京东每天需预测千万级SKU的未来需求量,若细化到区域、DC维度,预测量级更是达到亿级别,持续优化预测准确度成为核心工作。 

回顾技术演进,京东的需求预测经历了多代模型迭代: 

- 统计预测阶段:以ARIMA、指数平滑为代表,能有效捕捉简单线性趋势,但面对复杂非线性关系“力不从心”。 

- 机器学习阶段:依靠SVM、XGBOOST等模型,通过特征工程学习到比较复杂的非线性关系,但优质特征工程高度依赖专家经验与海量实验。 

- 深度学习阶段:2017年起,以Transformer为代表的深度模型实现突破,能自动拆解时间序列、完成表征自动化学习,解决了海量特征工程难题,同时在长序列预测上取得了突破进展。 

- 大模型阶段:2022年至今,大模型彻底改变了预测逻辑。过去,京东尝试让销量预测模型迁移到其他零售商时,因模型规模有限,需工程师大量微调;而现在,大模型通过海量跨领域数据预训练,让通用预测成为可能,真正突破了传统模型的表征能力   

以某款手机销量预测为例,传统模型仅依赖历史销量、促销信息,而大模型能整合发布会热度、竞品口碑、消费者购机周期等多元信息,将预测准确度提升到新高度。   

二、时序大模型构建:三大挑战与京东的破局之道 

要打造适配供应链的时序大模型,京东面临数据、架构、幻觉三大核心挑战,且逐一找到了针对性解决方案。   

挑战一:数据规模与质量,决定模型效果的“基石” 

训练百亿级参数的时序大模型,充足且高质量的数据是前提。公开时序数据集普遍存在“量级小、规律性强”的问题,导致大模型的“规模定律”无法发挥,小模型即可满足需求;而京东数据则具备“复杂性、丰富性”优势——千万级SKU涵盖长尾建设性需求与频繁促销的畅销品需求,为模型训练提供了优质样本。 

为进一步提升数据质量,京东构建了包含京东数据、公开数据、合成数据的混合数据集,总规模达218B Token。其中合成数据是关键创新:通过拆解原始数据(基线销量、趋势、周期性)、多维度汇总(区域→DC→全国、SKU→品牌→品类),让模型更快学习数据规律。经过实验验证,三者按7:2:1的配比投入训练,效果最优 

挑战二:模型架构选型,平衡“准确度”与“适配性” 

时序预测的大模型技术路线主要有两种:基于现有大模型微调、从头训练时序大模型。前者需解决时序数据与大模型的适配问题,但受限于大语言模型内在结构,无法很好捕捉时序长期依赖。 

因此京东选择“从头训练”,基于Transformer设计工业时序大模型,采用“Encode only+PatchConv”架构:Encode only用于强化大模型的表征能力与长期模式捕捉能力,PatchConv通过时序分段、转移,更好提取时序特征。同时,京东训练了0.3B、1.6B、6B、10B四种不同尺寸的模型(10B为业界当前最大尺寸时序大模型),平衡性能与精度。 

挑战三:幻觉问题,时序预测的“隐形陷阱” 

相比语言大模型,时序大模型对幻觉的要求更高、判断更难——比如销量突然激增的异常,隐藏在连续时间序列中,难以通过语义理解检测。传统基于人类反馈的强化学习(RLHF)框架在此不适用,核心问题包括:连续时序输出无法用离散奖励函数评估、PPO框架训练收敛慢、幻觉检测需重新设计规则。 

针对这些痛点,京东设计了专属的时序策略优化框架(TPO)简化奖励函数(对预测准确度奖励、对稳定性惩罚),大幅提升训练效率与预测稳定性。实践显示,加入TPO后,模型训练效率提升3倍,预测准确度在基础提升10个点的前提下,进一步再提升4-5个点。 

目前,名为“OxygenForecast”的时序大模型已正式投入京东生产系统,支持百万级商品自动化补货,显著提升供应链计划与库存运营准确性;在电力、天气、交通等七大公开数据集测试中,无论Zero Shot还是微调后效果,均大幅领先行业标杆模型。 

三、智能决策:运筹大模型破解“建模难、求解难、解释难” 

需求预测之后,供应链的智能决策同样关键。过去,京东面对仓网规划、库存布局等不同场景,需建立高度细分的模型,过程中面临三大难题:建模难、求解难、解释难。 

- 求解难:京东有1000万+SKU、1600多个仓库,不同场景(如仓网规划需考虑节点层级、线路,目标是降本提效;库存布局需关注单量、SKU规模,目标是快周转、高现货)的约束条件差异大,导致问题复杂度飙升。 

- 解释难:运筹优化模型求解后,需将数学语言转化为业务语言(如“为何从这个仓库发货”、“成本节约来自哪里”),帮助业务人员理解并采纳方案,这一过程往往耗时费力。 

大模型与运筹优化的结合,催生出了“运筹大模型”——通过大模型的认知推理能力,搭配运筹优化的精确求解能力,实现自动化建模、加速求解、方案自解释,完美破解三大难题。 

针对不同类型的决策问题,京东运筹大模型采取了差异化策略: 

- 易解问题:构建“问题-数学模型-求解代码”的PMPMC数据集,基于大模型微调后实现自动化求解。测试显示,常规线性规划问题的求解准确度已达93%。 

- 难解问题:聚焦仓库选品调拨、凑车等9类供应链垂直场景,在PMC模型基础上增加“问题类型标签”(如大规模信息问题),让大模型学习用启发式方法求解。目前已完成100次以上规模化解题。 

- 解释性问题:搭建完整解释性框架,大模型先梳理优化模型的决策逻辑,再用分层框架拆解复杂问题,最后通过多目标量化(时效、成本、拆单等指标对业务的影响),让业务人员不仅拿到方案,更理解“为何是这个方案”。 

四、未来愿景:从“精确求解”到“超级智能体”,构建供应链数字人 

胡浩强调,大模型给京东智能供应链带来的变革,远不止预测与决策的优化。当前,京东智能供应链正从“基于运筹优化的精确求解阶段”迈向“以大模型为核心的认知理解阶段”,最终将走向“超级智能体自主决策阶段”   

这一演进的愿景,是希望构建“自主协同的供应链数字人”——未来,供应链不再依赖零散的补货建议或配置下单,而是拥有像“采购专员”一样的数字员工: 

- 能自主完成库存布局、主动发起采购、持续优选周转效率; 

- 可实时感知库存波动、趋势变化、流量起伏与市场动态; 

- 能接收业务人员指令,自动完成需求预测、采购下单、供应商跟单; 

- 遇到问题时,可主动发起协同、升级流程以解决问题。 

届时,供应链将进入“人类员工与数字员工高度协同”的新时代,无数智能体相互配合,推动供应链效率与灵活性实现质的飞跃。 

从时序大模型革新需求预测,到运筹大模型优化智能决策,再到对供应链数字人的未来构想,京东用实践证明:大模型不是对传统供应链技术的替代,而是与运筹优化等技术“优势互补、双轮驱动”的核心力量,它正在重新定义供应链的智能化边界,为行业提供了可借鉴的宝贵经验。 


相关阅读:

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询