免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

美团 LongCat Interaction 团队发布大模型交互系统技术报告 WOWService

发布日期:2025-11-20 21:10:49 浏览次数: 1539
作者:美团技术团队

微信搜一搜,关注“美团技术团队”

推荐语

美团LongCat团队发布WOWService技术报告,破解大模型在本地生活服务领域的落地难题,实现体验与效率的极致平衡。

核心内容:
1. WOWService四大核心技术框架解析
2. 系统在美团智能客服等业务场景的实际应用效果
3. 数据与知识双驱动机制带来的业务进化

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


在本地生活服务领域,大模型技术落地正遭遇 “三重困境”:通用能力与领域需求难以适配,复杂场景下服务可靠性与个性化无法兼顾,高昂的数据成本与漫长的训练周期进一步增加了开发难度。更关键的是,行业内缺乏可复用的业务适配框架与真实场景优化方案,导致技术落地效率较低。

如何打破僵局,实现 “体验与效率” 的极致平衡?成为了行业共同面临的难题。

基于此,结合美团自身在智能客服、多业务场景落地的实战经验,LongCat团队正式发布——「WOWService 大模型交互系统技术报告」,深度拆解了 「数据与知识双驱动」「自我优化训练」「四阶段训练流水线」「多 Agent 协同」 四大核心技术框架,希望对行业发展提供参考与启发。

▶ 技术报告:https://arxiv.org/pdf/2510.13291


WOWService系统融合多智能体协同、强化学习、领域知识增强等前沿技术,显著提升了推理能力和业务场景的专业度。通过人机协同标注、模型自我批判强化及知识重写,WOWService在复杂指令处理和多任务场景下表现出更强的灵活性与深度。仅需10%的小模型标注数据即可达到传统方案相当的效果,有效降低了训练成本和周期。

在实际业务应用方面,WOWService已经主要落地在美团智能客服系统,并广泛覆盖美团内部的数十个业务场景,构建了高质量海量多轮对话数据,并完善了数据构建体系。系统通过持续优化和创新,不仅显著提升了用户满意度和业务运营效率,还在11项关键指标上全面超越了Base模型,充分展现了其在实际业务场景中的卓越优势。WOWService的落地应用有效助力美团实现智能化服务升级,推动了企业在多元业务场景下的持续创新与高效运营。


WOWService智能交互系统通过数据与知识双驱动机制,自我优化训练机制、四阶段多层次训练流程、多Agent协同机制和人机协同评估体系,深度融合业务知识与真实交互数据,实现模型自我进化和高质量服务落地,有效提升知识遵循、业务合规性和用户体验。


数据与知识双驱动铸就业务场景全域进化引擎

WOWService通过“数据驱动与知识驱动相结合”的混合策略,将结构化业务知识(如规则库、流程规范等)与大规模真实交互数据深度融合,优化知识与数据集的比例,从而在模型训练过程中强化对业务规则和知识点的遵循能力。系统在混合驱动流程中应用强化学习等技术,进一步提升模型对基于知识规则的依从性,使智能交互系统不仅能够在常规场景下准确响应,还能在复杂、多变的业务环境中保持合规性和高服务质量。


自我优化训练造就智能交互自我进化熔炉

自我优化训练(SRT)机制通过自动筛选线上服务日志中的高质量服务案例,选取优秀表现作为正样本补充训练集,从而提升模型在真实业务场景下的服务能力。对于实际业务中表现不佳的负样本,SRT能够自动进行归因分析,并对原始对话进行重写,生成偏好对比数据,用于训练模型识别并规避低质量输出,推动模型持续进化。依托线上服务日志体系,SRT实现对对话数据的自动采集、筛选和评估,构建自我进化的数据闭环,通过不断迭代优化训练集,持续提升智能交互模型的服务能力和用户体验。



四阶段训练驱动交互场景系统化升级

为持续提升智能交互系统在复杂、多变业务场景下的适应能力与服务质量,WOWService在高质量数据与知识基础上,构建了涵盖持续预训练(CPT)、有监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL)的四阶段多层次训练流水线。各阶段协同配合,首先通过持续预训练夯实模型的通用与领域能力,随后以有监督微调高效适配具体业务风格,继而利用直接偏好优化强化模型对用户偏好和个性化需求的响应,最终借助强化学习进一步提升模型在复杂场景下的推理能力和业务表现。该多层次训练体系实现了模型能力的持续进化与闭环优化,确保智能交互系统在实际应用中具备强大的业务适配性和持续迭代能力。



在持续预训练阶段,通过引入大规模用户交互数据,系统显著提升了大语言模型在智能交互领域的专业能力,并兼顾模型的通用性。此阶段重点解决了通用能力退化及领域数据质量不高的问题,采用自适应数据混合优化和高效数据处理流程,实现领域特性与通用能力的最佳平衡。

监督微调阶段则聚焦于通过高质量、轻量级数据,将基础模型与领域知识及智能交互风格高效对齐。融合数据驱动与知识驱动方法,显著提升了模型在复杂业务场景下的响应能力与合规性。



在偏好学习阶段,通过引入人工反馈和直接偏好优化技术,系统对大语言模型的输出进行优化,使其更贴近人类偏好和真实业务需求。



强化学习阶段通过“数据+知识”混合驱动、精细化奖励机制和多维度对话评估,有效提升了模型在复杂业务场景下的知识遵循、对话质量和人性化表达能力。


多Agent协同机制塑造场景穿梭智能协同工厂

为解决单一大模型在复杂多变业务场景下难以全面满足多样化需求的问题,WOWService引入了多Agent协同机制,通过主智能体与多个专用子智能体的分工合作,显著提升了系统的业务适应性、服务合规性和用户体验。

多Agent架构采用层次化设计,主智能体负责全局对话控制与决策,根据实时上下文动态调用各类专用子智能体(如外呼、主动协作、多模态理解等),并将其输出整合进最终响应。这一“Agents-as-Tools”范式兼顾了灵活性与稳定性:主智能体持续与用户保持连贯交互,子智能体则作为可调用工具按需执行特定任务,避免了传统流程交接导致的割裂和开发负担。

此外,系统融合了“Handoff”模式,允许在必要时将任务及上下文一键转交给其他智能体,实现高可靠性和透明性。主智能体根据实时信号和对话语境灵活采纳子智能体输出,确保关键信号只在合适时机被采纳与执行,有效提升了系统的交互自然性和服务质量。以主动协作Agent为例,其智能交互系统能够通过主动意图挖掘与多场景适配,智能识别和确认用户需求,实现自动化场景切换,从而显著提升对话效率和整体用户体验。总体来看,多Agent协同机制通过主-子智能体的分工、动态调用与信息整合,构建了高效、灵活且可扩展的智能交互服务体系,为复杂业务场景下的智能服务落地提供了坚实支撑。




在实际业务场景的评估中,WOWService框架在11项关键指标上全面超越了基础模型(Base Model),展现出卓越的业务能力和用户体验提升。具体来看,WOWService在重复率(RR)、方案有效率(SER)、排队率(QR)、满分率(FSR)、平均F1分数(AVG_F1)、召回频率(RF)、方案准确率(SR_Acc)、可用性率(UR)以及领域准确率(DS_Acc)等指标上均取得了明显优势,在两个用户满意度指标USM1、USM2上也获得了大幅度改善。无论是自动化服务能力、业务闭环效率,还是多场景适配和智能推理水平,WOWService都实现了全方位的突破,为本地生活服务的智能交互系统规模化落地和持续优化提供了坚实保障。


「WOWService」在本地生活领域将数据与知识双驱动、自我优化训练(SRT)、多Agent协同等技术转化为有效方案,打通了技术研发到业务价值的转化通路。它以“数据 + 知识”破解领域适配难题,SRT机制用业务日志构建进化闭环,将标注成本压至传统方案10%,四阶段训练流水线与多Agent协同形成高效技术范式。

展望未来,WOWService框架不仅将持续增强技术能力,还将拓展应用边界,深化与用户日常生活的融合,通过智能体强化学习赋能工具使用,推进多智能体协作与多模态融合。最终,我们将打造真正个性化、以用户为中心的助手,推动技术与用户体验的深度融合。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询