免费POC,零成本试错

AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


LLM 在腾讯游戏数据分析的实战

发布日期:2025-08-16 18:18:07 浏览次数: 1521
作者:DataFunSummit

微信搜一搜,关注“DataFunSummit”

推荐语

腾讯游戏数据团队揭秘LLM如何赋能千万级DAU游戏的数据分析,从数据提取到业务落地的全链路实战经验。

核心内容:
1. LLM在游戏数据分析中的三大应用场景:数据提取、分析链路构建、业务落地
2. AI代理的模块化架构设计:记忆系统、推理执行系统、环境感知系统
3. 腾讯游戏在千万级DAU产品中的LLM实战案例与未来展望

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

导读 大语言模型(LLM)的发展正在改变数据分析的方式。从传统的代码驱动查询,到自然语言直接交互,LLM 赋能的“AI+BI”能够提供更为智能、灵活的高的数据分析体验,大幅提升工作效率。
在游戏行业,这一变革也正在发生。游戏业务数据量庞大且实时性要求高,分析场景复杂多变,从玩家行为分析到运营活动效果评估,都需要依赖大量的数据分析作为支撑,“AI+BI”也自然成为了一个重点方向。然而,在实际业务场景中,LLM 处理复杂数据需求的能力以及交付结果的准确性,仍旧面临诸多挑战。
腾讯游戏数据团队从早期便开始了 LLM 在数据分析工作上的应用探索,在服务腾讯游戏旗下多款千万级 DAU 头部产品的过程中,积累了大量实战经验和技术方法论。在近期举办的“DataFun AI+BI 智能驱动峰会”上,腾讯游戏数据技术负责人刘岩围绕 LLM 在游戏数据分析中的实战展开了分享,涵盖数据提取、分析链路构建及业务落地等关键环节。


内容目录:

1. 基于大模型的数据提取

2. 从数据提取到数据分析

3. 从工程验证到业务应用

4. 未来展望

分享嘉宾|腾讯游戏数据技术负责人 刘岩 

编辑整理|DataFun志愿者 峰宾

内容校对|郭慧敏

出品社区|DataFun


01
基于大模型的数据提取

1. 数据分析的流程

游戏精细化运营时代,数据分析的重要性在不断提升游戏数据分析常见场景主要包括可视化经营分析、明细数据提取,到归因和预测因此我们探索主要方向也是 AI 这几个方向上的提效赋能

数据分析的流程体系本质都是这几个步骤:第一,理解业务需求;第二,理解数据;第三,准备数据,对数据做清洗加工;第四,数据建模;第五,验证数据并最终交付。这个流程是固定不变的。如何让 AI 参与到这个流程的各个步骤里?AI 的能力边界是什么呢?这些便是我们工作的重点。

2. AI 代理的模块化架构

AI 代理的模块化架构可划分为记忆系统、推理执行系统及环境感知系统三大核心:

(1)记忆系统

  • 参数记忆:基于模型训练参数构建的底层能力,包含预训练模型固有的知识与技能(如 DeepSeek、OpenAI 等大模型的基础能力)

  • 工作记忆:通过提示词工程实现的即时任务指令,当前多数 Agent 系统通过提示词直接调用模型完成任务

  • 语义记忆:通过构建领域知识库、语义资产库及上下文扩展机制,增强模型对专业领域(如 Text2SQL)的语义理解与知识调用能力

  • 情景记忆:记录用户交互历史及应用环境状态,包含多轮对话记录与场景上下文信息

(2)推理执行系统

采用 ReAct 循环机制,集成模型的推理能力与工具调用能力:

  • 逻辑推理:基于当前上下文与任务目标进行多步骤推理

  • 工具调度:动态选择适配的外部工具与知识源

  • 自适应优化:根据任务进展实时调整推理路径

(3)环境感知系统

构建多模态感知能力,实现环境交互验证:

  • 界面感知:通过浏览器自动化等技术实现网页操作的环境感知(如 Manus 的订票场景实现)

  • 数据感知:建立输入输出校验机制,确保数据操作符合业务规则与预期结果

该架构通过模块化设计实现智能体的认知闭环,参数记忆与工作记忆构成基础认知层,语义记忆与情景记忆构建知识上下文,推理系统驱动任务执行,环境感知系统则通过实时交互验证确保行动的准确性和可靠性,共同构成具备自主决策能力的智能代理系统。

3. 数据工程应用

在数据提取场景中,核心挑战在于 Text2SQL(文本到结构化查询语言)生成的准确性。当前主流模型测评数据(如 Spider 2.0BIRD)的性能表现不尽人意:在理想条件下,表现优异的模型可达到约 70% 的 SQL 生成准确率尤其在处理复杂查询时准确率显著下降无法满足实际业务场景需求

针对这个问题通常通过构建新一代 AI 数据资产人机协同的 Workflow两种方式进行优化人机协同的 Workflow方面我们将数据提取流程进行精细化拆解,明确界定人工介入环节与智能代理(Agent)的执行边界;通过需构建多轮交互机制,持续的信息确认与反馈迭代替代单一查询指令,以提升复杂场景下的任务完成质量。

我们构建了新一代 AI 数据资产这套资产体系核心评价标准聚焦于AI 可理解性通过系统化的知识表征与语义建模,确保各类数据资产(包括但不限于结构化数据、业务规则及领域知识)能够被 AI 系统有效解析与应用。这要求资产体系在构建过程中遵循语义标准化原则,通过元数据标注、概念图谱构建及语义关联建模等技术手段,实现从数据存储到知识表达的范式转换,从而为 AI 系统的智能推理与决策提供可靠的支撑。

基于 AI 数据资产腾讯游戏数据通过工程化方法提升 AI 复杂需求交付准确率举例来说和数据工程人员工作流程一样,大模型接到一个复杂的提数需求第一步先把这个复杂的需求拆解成若干个需求第二就是根据每个需求生成 SQL这一步会跟 AI 数据资产进行联动第三步则是资产沉淀每个需求对应的资产和特征,通过子需求进一步拆散,这样可以沉淀更细粒度的资产,下次会被其他需求用到。

通过技术方案腾讯游戏数据团队的 AI 游戏数据提取在场景下能做到 90准确已经达到实际业务应用的及格线


扫码入群参与讨论



✅ 对分享有疑问?群里问!

✅ 有心得体会想分享?群里聊!

✅ 想深入某个点?群里讨论!

扫码入群参与讨论

02

从数据提取到数据分析

回到整个数据分析流程来看,数据提取只能帮助业务准备基础数据到了数据分析解读环节之前一直没有合适开源模型可以完成因此业务拿到数据后还是需要人工进行分析——然而今年年初 DeepSeek 的发布,让事情有了新的转机。

1. DeepSeek-R1 带来的变化

上图所示左边是闭源模型给到企业业务数据情况下可以安全使用的能力资产只能给一些源数据专业术语和语义资产推理上也只能做一些代码生成的推理在工作流上,也无法选择 MCP 的协议或者 ReAct 模式;在应用上,只能止步于找资产写 SQL 这样的应用

上图右边显示了 DeepSeek-R带来的变化可以看到开源模型部署到本地打开了很多想象空间同时因为 DeepSeek 开源了自己的训练方法我们提供了很有价值的技术思路提升了我们对于做游戏领域本地小模型的信心,并且也获得了一些成果。我们可以把数据给开源模型,做更复杂的 WorkFlow 架构以及数据总结框架分析探索研究更多的应用。

2. AI 原生数据分析

基于 Agent 或者 ReAct 架构有一个理想数据分析状态用户提出问题,做完意图识别,直接交给模型,让模型去做流程编排,自主选择工具、选择资源、选择 Agent一步一步自动完成整个任务

然而这一理想状态也面临现实挑战大模型在 BFCLTau-bench 基准测试单次任务执行时准确率能达到 70%如果要求连续 尝试均保持正确结果准确率骤降至 20-30%这也揭示了当前 Agent 架构在复杂任务执行中的核心问题:在复杂任务执行时存在准确性与一致性矛盾。这一问题在需要严格保证结果一致性的数据应用场景中,单纯依赖当前 Agent 架构存在显著风险,必须谨慎评估其适用性。

03

从工程验证到业务应用

1. AI 流程架构的选择

如今主流的 WorkFlow 架构下图这四种

第一种是经典的 Agent 架构,就是让模型来做即时的实时推理这个架构最大的问题是回溯能力,也就是模型对于自己出错问题无法追溯,比如第 5 步错了,模型不知道是因为第 4 步导致可以说现在 Agent 架构最致命的弱点。

第二种是在即时循环的基础上进行,在任务来了之后,先做一个 todo,然后模型按照计划一步步执行。

第三种是基于决策树的深度搜索,简单来说是预先给模型一些规则,让模型在这些规则的基础上自主规划流程。这样的话,稳定性就会提高,但是灵活性会丧失。

第四种是纯 WorkFlow 引擎,用工作流引擎把每一步执行什么都规定好一个任务来了,就按照这个步骤去调 Agent 执行。

这四种模式可能会永远并行下去,在做整个应用的模型架构时,最终都呈现混合架构,在不同的场景选择不同的流程方式。

那么腾讯游戏数据又是怎么做的呢前文提到数据分析的流程固定业务理解-数据理解-数据准备-建立模型-模型评估五个步骤我们认为做 Agent 应用期望模型一步到位完成这件事并不现实应当从“人是怎么做的”这个角度出发来规划工作流程。基于这个理念我们搭建了下图这个流程架构

数据准备的过程相对来说是固定的理解需求、找数、取数,然后最终看数据和数据质量是否合适这样的规则可以提前预制给模型的,用预制结构加上节点 MC自主调用,这样既能保证准确性又有一定的灵活性。

数据分析过程涉及相关性、因果性分析及分类,需根据需求灵活选择算法与模型。其核心流程为:先通过模型制定分析计划并执行;再基于前序输出与原始数据进行评估模型自主选择合适算法,形成基于 ReAct 架构的分步执行与反馈机制。

整个数据分析的体系,我们在不同的流程阶段不同的架构技术进行组合使用让大模型在每一个主流程里,根据不同的问题,单节点去选择还需要调用哪些外部能力来完成流程协作。

2. 从模型能力到工程能力

从传统 Agent 架构向 Agent AI 体系过渡的过程中,安全与架构体系发生了根本性变革主要体现在两个关键维度:其一是数据作为核心输入要素直接作用于模型训练,其二是架构体系从单一本地模型向分布式混合架构演进。这要求我们必须重新审视安全风险防控体系:如何确保数据使用的可信性、构建可验证的安全机制、建立模型行为的可度量标准,成为架构设计的核心命题。

对于业务应用而言,以下两个关键问题始终是上线审核的前置条件:

  • 数据权限管理是否完善?(包括数据访问控制、权限隔离、审计追踪等机制)

  • 数据准确性是否有保障?(涵盖数据清洗、验证、溯源等质量保障体系)

游戏知识库 MCP为例阐述一下如何通过工程化方式保证召回准确

在 RAG 方面简单做法把游戏官网的数据爬下来放到本地,去做 Embedding召回做 Rerank,甚至做知识图谱。但是这样无法解决 Embedding 和 Rerank 的精度问题。我们实践当中发现如果只用模型算法技术来解决问题是不够的因此我们游戏知识库把一部分数据结构化解析,例如道具信息,时间信息,活动信息结构化存储除了向量召回需要标量召回

例如用户发起一个问题,“SS31 赛季 M416 相比上个赛季有什么变化?”解决这个问题,首先需要先得到赛季时间,确保搜索到的所有知识都在这个赛季里。如果用向量查询只搜索 M416,就会得到很多与这两个赛季无关的东西这样最终提供给业务的数据就是不准确的。在得到赛季时间之后,去找到想要的实体,在实体里根据标量查询的信息,再去做向量查询,这是一个整体的逻辑。

3. 从工程到应用的要点

第一,速度和稳定性是体验的核心

腾讯游戏数据团队在实践中发现,我们选择模型时候考虑安全性能速度成本因素,而是应当根据需求选用最优方案,也就是选择最合适的模型

举个真实场景的例子,在用户发起一次 query 之后,我们需要给用户回答,在这里我们意图识别模型使用 DeepSeek-R1,问题改写使用 DeepSeek-v3,知识库检索用的是 qwen3-235b,时间范围识别模型用的 GPT-4o。只是识别用户意图环节我们用了这些 Agent尽量保证每个 Agent 都选用性价比最高的模型。

第二,准确性是用起来的底线

大模型的幻觉是一个绕不过去的坎针对这个要点,业界一个主流方案做一个校验 Agent。虽然校验 Agent 也会幻觉相比输出分析结论的 Agent校验 Agent 关注重点数据的准确性这样缓解幻觉的问题此外校验过程也是拆分步骤进行不需要一次校验太多分片校验最终结果返回也能提升准确性

第三,场景定制快速响应长尾需求

一些业务团队会有非常长尾需求,希望获得更精准的数据,这些长尾需求需求流程通常非常固定针对这种问题,腾讯游戏数据会使用 AIFlow 来定制工作流,直接通过AI+搭建固定流程的方式来解决这种问题。


扫码入群参与讨论



✅ 对分享有疑问?群里问!

✅ 有心得体会想分享?群里聊!

✅ 想深入某个点?群里讨论!

扫码入群参与讨论

04

未来展望

最后,再分享一下腾讯游戏数据正在做的事情我们技术的主要方向以记忆共享与用户习惯为基础提升交互效率,结合领域模型与本地化小模型优化任务精度,最终通过多模态感知能力强化数据智能分析的可靠性。

1. 记忆管理与个性化响应

  • 统一管理企业内各类 AI 应用的历史对话数据,实现记忆共享,避免重复流程。

  • 通过分析用户历史习惯与意图,优化 AI 响应方式:简单问题简洁回答,复杂任务结合本地训练的小模型(如游戏策略规划)进行深度推理,弥补大模型局限性。

  • 历史记忆数据将作为关键语料,用于持续优化模型能力。

2. 领域模型优化

采用类似 DeepSeek 的训练方法(SFT、RL),若效果不足则对小模型补充领域知识预训练,推动模型快速落地应用。

3. 感知能力强化

构建多模态感知能力,使模型能理解数据、代码、图表的准确性与逻辑关联性(如判断结论可靠性、图文匹配合理性),为数据分析场景提供更可靠的决策支持。

4. 延展阅读推荐

腾讯游戏数据团队发布了《大模型工程化:大模型驱动下的数据体系》技术书籍,总结沉淀腾讯游戏数据工作的实践经验及技术方法论,系统阐述了如何利用大模型技术打造高效的数据资产体系,为大模型时代的企业新基建和智能化转型提供参考。

以上就是本次分享的内容,谢谢大家。

图片


分享嘉宾

INTRODUCTION


图片

刘岩

图片

腾讯游戏数据技术负责人

图片

数据分析主管

图片

现任腾讯游戏数据技术负责人、资深专家,负责通过资产体系、技术平台、AI、 湖仓等技术降低游戏业务使用数据门槛,提升数据工作的效率,以数据驱动业务增长。

往期推荐


进群免费领取电子书《数据安全治理实践》

通用增量计算:架构、原理与最佳实践介绍

淘天搜推基于Apache Fluss的实时数仓落地实践

数据要素如何释放价值?中电数据首席科学家深度分享

蚂蚁集团副总裁领衔!揭秘数据要素流通的硬核技术

硬核拆解:智源研究院如何攻克机器人可靠性 + 格灵深瞳突破CLIP局限 + 汽车之家业务融合秘籍

AgentCore:重新定义AI Agent部署和生产的神器!

破解Agentic AI落地难题!蚂蚁集团、JetBrains、海管家的技术领袖揭晓答案

AI驱动下的数据新基建:腾讯游戏数据资产治理与湖仓架构革新

中国Scrum大会议程全览,本月早鸟团购双重优惠中!

点个在看你最好看

SPRING HAS ARRIVED

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询