支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


网易数帆ChatBI与领域模型方案

发布日期:2025-05-29 18:25:00 浏览次数: 1936 作者:DataFunSummit
推荐语

网易数帆ChatBI的产品剖析,探索数据服务领域的技术革新。

核心内容:
1. ChatBI产品定位与市场价值
2. ChatBI核心功能与技术亮点
3. ChatBI竞争优势与差异化

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

导读 本次分享聚焦网易数帆ChatBI产品的技术分析。深入探讨了其双轮驱动技术生态,默认搭载自研大模型,还支持对接主流AI引擎,形成“私有+开放”架构。分层技术架构设计底层适配多样模型,中层集成核心技术模块,业务层提升业务理解能力,数据层支撑AI+BI应用。同时,提出可信AI的四大解决思路,保障数据准确性与模型输出可信度。通过对这些技术的剖析,展现了ChatBI在数据服务领域的技术实力与创新优势。

今天的介绍会围绕下面六点展开:


1. ChatBl产品定位与市场价值

2. ChatBI核心功能与技术亮点

3. ChatBI竞争优势与差异化

4. ChatBl应用场景与客户案例

分享嘉宾|杨海水 网易数帆,售前与解决方案工程师

编辑整理|王红雨

内容校对|郭慧敏

出品社区|DataFun


网易数帆作为网易面向企业级(To B)数据服务领域的核心品牌,专注于构建底层数据底座及数据开发治理平台。在大数据与人工智能深度融合的行业趋势下,该品牌推出基于有数BI与大模型技术整合的ChatBI产品,旨在解决传统数据服务场景中的痛点问题。

例如,在金融行业数字化建设进程中,银行、证券、基金等机构已普遍应用报表BI工具,但仍面临数据获取效率低下的困境。长尾取数需求因人力不足、流程复杂等因素,导致数据交付存在显著时间差,从需求提出到结果反馈常需数天时间,难以满足业务快速决策的需求。

01

ChatBl产品定位与市场价值

1. 数据服务模式从“人适应工具”到“工具理解人”

随着大模型技术的发展,数据服务模式正经历从“人适应工具”到“工具理解人”的范式转变。

ChatBI产品基于这一趋势,提出将报表工具升级为智能代理(Agent)的设计理念。该产品不仅支持自然语言驱动的数据查询,更致力于实现报表托管功能:以风控场景为例,智能Agent可自动监测并解读数十张每日风控报表,通过数据分析提供深度洞察与决策建议,改变传统人工审阅报表的低效模式,推动数据服务从被动响应向主动智能服务转型。

这一产品创新标志着数据服务工具从功能性应用向智能化服务的演进,为企业级数据应用场景提供了新的解决方案,有望提升数据利用效率与业务决策的时效性。

2. ChatBI产品在设计与功能的四大核心特性

其一,多模型支持的自然语言交互架构。产品以网易自研自然语言模型为基础,同时支持对接DeepSeek、科大讯飞、千问等主流大模型,构建灵活可扩展的技术底座。该架构实现自然语言文本及语音的多模态交互,并支持多轮对话,使用户能够以类日常交流的方式与系统交互。

 其二,深度数据分析与解读能力。依托大模型的语义理解和分析能力,ChatBI可对用户报表数据及数据模型执行多元分析任务,涵盖数据归因、趋势预测、同比/环比计算、报表解读等功能。通过自然语言交互,用户可快速获取数据洞察,显著提升数据分析效率。

其三,强安全性与私有化部署机制。鉴于数据业务的严谨性和安全性要求,ChatBI建立了完善的安全保障体系。通过用户权限隔离机制,确保数据访问的合规性;支持私有化部署模式,满足企业对数据主权和安全性的严格要求;同时配备高性能数据处理引擎,保障大规模数据场景下的流畅运行。

其四,智能决策辅助功能。以财务场景为例,ChatBI的智能代理(Agent)可自动执行图表分析,识别数据异常并提供决策建议。该功能将传统BI工具的被动数据展示升级为主动智能决策支持,契合企业数字化转型对数据价值深度挖掘的需求。

上述特性共同构成ChatBI的核心竞争力,有效解决传统BI工具在交互效率、分析深度及数据安全等方面的痛点,推动企业数据服务向智能化、人性化方向发展。

02

ChatBI的核心功能与技术亮点

1. 双轮驱动技术生态

ChatBI构建了免轮询的双轮驱动技术体系。一方面,其默认搭载基于网易自研的大模型,该模型以网易基础模型为框架,通过30余万条内部数据集进行针对性训练与微调,在自然语言转SQL(NL2SQL)能力上表现卓越,经历史评测验证,其NL2SQL性能超越GPT-4、DeepSeek等主流模型。另一方面,为满足多样化需求,ChatBI支持对接DeepSeek、通义千问、文心一言、科大讯飞星火等主流AI引擎,形成“私有化+开放”的双轮技术生态,为用户提供灵活选择。

2. 分层技术架构设计

ChatBI的技术架构呈现分层设计特点。底层可适配自研或第三方大模型;中层集成推理算法、自然语言转SQL(NL2SQL)、意图识别、检索增强(RAG)、字段压缩及小样本学习等核心技术模块;业务层通过提示词干预和轻量化业务知识训练,提升模型对特定业务场景的理解能力;数据层则基于企业现有数据仓库或治理后的数据,支撑AI+BI应用,实现智能问答、归因分析等功能。

3. 可信AI的实现路径

针对大模型普遍存在的“幻觉”问题与数据准确性需求间的矛盾,ChatBI提出可信AI的四大解决思路:其一,需求可理解,将用户问题转化为逻辑清晰的解释性过程,而非简单输出结果;其二,过程可解释,确保模型输出结果的透明性,避免“黑盒”效应;其三,结果可修正,允许用户对错误解释或结果进行反馈与修正;其四,能力可进化,通过用户使用过程中的持续交互与强化学习,优化产品功能与运营策略,实现ChatBI的动态迭代与可信应用。

① 需求可理解:自然语言精准解析与透明化反馈

ChatBI依托大模型的语义理解能力,将用户模糊的自然语言提问转化为结构化数据需求。以“上半年华北地区每个月的利润”查询为例,模型自动完成三层次解析:时间解析,基于提问语境确定具体周期(如2023年1月1日-6月30日);指标解析,识别“利润”为核心统计对象;条件解析,明确“华北地区”地理范围与“升序排列”展示要求。解析过程以文本形式反馈给用户,通过可视化的需求拆解逻辑,增强用户对数据结果的信任度。

 过程可验证:双态SQL输出与全链路追溯

为满足业务人员与IT人员的差异化需求,ChatBI构建逻辑SQL与物理SQL双态验证机制。当用户提出“近三年利润排名前三的省份”时,模型优先生成逻辑SQL语句,呈现数据查询的抽象逻辑框架,便于IT人员快速校验语法与语义准确性。经确认后,逻辑SQL被转化为物理SQL,驱动底层BI工具执行数据检索、计算与可视化渲染。该机制通过开放SQL代码层,实现从问题解析到结果呈现的全流程透明化,避免黑盒操作风险。

③ 用户可干预:交互式动态调整机制

ChatBI支持用户对分析过程的深度干预。当用户对“2023年超市总利润柱状图(按利润额降序)”的呈现方式存在异议时,可直接修改解释文本中的参数(如调整排序规则、统计维度),系统将实时响应并重新生成查询逻辑。这种交互式设计打破传统BI工具的单向输出模式,使用户能够根据业务需求灵活定制分析流程,提升数据结果的适配性与准确性。

 产品可运营:智能平台驱动持续优化

ChatBI配套的运营平台通过知识库管理、交互数据利用与全流程优化三大核心功能实现产品迭代升级。

  • 知识库管理:支持企业导入行业术语、业务规则等领域知识,使模型快速学习特定场景下的数据分析逻辑,提升专业问题解答能力。

  • 交互数据利用:捕捉用户对问答结果的交互行为(如点赞、标记错误),运营人员可据此对模型进行针对性微调,形成“用户反馈-模型优化”的闭环迭代。

  • 全流程优化:通过元数据治理、小样本训练、问答库维护等手段,结合前期问题测试与商业化场景验证(当前业务准确率超90%),持续提升模型性能与服务稳定性,保障产品长期价值。

03

ChatBI产品核心亮点与竞争优势

1. 智能可视化与交互分析能力

ChatBI深度融合BI工具特性,构建多维度数据呈现与交互体系:

  • 智能图表生成:支持20余种可视化图表类型,通过语义解析自动匹配最佳图表形式(如趋势类问题匹配折线图,占比类问题推荐饼状图),并提供图表切换、收藏、导出及解读功能,帮助用户快速理解数据分布特征。

  • 多轮对话分析:区别于通用大模型,ChatBI设置“继续追问”交互按钮,用户可基于上一轮分析结果(如“2023年利润TOP1产品”),无缝发起延伸查询(如“TOP5”“TOP10”),实现连贯的数据分析流程。

  • 时序预测

针对趋势类问题,系统在输出结果的同时提供时序预测与归因分析能力。用户通过点击预测按钮,可基于历史数据生成未来趋势推演。

  • 归因引擎

归因分析则自动拆解指标变化原因,定位关键影响因子与维度,辅助决策优化。

2. 深度交互与灵活操作功能

ChatBI支持丰富的图表交互与计算能力,满足复杂业务分析需求:

  • 基础交互操作:涵盖数据下钻、上卷、同比环比计算、行列转换及交叉表展示等传统BI功能,实现数据的多维度探索。

  • 异常解读与归因:针对指标类查询(如销售额下降),系统自动生成同比环比分析,并支持用户点击触发深度归因,精准定位数据波动的根源维度。

3. 差异化竞争优势

ChatBI在技术与应用层面形成显著竞争壁垒:

  • 私有化安全部署:以私有化部署为主,确保企业数据不出域,满足高安全需求场景。

  • 高效查询性能:大模型生成SQL速度控制在5秒内,较部分竞品(如DeepSeek)具备更快的响应效率。

  • 轻量化资源适配:对GPU资源要求较低,仅需32GB显存的主流显卡(如4090、H100)即可运行,相比满血版大模型大幅降低部署成本。

  • 稳定问答输出:经内部测试与客户验证,在数据类问题场景下,ChatBI输出结果稳定性显著优于部分竞品,有效减少“幻觉”问题导致的答案偏差。

4. 开放集成与生态兼容

ChatBI具备高度开放的生态集成能力:

  • 权限与账号互通:支持对接企业现有权限体系,实现用户账号数据无缝同步,保障数据访问合规性。

  • 数据与模型兼容:兼容第三方数据模型,并可与主流国产BI工具(如帆软、QBI)实现对接,保护企业现有数据资产投入。

  • 大模型灵活适配:支持集成DeepSeek、通义千问等主流大模型,满足不同用户的技术选型需求。

  • 应用场景拓展:通过API接口开放数据能力,支持GUI界面个性化定制,并可无缝嵌入钉钉、企业微信、飞书等IM系统,实现数据分析能力的多场景延伸。

5. AR辅助分析插件的功能特性

本系统通过嵌入AR(Analysis Review)辅助分析插件,实现对数据报表的智能化解读。用户点击报表中的AR按钮,即可触发对底层数据模型的自动解析。系统默认提供预设的Prompt引导分析,同时支持用户自由提问,涵盖数据趋势预测、增长潜力评估、决策建议生成等功能。这种交互式设计赋予用户灵活的分析能力,构建了插件化、可扩展的工具体系。

6. 多端互通

系统支持PC端与移动端的多端互通,典型应用场景如某烟草客户案例所示。移动端集成网易有道语音服务,用户可通过语音输入将自然语言问题转换为文本指令,系统实时生成分析结果,显著提升数据交互效率。在集成兼容性方面,已实现钉钉、H5页面及小程序等多平台的无缝对接,满足企业多样化办公场景需求。

7. 图表智能解读

图表智能解读模块具备双重分析能力:其一,基于图表背后的数据模型进行结构化解读;其二,当系统对接SaaS版或公有云数据模型时,可自动检索外部行业标准数据进行交叉分析。例如,管理层用户可通过AR插件对比企业指标与行业基准值,系统同步提供决策参考建议。该模块支持预设Prompt的标准化解读,同时允许用户自定义提问,实现个性化数据洞察。

8. 大模型应用效果对比

经实际测试验证,满血版大语言模型在数据解读准确率方面表现最优,在语义理解与分析深度上具有显著优势。然而,本系统采用开放式架构,支持集成多种商业化大模型,可根据用户成本预算与业务需求灵活配置。从企业级应用反馈来看,满血版模型在综合性能上表现最佳,而轻量化模型则适用于资源受限场景,形成差异化解决方案矩阵。

通过内部评测体系对不同大语言模型进行对比分析,结果显示满血版大模型在数据解读准确率及业务趋势分析能力上显著优于自研私有化模型。然而,当应用场景存在计算资源限制或模型参数量较小时,自研模型与满血版模型的性能差距将大幅缩小。基于此,系统支持灵活的大模型适配策略,建议资源充足的用户优先采用满血版模型,而对成本敏感或部署环境受限的场景,则推荐使用轻量化的私有化模型方案。

04

项目落地场景与实施案例

本系统采用"问题收集-数据治理-模型训练-验证上线"四阶段实施方法论:

  • 业务需求采集:系统性梳理业务用户常用术语、提问模式及数据需求,构建标准化问题库;

  • 数据治理整合:接入已完成清洗、结构化处理的业务数据,形成高质量训练数据集;

  • 模型迭代优化:通过问题与数据的匹配训练,持续优化模型的语义理解和分析能力;

  • 生产环境部署:经多轮验证测试后,将模型部署至实际业务场景,实现数据服务的自动化交付。

1. 典型行业应用案例

 互联网音乐领域(网易云音乐)

作为首个内部应用案例,网易云音乐日均处理运营人员取数需求超千次。通过部署ChatBI系统,将原本人工提需求、开发取数的长周期流程,转化为PC/移动端即时自然语言查询。系统基于固定业务维度和时间变量,实现运营数据的自动化提取与分析,显著提升数据获取效率。

② 新零售服饰行业

针对某头部服饰品牌需求,系统提供双重解决方案:

  • 管理层决策支持:在BI首页设置智能问答入口,支持高管通过自然语言快速检索核心业务指标,替代传统数百张报表的人工筛查;

  • 一线业务提效:实现业务人员按需检索报表,满足实时数据查询需求,优化数据使用体验。

 高等教育领域(某985高校)

为高校管理层打造智能数据查询平台,支持通过自然语言获取学生概况、科研成果、师资配置等核心数据,减少人工统计与报表查阅工作,提升管理决策效率。同时赋能科研场景,为学术研究提供数据支持。

 烟草行业数字化转型

在西区烟草项目中,系统深度集成至钉钉平台,覆盖40家下属单位的财务、烟叶专卖、收购等核心业务场景。通过低代码工具赋能业务人员自主构建领域模型,实现问题反馈与模型优化的闭环迭代,形成持续进化的数据服务能力。

2. 集团内部应用拓展

① 智能办公助手(X-P机器人):在网易集团内部搭建类对话机器人,集成HR系统数据,支持员工合同、绩效、考勤等信息的自然语言查询,实现人力资源服务的智能化升级;

② 游戏运营支持:日均处理2万余次运营数据问答请求,满足游戏业务实时数据监测与分析需求;

③ 智慧大屏交互:通过语音驱动的AR-GC技术,实现数据大屏的动态生成与交互展示,提升数据可视化的智能化水平;

④ 智能分析:针对集团海量报表,开发智能解读与异常检测功能,辅助人员快速定位问题,提升分析决策效率。

05

Q&A

Q1:ChatBI中AI能力与传统BI能力如何划分与协作?

A1:ChatBI是BI(商业智能)与AI技术深度融合的产物,其能力分工与协作机制如下:

  • AI能力模块:负责自然语言交互与语义理解,支持文本、语音等多模态输入。通过大语言模型将用户提问转化为计算机可处理的逻辑指令,突破传统API基于关键词匹配的局限性,实现对复杂业务问题的精准解析。同时,通过持续的业务数据微调与训练,增强模型对特定领域知识的理解能力。

  • 传统BI能力模块:承接AI解析后的逻辑指令,完成数据查询、分析结果可视化渲染与展示。通过图表、报表等形式将数据洞察直观呈现,覆盖数据采集、清洗、建模到可视化的全流程处理。

  • 协作机制:AI模块完成语义理解与逻辑推导后,将指令转化为SQL查询语句或数据分析任务,交由BI模块执行数据检索与可视化呈现,形成"用户提问-AI解析-BI展示"的完整闭环。

Q2:ChatBI的响应速度如何保障?

A2:系统通过双重技术策略实现高效响应:

1. 私有化部署优势:采用私有化模型部署架构,避免公有云网络带宽限制,减少数据传输延迟;

2. 垂类模型优化:针对特定业务领域训练的垂类模型,基于语义理解结果进行分步解析,快速生成高效的SQL查询语句。通过对业务场景的深度适配,实现数据分析任务的精准拆解与快速执行,显著提升响应效率。

Q3:SQL生成功能是否完全依赖AI实现?

A3:SQL生成并非单纯依赖AI能力。虽然AI模型负责将自然语言指令解析为数据查询逻辑,但SQL语句的实际生成涉及数据库语法规则与数据结构适配,需结合传统数据处理技术实现。AI提供语义层面的理解与逻辑转化,而SQL语法校验、性能优化等环节仍需BI系统的传统数据处理能力支持,两者协同完成从用户提问到数据库操作的完整链路。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询