微信扫码
添加专属顾问
我要投稿
清华团队突破性成果:RAG2.0让复杂知识系统搭建像拼乐高一样简单!核心内容: 1. UltraRAG 2.0通过YAML配置实现复杂逻辑编排,代码量减少80% 2. MCP协议标准化组件接口,支持模块化复用与灵活扩展 3. 在保持12%性能提升的同时,大幅降低开发门槛与工程成本
本公众号主要关注NLP、CV、LLM、RAG、Agent等AI前沿技术,免费分享业界实战案例与课程,助力您全面拥抱AIGC。
但这种复杂度的提升,使开发者在方法复现、快速迭代新想法时,面临着高昂的工程实现成本。
基于 Model Context Protocol (MCP) 架构设计的 RAG 框架。这一设计让科研人员只需编写 YAML 文件,就可以直接声明串行、循环、条件分支等复杂逻辑,从而以极低的代码量快速实现多阶段推理系统。
其核心思路是:
与传统框架相比,UltraRAG 2.0 显著降低了复杂 RAG 系统的技术门槛与学习成本,让研究者能够将更多精力投入到实验设计与算法创新上,而不是陷入冗长的工程实现。
传统的RAG,如:IRCoT,依赖基于模型生成的 CoT 进行多轮检索直至产出最终答案,整体流程相当复杂。
仅 Pipeline 部分就需要近 900 行手写逻辑;即便使用标杆级 RAG 框架(如 FlashRAG),也仍需 超过 110 行代码。相比之下,UltraRAG 2.0 只需约 50 行代码 即可完成同等功能。更值得强调的是,其中约一半还是用于编排的 Yaml 伪代码,这大幅降低了开发门槛与实现成本。
可以看到,FlashRAG 的实现仍然需要较长的控制逻辑,涉及显式的循环、条件判断与状态更新。而在 UltraRAG 2.0 中,这些逻辑仅需 几行 Pipeline YAML 配置 即可表达,分支与循环均以简洁的声明方式完成,避免了繁琐的手动编码。
可以将 Retriever、Generation、Router 等模块通过 YAML 串联,构建了一个同时具备循环与条件分支的推理流程,实现了 Plan 生成 → 知识整理 → 子问题生成等关键步骤,而这一切仅需 不到 100 行代码。
在性能上,该系统在复杂多跳问题上,相较 Vanilla RAG **性能提升约 12%**,充分验证了 UltraRAG 2.0 在快速构建复杂推理系统方面的潜力。
在不同的 RAG 系统中,检索、生成等核心能力在功能上具有高度相似性,但由于开发者实现策略各异,模块之间往往缺乏统一接口,难以跨项目复用。Model Context Protocol (MCP) 作为一种开放协议,规范了为大型语言模型(LLMs)提供上下文的标准方式,并采用 Client–Server 架构,使得遵循该协议开发的 Server 组件可以在不同系统间无缝复用。
UltraRAG 基于 MCP 架构,将 RAG 系统中的检索、生成、评测等核心功能抽象并封装为相互独立的 MCP Server,并通过标准化的 函数级 Tool 接口 实现调用。这一设计既保证了模块功能扩展的灵活性,又允许新模块以“热插拔”的方式接入,无需对全局代码进行侵入式修改。
在科研场景中,这种架构让研究者能够以极低的代码量快速适配新的模型或算法,同时保持整体系统的稳定性与一致性。
UltraRAG之所以能够在 低代码 条件下支持复杂系统的构建,核心在于其底层对多结构 Pipeline 流程控制 的原生支持。无论是 串行、循环还是条件分支,所有控制逻辑均可在 YAML 层完成定义与调度,覆盖复杂推理任务所需的多种流程表达方式。
在实际运行中,推理流程的调度由内置 Client 执行,其逻辑完全由用户编写的外部 Pipeline YAML 脚本 描述,从而完成与底层实现的解耦。开发者可以像使用编程语言关键字一样调用 loop、step 等指令,以声明式方式快速构建多阶段推理流程。
https://github.com/OpenBMB/UltraRAG/tree/main
推荐阅读
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-06-05
2025-06-06
2025-06-05
2025-06-05
2025-06-20
2025-06-20
2025-07-15
2025-06-24
2025-06-24
2025-06-05