2026年5月28日 周四晚上19:30,报名腾讯会议了解“如何转型成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

ragflow v0.25.6 发布:Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

发布日期:2026-05-28 07:26:06 浏览次数: 1511
作者:福大大架构师每日一题

微信搜一搜,关注“福大大架构师每日一题”

推荐语

ragflow v0.25.6 带来多项关键升级,特别是AI自主浏览网页与RAG检索能力的显著增强,为开发者提供了更强大的工具集。

核心内容:
1. Agent新增Browser组件,赋予AI自主网页交互能力
2. RAPTOR构建升级至AHC模式,检索性能与精度全面提升
3. 包含安全性、API、国际化等大量稳定性修复与体验优化

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

一、版本概览

ragflow v0.25.6 于 2026年5月26日 发布,是一次覆盖 Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化 等多个模块的综合性更新。
从这次发布内容来看,v0.25.6 并不是单点功能补丁,而是一次明显偏向 能力补齐、体验增强、问题修复、生态扩展 的版本升级。

本次版本最值得关注的方向包括:

  • • Agent 新增 Browser 组件,让 AI 能够自主浏览和操作网页
  • • RAG RAPTOR 构建升级到 AHC 模式,语义扩展从文档级别提升到数据集级别
  • • Agent 新增轻量级 @tool 装饰器,简化 Python 函数注册流程
  • • Agent 消息支持显示 base64 图片
  • • Doc Generator 文件元数据可作为独立变量暴露
  • • Agent chat completion 支持传入 chat_template_kwargs
  • • /chat/completions 接口支持只发送最新消息
  • • 检索阶段向量相似度权重修复
  • • 大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题修复
  • • Go 侧继续补充大量模型与能力驱动
  • • 安全性增强,包括 SSRF、防止 user_id 伪造、敏感字段泄露修复
  • • 国际化完善,法语翻译补齐大量缺失项
  • • 最低 Python 版本提升到 3.13

下面将严格按照本次发布内容,完整梳理 v0.25.6 的更新要点。


二、新功能:Agent 新增 Browser 组件

本次版本最核心的新功能之一,是 Agent 新增 Browser 组件

这个组件的作用是:
让 AI 能够 自主导航并与网页交互

这意味着 Agent 不再只是被动接收页面内容,而是可以具备更强的网页操作能力,在实际使用中可以执行更多基于浏览器的任务。对于需要网页访问、页面交互、信息获取、在线操作等场景来说,这项能力是非常关键的补强。

从版本说明来看,这一新增功能属于 Agent 能力层面的重要扩展,也是 v0.25.6 最具代表性的新增特性之一。


三、RAG 改进:RAPTOR 构建引入 AHC 模式

在 RAG 方面,本次版本对 RAPTOR 构建 做了重要升级,引入了 AHC 模式(Ψ-RAG)

1. 语义扩展维度升级

AHC 模式的特点是:
将语义扩展从 文档级别 提升到了 数据集级别

这意味着构建索引时,系统不仅仅是围绕单篇文档做语义聚合,而是可以在更大范围的数据集合上进行语义建模,从而增强整体的结构表达能力。

2. 构建性能提升

版本说明明确指出:

  • • 索引构建性能显著高于旧 RAPTOR
  • • 在 Recall@5 和 平均 F1 上也优于旧 RAPTOR

也就是说,这次升级不仅是“快”,同时也是“准”。

3. 支持模式切换

用户可以在 AHC 和 GMM 模式之间切换。
这说明系统保留了不同构建策略的选择能力,便于根据实际场景做灵活配置。

4. 本版本修复问题

该特性在 v0.25.3 中已引入,本次 v0.25.6 主要是 修复了多个相关 Bug,进一步增强稳定性与可用性。


四、Agent 改进:轻量级 @tool 装饰器

本次版本新增了一个非常实用的 Agent 改进:
轻量级 @tool 装饰器

它的目标是 简化 Python 函数注册流程,让开发者更方便地把 Python 函数注册给 chat 模型使用。
从开发体验角度看,这种轻量化的装饰器形式,能够减少样板代码,提升工具定义效率。

这是 Agent 工程化体验上的一个明确优化。


五、Agent 改进:消息支持显示 base64 图片

Agent 消息现在支持显示 base64 编码图片

这项改进的意义在于:

  • • 提高多模态消息展示能力
  • • 使 Agent 消息不再局限于纯文本
  • • 在实际交互中可以更自然地携带和展示图片内容

这对于图文混合、截图展示、视觉信息传递等场景非常有帮助。


六、Agent 改进:Doc Generator 文件元数据作为独立变量暴露

本次版本还改进了 Doc Generator 组件。

现在,Doc Generator 组件的 文件元数据 可以作为 离散变量 暴露出来。
这意味着开发者在处理文档生成流程时,可以更精细地访问和使用这些元信息,提升工作流灵活性。


七、Agent 改进:支持传入 chat_template_kwargs

Agent chat completion 接口现在支持开发者传入 chat_template_kwargs

这一能力的开放,意味着在构建 chat completion 请求时,可以对模板参数进行更细粒度的控制。
从版本描述来看,这是对 Agent chat completion 接口能力的一次增强。


八、接口修复:/chat/completions 允许只发送最新消息

本次版本修复了一个非常实用的接口问题:
/chat/completions 现在允许请求体中只发送最新消息,不再强制要求传递完整对话历史。

这意味着:

  • • API 调用更轻量
  • • 请求体更简洁
  • • 更适合“只传当前轮输入”的调用方式
  • • 也更符合实际集成中的常见使用习惯

这一点在版本说明中被单独强调,说明是一个重要的 API 行为修复。


九、检索修复:向量相似度权重在检索阶段未生效

本次版本修复了一个 RAG 检索相关问题:
向量相似度权重在检索阶段没有被正确应用。

这类问题会直接影响检索结果排序和召回质量。
版本修复后,相关权重能够在检索阶段正确生效,使检索行为更符合配置预期。


十、数据集与配置页面修复

本次版本修复了多个管理页面问题:

1. 解析器配置保存失败

修复了 数据集配置页面中 parser configs 无法保存 的问题。

2. 数据源详情页日志显示不完整

修复了 数据源详情页面日志不能完全展示 的问题。

3. 文档状态过滤失败

修复了 document status filtering failure 的问题。

这些都是影响日常运维和配置管理的关键体验问题。


十一、空响应与解析修复

本次版本也修复了一些更底层的健壮性问题:

  • • 修复了 空 LLM choices response 时的 crash guard 问题
  • • 修复了 HTML 标签在 ingestion pipeline parser output 中残留 的问题
  • • 修复了 table parser metadata 问题
  • • 修复了 empty file 的提示问题,使错误信息更清晰

这些修复共同提升了 ingestion 和解析链路的稳定性。


十二、RAG RAPTOR 相关修复

除了 AHC 模式升级外,本版本还修复了 RAPTOR 的构建问题:

  • • 修复了 使用 Infinity document engine 时 RAPTOR 构建过程停止 的问题

这说明 RAPTOR 相关功能在不同文档引擎下的兼容性得到了进一步修正。


十三、流式响应解析修复

本次版本修复了:

  • • Mistral / Upstage reasoning models 的流式响应解析问题

这类问题主要影响模型流式输出的稳定解析,修复后有助于提升 reasoning 模型在流式场景中的可用性。


十四、异步与事件循环问题修复

本次版本对 asyncio 相关问题做了集中修复,包括:

  • • 修复 asyncio event loop nesting
  • • 修复 fire-and-forget task 问题
  • • 修复 asyncio.Semaphore bound to different event loop 错误
  • • 修复了与 asyncio 正确性相关的问题

这些问题通常出现在高并发、异步任务调度或多事件循环环境中,修复后将显著提升系统稳定性。


十五、Agent 相关 bug 修复

Agent 在本次版本中也有多项修复:

  • • 修复 Agent component prompt variable 消失 的问题
  • • 修复 search vector_similarity_weight 相关问题
  • • 修复 agent attachment download api 的移动问题
  • • 修复 agent 创建与更新 API 中 canvas_type 的支持问题

这些都属于 Agent 功能细节上的关键修正。


十六、API 与安全性增强

本次版本在 API 与安全方面也有多项重要修复:

1. session user_id 伪造修复

修复了 通过 request body 伪造 session user_id 的问题。

2. /dify/retrieval 权限校验

修复了 /dify/retrieval 中 kb ownership 校验 问题。

3. 敏感字段泄露防护

修复了 用户 API 响应中敏感字段泄露 的问题。

4. SSRF 防护

修复了 misc_utils.download_img 在 OAuth avatars 场景下的 SSRF 风险

这些改动说明本次版本对安全性进行了明显加固。


十七、文档与工具能力修复

本次版本还修复或增强了文档相关能力:

  • • 修复 /documents/{id}/download 相关问题后又进行了回退处理
  • • 修复 解析器输出中的 HTML 标签
  • • 修复 PDF 文档顶部红色高亮替换为黄色
  • • 修复 chunk 标签列表显示
  • • 提供了 chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例
  • • 修复 metadata 相关问题

这些更新有助于提升文档处理、展示和接口调用的可用性。


十八、Go 侧能力大规模补齐

本次版本中,Go 相关驱动和模型支持非常丰富,涉及大量 provider、embed、rerank、ASR、TTS、OCR 等能力扩展。下面按内容完整整理。

1. 新增或补充的 provider / driver

  • • TogetherAI
  • • n1n.ai
  • • GPUStack(chat)
  • • Azure OpenAI 模型驱动
  • • PPIO provider
  • • Groq provider
  • • Tencent Hunyuan provider
  • • TokenPony provider
  • • HuaweiCloud model provider
  • • ModelScope provider
  • • OrcaRouter provider
  • • FuturMix provider
  • • TokenHub provider
  • • AWS Bedrock provider

2. 新增 embed 能力

  • • TogetherAI embed
  • • Xinference embed
  • • Tencent Hunyuan embed

3. 新增 rerank 能力

  • • Xinference rerank
  • • Novita rerank
  • • DeepInfra rerank
  • • TogetherAI rerank

4. 新增 ASR / TTS 能力

  • • Xinference ASR
  • • Xinference TTS
  • • TogetherAI ASR
  • • TogetherAI TTS
  • • ZhipuAI ASR
  • • OpenRouter ASR
  • • Groq reasoning_chat、TTS、ASR

5. 新增 OCR 能力

  • • ZhipuAI OCR
  • • Baidu OCR 输入校验
  • • PaddleOCR_Local provider
  • • hosted OCR providers 通过 drivers 路由

6. 其他 Go 侧能力

  • • OpenAI audio endpoints 支持
  • Ollama 的 chat、listmodels、embed 重写
  • • Elasticsearch functions in Go

这些内容说明 Go 生态能力在本版本中持续扩展,覆盖更多模型服务与多模态任务。


十九、Evaluation 与测试增强

本次版本还涉及评估和测试能力增强:

  • • evaluation 中增加 token usage 跟踪
  • • 增加新的 restful api suite 测试与测试用例
  • • 改进 retry 和 timeout
  • • 改进 CI

这些变化主要提升研发质量、测试覆盖与持续集成稳定性。


二十、国际化与文档更新

本次版本也完成了不少文档和国际化工作:

  • • 将 Python 最低版本要求提升至 3.13
  • • 更新 README 和文档中的版本引用到 v0.25.6
  • • 更新 v0.25.5 发布说明
  • • 完成 Discord 集成指南
  • • 初稿与草稿形式的 v0.25.6 发布说明同步完善
  • • 法语翻译补齐约 1400 个缺失键

这说明项目在文档、版本维护和语言支持方面也持续推进。


二十一、其他修复与完善

除了前述大项,本次版本还包括以下修复与调整:

  • • 修复 API 路径错误
  • • 修复 任务语言缺失
  • • 修复 模型类型加入 llm_setting
  • • 修复 OpenAI chat completion 与 session_id / conversation_id 关联问题
  • • 修复 文档下载内容类型推断相关问题后回退
  • • 修复 数据源详情日志显示不完整
  • • 修复 表格解析 metadata
  • • 修复 PDF 高亮颜色
  • • 修复 空文件报错信息
  • • 修复 tag list 显示
  • • 修复 parser config 保存问题
  • • 修复 restful api suite 测试
  • • 修复 agent attachment download API
  • • 修复 search vector_similarity_weight
  • • 修复 prompt variable 消失
  • • 修复 canvas_type 支持
  • • 修复 敏感字段泄露
  • • 修复 SSRF
  • • 修复 empty LLM choices
  • • 修复 event loop 相关问题

这些修复覆盖了前后端、API、任务调度、解析链路和安全边界多个层面。


二十二、版本总结

代码地址:github.com/infiniflow/ragflow

总体来看,ragflow v0.25.6 是一次非常全面的版本更新,核心特征可以概括为:

  1. 1. Agent 能力增强
  • • Browser 组件
  • • @tool 装饰器
  • • base64 图片展示
  • • 文件元数据独立暴露
  • • chat_template_kwargs 支持
  • 2. RAG 能力升级
    • • RAPTOR 引入 AHC 模式
    • • 构建性能和检索指标提升
    • • 修复 Infinity engine 兼容问题
    • • 修复向量相似度权重问题
  • 3. API 行为优化
    • • /chat/completions 允许只传最新消息
    • • 权限、会话、路径、响应结构等问题修复
  • 4. 稳定性全面提升
    • • async / event loop 修复
    • • parser / metadata / HTML / table 修复
    • • 空响应、空文件、流式解析修复
  • 5. 安全性增强
    • • 防 user_id 伪造
    • • 防敏感字段泄露
    • • 防 SSRF
    • • 权限校验加强
  • 6. 生态扩展
    • • 大量 Go provider、embed、rerank、ASR、TTS、OCR 能力补齐
  • 7. 工程化完善
    • • 测试增强
    • • CI 改进
    • • 文档更新
    • • Python 3.13 适配
    • • 法语翻译补齐

    如果从“升级价值”来看,v0.25.6 兼具 功能增强、性能优化、问题修复和生态扩张 四个维度,属于非常值得关注的一次版本更新。

     

    ·

    我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。


    欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

    ·

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询