我要投稿

ragflow v0.25.6 发布：Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

发布日期：2026-05-28 07:26:06 浏览次数： 1511

作者：福大大架构师每日一题

微信搜一搜，关注“福大大架构师每日一题”

一、版本概览

ragflow v0.25.6 于 2026年5月26日 发布，是一次覆盖 Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化 等多个模块的综合性更新。
从这次发布内容来看，v0.25.6 并不是单点功能补丁，而是一次明显偏向 能力补齐、体验增强、问题修复、生态扩展 的版本升级。

本次版本最值得关注的方向包括：

• Agent 新增 Browser 组件，让 AI 能够自主浏览和操作网页
• RAG RAPTOR 构建升级到 AHC 模式，语义扩展从文档级别提升到数据集级别
• Agent 新增轻量级 @tool 装饰器，简化 Python 函数注册流程
• Agent 消息支持显示 base64 图片
• Doc Generator 文件元数据可作为独立变量暴露
• Agent chat completion 支持传入 chat_template_kwargs
• /chat/completions 接口支持只发送最新消息
• 检索阶段向量相似度权重修复
• 大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题修复
• Go 侧继续补充大量模型与能力驱动
• 安全性增强，包括 SSRF、防止 user_id 伪造、敏感字段泄露修复
• 国际化完善，法语翻译补齐大量缺失项
• 最低 Python 版本提升到 3.13

下面将严格按照本次发布内容，完整梳理 v0.25.6 的更新要点。

二、新功能：Agent 新增 Browser 组件

本次版本最核心的新功能之一，是 Agent 新增 Browser 组件。

这个组件的作用是：
让 AI 能够 自主导航并与网页交互。

这意味着 Agent 不再只是被动接收页面内容，而是可以具备更强的网页操作能力，在实际使用中可以执行更多基于浏览器的任务。对于需要网页访问、页面交互、信息获取、在线操作等场景来说，这项能力是非常关键的补强。

从版本说明来看，这一新增功能属于 Agent 能力层面的重要扩展，也是 v0.25.6 最具代表性的新增特性之一。

三、RAG 改进：RAPTOR 构建引入 AHC 模式

在 RAG 方面，本次版本对 RAPTOR 构建 做了重要升级，引入了 AHC 模式（Ψ-RAG）。

1. 语义扩展维度升级

AHC 模式的特点是：
将语义扩展从 文档级别 提升到了 数据集级别。

这意味着构建索引时，系统不仅仅是围绕单篇文档做语义聚合，而是可以在更大范围的数据集合上进行语义建模，从而增强整体的结构表达能力。

2. 构建性能提升

版本说明明确指出：

• 索引构建性能显著高于旧 RAPTOR
• 在 Recall@5 和 平均 F1 上也优于旧 RAPTOR

也就是说，这次升级不仅是“快”，同时也是“准”。

3. 支持模式切换

用户可以在 AHC 和 GMM 模式之间切换。
这说明系统保留了不同构建策略的选择能力，便于根据实际场景做灵活配置。

4. 本版本修复问题

该特性在 v0.25.3 中已引入，本次 v0.25.6 主要是 修复了多个相关 Bug，进一步增强稳定性与可用性。

四、Agent 改进：轻量级 `@tool` 装饰器

本次版本新增了一个非常实用的 Agent 改进：
轻量级 @tool 装饰器。

它的目标是 简化 Python 函数注册流程，让开发者更方便地把 Python 函数注册给 chat 模型使用。
从开发体验角度看，这种轻量化的装饰器形式，能够减少样板代码，提升工具定义效率。

这是 Agent 工程化体验上的一个明确优化。

五、Agent 改进：消息支持显示 base64 图片

Agent 消息现在支持显示 base64 编码图片。

这项改进的意义在于：

• 提高多模态消息展示能力
• 使 Agent 消息不再局限于纯文本
• 在实际交互中可以更自然地携带和展示图片内容

这对于图文混合、截图展示、视觉信息传递等场景非常有帮助。

六、Agent 改进：Doc Generator 文件元数据作为独立变量暴露

本次版本还改进了 Doc Generator 组件。

现在，Doc Generator 组件的 文件元数据 可以作为 离散变量 暴露出来。
这意味着开发者在处理文档生成流程时，可以更精细地访问和使用这些元信息，提升工作流灵活性。

七、Agent 改进：支持传入 `chat_template_kwargs`

Agent chat completion 接口现在支持开发者传入 chat_template_kwargs。

这一能力的开放，意味着在构建 chat completion 请求时，可以对模板参数进行更细粒度的控制。
从版本描述来看，这是对 Agent chat completion 接口能力的一次增强。

八、接口修复：/chat/completions 允许只发送最新消息

本次版本修复了一个非常实用的接口问题：
/chat/completions 现在允许请求体中只发送最新消息，不再强制要求传递完整对话历史。

这意味着：

• API 调用更轻量
• 请求体更简洁
• 更适合“只传当前轮输入”的调用方式
• 也更符合实际集成中的常见使用习惯

这一点在版本说明中被单独强调，说明是一个重要的 API 行为修复。

九、检索修复：向量相似度权重在检索阶段未生效

本次版本修复了一个 RAG 检索相关问题：
向量相似度权重在检索阶段没有被正确应用。

这类问题会直接影响检索结果排序和召回质量。
版本修复后，相关权重能够在检索阶段正确生效，使检索行为更符合配置预期。

十、数据集与配置页面修复

本次版本修复了多个管理页面问题：

1. 解析器配置保存失败

修复了 数据集配置页面中 parser configs 无法保存 的问题。

2. 数据源详情页日志显示不完整

修复了 数据源详情页面日志不能完全展示 的问题。

3. 文档状态过滤失败

修复了 document status filtering failure 的问题。

这些都是影响日常运维和配置管理的关键体验问题。

十一、空响应与解析修复

本次版本也修复了一些更底层的健壮性问题：

• 修复了 空 LLM choices response 时的 crash guard 问题
• 修复了 HTML 标签在 ingestion pipeline parser output 中残留 的问题
• 修复了 table parser metadata 问题
• 修复了 empty file 的提示问题，使错误信息更清晰

这些修复共同提升了 ingestion 和解析链路的稳定性。

十二、RAG RAPTOR 相关修复

除了 AHC 模式升级外，本版本还修复了 RAPTOR 的构建问题：

• 修复了 使用 Infinity document engine 时 RAPTOR 构建过程停止 的问题

这说明 RAPTOR 相关功能在不同文档引擎下的兼容性得到了进一步修正。

十三、流式响应解析修复

本次版本修复了：

• Mistral / Upstage reasoning models 的流式响应解析问题

这类问题主要影响模型流式输出的稳定解析，修复后有助于提升 reasoning 模型在流式场景中的可用性。

十四、异步与事件循环问题修复

本次版本对 asyncio 相关问题做了集中修复，包括：

• 修复 asyncio event loop nesting
• 修复 fire-and-forget task 问题
• 修复 asyncio.Semaphore bound to different event loop 错误
• 修复了与 asyncio 正确性相关的问题

这些问题通常出现在高并发、异步任务调度或多事件循环环境中，修复后将显著提升系统稳定性。

十五、Agent 相关 bug 修复

Agent 在本次版本中也有多项修复：

• 修复 Agent component prompt variable 消失 的问题
• 修复 search vector_similarity_weight 相关问题
• 修复 agent attachment download api 的移动问题
• 修复 agent 创建与更新 API 中 canvas_type 的支持问题

这些都属于 Agent 功能细节上的关键修正。

十六、API 与安全性增强

本次版本在 API 与安全方面也有多项重要修复：

1. session user_id 伪造修复

修复了 通过 request body 伪造 session user_id 的问题。

2. /dify/retrieval 权限校验

修复了 /dify/retrieval 中 kb ownership 校验 问题。

3. 敏感字段泄露防护

修复了 用户 API 响应中敏感字段泄露 的问题。

4. SSRF 防护

修复了 misc_utils.download_img 在 OAuth avatars 场景下的 SSRF 风险。

这些改动说明本次版本对安全性进行了明显加固。

十七、文档与工具能力修复

本次版本还修复或增强了文档相关能力：

• 修复 /documents/{id}/download 相关问题后又进行了回退处理
• 修复 解析器输出中的 HTML 标签
• 修复 PDF 文档顶部红色高亮替换为黄色
• 修复 chunk 标签列表显示
• 提供了 chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例
• 修复 metadata 相关问题

这些更新有助于提升文档处理、展示和接口调用的可用性。

十八、Go 侧能力大规模补齐

本次版本中，Go 相关驱动和模型支持非常丰富，涉及大量 provider、embed、rerank、ASR、TTS、OCR 等能力扩展。下面按内容完整整理。

1. 新增或补充的 provider / driver

• TogetherAI
• n1n.ai
• GPUStack（chat）
• Azure OpenAI 模型驱动
• PPIO provider
• Groq provider
• Tencent Hunyuan provider
• TokenPony provider
• HuaweiCloud model provider
• ModelScope provider
• OrcaRouter provider
• FuturMix provider
• TokenHub provider
• AWS Bedrock provider

2. 新增 embed 能力

• TogetherAI embed
• Xinference embed
• Tencent Hunyuan embed

3. 新增 rerank 能力

• Xinference rerank
• Novita rerank
• DeepInfra rerank
• TogetherAI rerank

4. 新增 ASR / TTS 能力

• Xinference ASR
• Xinference TTS
• TogetherAI ASR
• TogetherAI TTS
• ZhipuAI ASR
• OpenRouter ASR
• Groq reasoning_chat、TTS、ASR

5. 新增 OCR 能力

• ZhipuAI OCR
• Baidu OCR 输入校验
• PaddleOCR_Local provider
• hosted OCR providers 通过 drivers 路由

6. 其他 Go 侧能力

• OpenAI audio endpoints 支持
• Ollama 的 chat、listmodels、embed 重写
• Elasticsearch functions in Go

这些内容说明 Go 生态能力在本版本中持续扩展，覆盖更多模型服务与多模态任务。

十九、Evaluation 与测试增强

本次版本还涉及评估和测试能力增强：

• evaluation 中增加 token usage 跟踪
• 增加新的 restful api suite 测试与测试用例
• 改进 retry 和 timeout
• 改进 CI

这些变化主要提升研发质量、测试覆盖与持续集成稳定性。

二十、国际化与文档更新

本次版本也完成了不少文档和国际化工作：

• 将 Python 最低版本要求提升至 3.13
• 更新 README 和文档中的版本引用到 v0.25.6
• 更新 v0.25.5 发布说明
• 完成 Discord 集成指南
• 初稿与草稿形式的 v0.25.6 发布说明同步完善
• 法语翻译补齐约 1400 个缺失键

这说明项目在文档、版本维护和语言支持方面也持续推进。

二十一、其他修复与完善

除了前述大项，本次版本还包括以下修复与调整：

• 修复 API 路径错误
• 修复 任务语言缺失
• 修复 模型类型加入 llm_setting
• 修复 OpenAI chat completion 与 session_id / conversation_id 关联问题
• 修复 文档下载内容类型推断相关问题后回退
• 修复 数据源详情日志显示不完整
• 修复 表格解析 metadata
• 修复 PDF 高亮颜色
• 修复 空文件报错信息
• 修复 tag list 显示
• 修复 parser config 保存问题
• 修复 restful api suite 测试
• 修复 agent attachment download API
• 修复 search vector_similarity_weight
• 修复 prompt variable 消失
• 修复 canvas_type 支持
• 修复 敏感字段泄露
• 修复 SSRF
• 修复 empty LLM choices
• 修复 event loop 相关问题

这些修复覆盖了前后端、API、任务调度、解析链路和安全边界多个层面。

二十二、版本总结

代码地址：github.com/infiniflow/ragflow

总体来看，ragflow v0.25.6 是一次非常全面的版本更新，核心特征可以概括为：

1. Agent 能力增强

• Browser 组件
• @tool 装饰器
• base64 图片展示
• 文件元数据独立暴露
• chat_template_kwargs 支持

2. RAG 能力升级

• RAPTOR 引入 AHC 模式
• 构建性能和检索指标提升
• 修复 Infinity engine 兼容问题
• 修复向量相似度权重问题

3. API 行为优化

• /chat/completions 允许只传最新消息
• 权限、会话、路径、响应结构等问题修复

4. 稳定性全面提升

• async / event loop 修复
• parser / metadata / HTML / table 修复
• 空响应、空文件、流式解析修复

5. 安全性增强

• 防 user_id 伪造
• 防敏感字段泄露
• 防 SSRF
• 权限校验加强

6. 生态扩展

• 大量 Go provider、embed、rerank、ASR、TTS、OCR 能力补齐

7. 工程化完善

• 测试增强
• CI 改进
• 文档更新
• Python 3.13 适配
• 法语翻译补齐

如果从“升级价值”来看，v0.25.6 兼具 功能增强、性能优化、问题修复和生态扩张 四个维度，属于非常值得关注的一次版本更新。

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。

欢迎关注“福大大架构师每日一题”，发消息可获得面试资料，让AI助力您的未来发展。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业