我要投稿

RFT目前(在应用层)仍然是被低估的

发布日期：2025-11-06 06:55:07 浏览次数： 1529

作者：孔某人的低维认知

微信搜一搜，关注“孔某人的低维认知”

一篇短文，刷新一下观点的有效期，没有新的观点。

我在2025年Q1有一系列文章讨论我当时在RFT上的实践，和我对于RFT价值的看法。

之后由于我跑去做别的了，所以没有再提RFT这边。但这并不代表说我不看好RFT了。

目前整个应用层对于RFT的实践仍然似乎成功率不高，不过这更多是由于其infra要求更高，以及试用问题选择需要的认知更多，需要调节的超参数更多了。门比SFT窄得多。

但作为目前少有的几大方案，RFT仍然是我们无法无视的，特别是对于一些比较大的组织，（这里的比较大是指单个BU内，单一细分岗位有100人以上的规模）。不过确实对于这种规模组织来说，如何获得第一个成功案例是比较难的，但他们也有钱可以去买一个教学案例。

我目测RFT被低估这个判断的有效期还能持续1年。

一些其他观察

从LLM模型的用户角度观察，目前海外前沿模型厂对于RL post-training的调教已经进入了第二阶段，优化了reasoning token数。有安全报告说明GPT-5模型的思考过程已经开始出现非人话的情况，这都是（暴力）压缩reasoning token的副作用。

Agent构建平台" data-itemshowtype="0" linktype="text" data-linktype="2">RFTaaS有望成为第一种通用Agent构建平台

GRPO 实验经验笔记（1）

交流与合作

如果希望和我交流讨论，或参与相关的讨论群，或者建立合作，请加微信，联系方式请点击 -> 专栏简介及联系方式 2024。

本文于2025.11.5 首发于微信公众号。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-06

RAG已经过时了？试试CAG，缓存增强生成技术实战大揭秘！

2025-11-06

Zero-RAG，对冗余知识说“不”

2025-11-05

从 RAG 到 Agentic RAG，再到 Agent Memory：AI 记忆的进化三部曲

2025-11-05

万字详解Naive RAG超进化之路：Pre-Retrieval和Retrieval优化

2025-11-05

别只调模型！RAG 检索优化真正该测的，是这三件事

2025-11-04

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-10-31

Dify知识库从Demo到生产：RAG构建企业级私有知识库的7个关键步骤

2025-10-31

RAGFlow 深度介绍

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

2025-09-15

从原理到落地：RAG 技术全解析，手把手教你搭建专属知识库

2025-09-02

优化 GraphRAG：LightRAG的三大改进

2025-08-18

RAG系统全景：架构详解与落地实践指南

2025-08-25

高质量AI知识库应用的前提：选对向量数据库

2025-08-25

一文搞懂大模型：何为深入理解RAG？

2025-08-25

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

万字长文详解腾讯优图RAG技术的架构设计与创新实践

2025-09-08

别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

2025-08-20

RAG检索后如何应用更有效？

2025-08-28

大家都在问

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

RAG检索后如何应用更有效？

2025-08-28

一文搞懂大模型：何为深入理解RAG？

2025-08-25

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB