微信扫码
添加专属顾问
我要投稿
RFT在应用层的潜力仍被低估,尤其适合大规模组织的AI解决方案。 核心内容: 1. RFT实践成功率低的原因分析 2. RFT在大规模组织中的独特价值 3. 前沿模型厂对RL post-training的最新进展
一篇短文,刷新一下观点的有效期,没有新的观点。
我在2025年Q1有一系列文章讨论我当时在RFT上的实践,和我对于RFT价值的看法。
之后由于我跑去做别的了,所以没有再提RFT这边。但这并不代表说我不看好RFT了。
目前整个应用层对于RFT的实践仍然似乎成功率不高,不过这更多是由于其infra要求更高,以及试用问题选择需要的认知更多,需要调节的超参数更多了。门比SFT窄得多。
但作为目前少有的几大方案,RFT仍然是我们无法无视的,特别是对于一些比较大的组织,(这里的比较大是指单个BU内,单一细分岗位有100人以上的规模)。不过确实对于这种规模组织来说,如何获得第一个成功案例是比较难的,但他们也有钱可以去买一个教学案例。
我目测RFT被低估这个判断的有效期还能持续1年。
从LLM模型的用户角度观察,目前海外前沿模型厂对于RL post-training的调教已经进入了第二阶段,优化了reasoning token数。有安全报告说明GPT-5模型的思考过程已经开始出现非人话的情况,这都是(暴力)压缩reasoning token的副作用。
Agent构建平台" data-itemshowtype="0" linktype="text" data-linktype="2">RFTaaS有望成为第一种通用Agent构建平台
GRPO 实验经验笔记(1)
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-07
阿里云知识存储 Skill 上架阿里云官网首批 Agent Skill:让智能体拥有企业级知识库
2026-05-07
1G内存检索2500万向量,Milvus中如何用FLAT在强标量过滤场景搞定毫秒响应?
2026-05-06
多Agent场景,子agent 之间数据读写不同步,如何解决?
2026-05-06
看 AgentRun 如何玩转记忆存储,最佳实践来了!
2026-05-06
RAG 与 MCP:每位 AI 开发人员真正需要了解的知识
2026-04-30
RAG已死?不,是Grep回归了!
2026-04-27
Mem0 深度解析:智能记忆层的架构原理
2026-04-27
Karpathy的LLM Wiki + 3.5 万Star的Graphify:企业级 RAG 缺的真是知识图谱?
2026-02-13
2026-03-23
2026-04-06
2026-02-22
2026-03-18
2026-03-20
2026-02-15
2026-02-27
2026-02-21
2026-03-21
2026-05-07
2026-05-06
2026-04-27
2026-04-21
2026-03-17
2026-03-11
2026-02-22
2026-02-15