我要投稿

啥时候上RAG？啥时候上微调？丨实战笔记

发布日期：2025-07-02 07:32:03 浏览次数： 1672

作者：阿星AI工作室

微信搜一搜，关注“阿星AI工作室”

现在很多AI科普文章都会提到微调，RAG。

但是没有实战的过的同学可能会问🤔——

啥时候用RAG？啥时候用微调呢？有啥区别？不都是让模型增加知识面的吗？

今天我们就对这个问题进行粗略归类——

关于微调

你可以简单理解为在预训练之后（预训练你可以简单理解成自监督学习，得到一堆参数但是还不会自己回答）

——进行的一些QA对训练，来教会模型组织语言，回答问题。

但是要注意微调是没有对知识样本做扩充的，扩充还是通过预训练完成的。

微调之后才是基于人类反馈的强化学习。

简单说就是预训练👉微调👉强化学习，微调是中间这个环节。

不同微调之间有啥区别？

1、继续预训练-CPT：来增加知识、能力。补充模型在特定领域的缺陷。

2、微调训练-SFT：给模型更多的QA对，来增强模型的依从性。常用于垂直大模型。这是现在最主要的方式。

3、偏好调优-DPO：用负反馈优化输出，让模型知道不能干啥，啥是错的。

但是没事也不用微调，不要听到别人说微调自己也想微调……有很多已经调好的，可以去百炼云上看😂我之前也写了一篇可以体验简版流程，实际比这个难n倍。零基础也能体验模型微调！魔塔+LLaMa Factory手把手教程

没有必要，千万别微调

优先级可以按照提示词大于RAG大于微调。

1、针对特定行业/领域，如果模型根本就不具备特定知识，你可以用继续预训练-CPT。只不过数据上很多是1500万字起步（下一篇推送会讲讲微调的数据质量要求有多可怕）

2、针对特定问题，微调训练-SFT可以用RAG、提示词、示例来做一些代替。因为SFT对数据质量要求要比RAG高，可以选择不那么折腾直接上RAG

3、至于偏好调优-DPO，你可以选择用提示词示例。因为错误答案本身就对数据的要求更多了。你要枚举多少回答来让模型记住啥是错的？

啥时候必须上微调

再好的提示词都有输出上的出入，如果是垂直指定的问题，你要求它回答的丁是丁卯是卯，那还是用微调最好。特别是金融和医疗。

1、比如在履职问题测评中，你需要对问题做严格分类，查询特定的数据库，也可能涉及到指定的关键词。说白了就是场景足够垂直。

2、高并发任务、对效率要求极高的场景，可以通过微调加速响应。

比如对即时主观题打分，就会需要快速响应来适应考试节奏等。

3、特别是端侧，很多服务都需要云端判断，对定向场景需要的就是速度和准确度，离不开微调。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-16

GPUStack v0.7：macOS与Windows安装包、昇腾MindIE多机推理、模型使用计量与寒武纪MLU支持

2025-08-16

AI+合同审查项目落地分享（下-2-智能信息提取&填充&智能预审）

2025-08-16

Spring AI实现知识库搭建(实战篇)

2025-08-16

浅谈基于 Phone Use 的 Agent 窘境

2025-08-16

Agentic AI：解密MCP、A2A、ACP、ANP四大协议

2025-08-16

AI促进研发管理案例

2025-08-15

如何让 AI 绘图中文呈现更稳定和准确？

2025-08-15

含全文！OpenAI发布GPT-5官方Prompt指南

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek R1-0528 小版本升级

2025-05-29

高效 Agents 构建指南

2025-05-23

SpringAI Alibaba实战文生图、聊天记忆功能

2025-06-01

精|知识探索新范式：深度研究Deep Research智能体全面综述，系统、方法与应用

2025-06-21

AIGC合规落地全景图 | 如何做好AIGC数据合规

2025-06-07

2025-05-20

别再被MCP协议绕晕！一文搞懂连接流程与核心架构

2025-06-12

聊聊AI应用架构演进

2025-06-13

能办成事的 Agent：实时与环境交互，从经验中学习

2025-06-19

这篇AI Agent漫游指南，带你建立全面的科技史观

2025-05-28

大家都在问

如何让 AI 绘图中文呈现更稳定和准确？

2025-08-15

从 0 到 1 做一款 AI 产品：技术怎么搭、成本如何控制、销售策略怎么定？

2025-08-14

为什么构建 AI agent 的工程量往往比想象的大？

2025-08-14

Agent 产品如何定价？我们花的钱，究竟值不值？

2025-08-13

用最简单的大模型技术打造一个迁云专家有多难？

2025-08-13

前百川联创下场、字节腾讯入局，「AI小宇宙」正在被集体押注？

2025-08-11

LLM推理引擎哪家好？

2025-08-11

湖仓一体面对Agentic AI的应用有哪些新的特征？

2025-08-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB