我要投稿

大模型经常犯错才是大模型应用中最好玩，也是最有用的东西

发布日期：2025-08-23 11:37:39 浏览次数： 1740

作者：AI探索时代

微信搜一搜，关注“AI探索时代”

“ 大模型犯错是常态，而在大模型应用中，我们需要做的是处理好这些错误，把模型的错误影响降到最低。”

做了一段时间的大模型应用之后发现一个非常有趣的问题，那就是为什么会有那么多大模型应用的范式，包括思维链(CoT)，思考-行动(ReAct)，反思(Reflection)等。

其实最本质的原因就是大模型经常犯错，特别是在复杂场景下的复杂问题；就类似于我们人类处理复杂问题一样，很少有人能够在不犯错的前提下，一次性解决一个复杂问题，特别是在个人能力参差不齐的情况下。

经常犯错的大模型

我们知道大模型是一个基于概率进行预测结果的系统，因此它有一个非常致命的问题，那就是幻觉问题；但其在某些情况下，能够很好的取代人类，提升效率。

因此，作为一个让人又爱又恨的技术和工具，在利用好大模型优势的前提下，又能把风险降到最低，这是作为使用者的我们需要解决的问题。

从使用者的角度来说，提示词(prompt)是使用大模型的唯一工具，我们可以通过提示词来约束或引导大模型的输出，而这可以让大模型帮我们解决问题。但是因为幻觉等原因的存在，就导致大模型并不能完全稳定地输出正确的答案。

所以，我们就需要一种方式来规避或者来降低这种风险；而这就是大模型应用中不同范式存在的意义。

在解决复杂问题的过程中，我们人类常用的方式就是去分析问题，然后对问题进行拆解规划；对大模型来说同样如此，我们需要一种方法让大模型能够独立完成任务的拆解和行动，由此形成的方法论就是我们现在常说的ReAct，reflection等。

但是呢，这些方式虽然能够提升大模型的准确率，以及对复杂问题的解决能力，但并不能完全杜绝大模型犯错；因此，我们就需要在大模型犯错时进行处理，比如说ReAct的观察者模式observation，就是让大模型先对自己的处理结果进行分析；然后还有就是重试机制，让大模型在犯错的情况下，能够根据当前的问题进行优化，并再次尝试。

像强化学习，反馈学习等都是基于这个理念。

因此，我们在做大模型应用开发时，我们首先要明白一个理念——大模型犯错是必然的，而不是偶然的结果。

这也是为什么很多时候我们做应用时，明明刚开始是好好的，怎么突然之间系统就不能用了，然后过一会可能又好了，就这么时灵时不灵；原因就在于此，由于我们对大模型的错误结果没有处理好；就间接导致大模型出现错误而不自知，最后导致系统崩溃。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-21

OpenAI 的「群聊」，可能比你想得更重要！

2025-11-21

Aiops探索：基于 Dify + Prometheus MCP 的运维智能体实践

2025-11-21

融资800万美金，AI原生的文件夹也来了

2025-11-21

The Wasted Modes——界面模式消亡史

2025-11-21

大厂CIO独家分享：AI如何重塑开发者未来十年

2025-11-21

节省98.7%的Token用量！Claude Code MCP的正确打开方式

2025-11-21

AI编程开发的第一个产品：Skills Hub上线了！

2025-11-21

Nano Banana Pro 深夜炸场，但最大的亮点不是 AI 生图

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

从需求场景出发的AI应用项目落地方法论

2025-09-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

Qwen3-Coder与Claude Code深度对比：谁是你的AI编程助手？

2025-09-14

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

Claude Sonnet4.5发布，号称世界最强模型，超越gpt-5-codex

2025-09-30

大家都在问

如何利用 Google NotebookLM 实现精准、可溯源的内容生成呢？

2025-11-19

Snowflake CEO 复盘：为什么 LLM 时代企业需要一个 AI Data Cloud？

2025-11-19

为什么Mac在AI时代更有性价比？

2025-11-19

EI Search：生成式AI时代的知识探索新范式？

2025-11-18

Kosmos发布：一个让博士生“失业"的科研AI？

2025-11-18

oLLM 如何在 8GB 3060 Ti 上实现 100k 上下文推理？

2025-11-17

这种全新的交互方式，会成为未来AI应用的标配吗？

2025-11-15

Claude Skills 不就是把提示词存个文件夹吗？

2025-11-14

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部