我要投稿

大模型落地难点之输出的不确定性

发布日期：2024-10-11 19:37:54 浏览次数： 2632

作者：真-忒修斯之船

微信搜一搜，关注“真-忒修斯之船”

Probabilistic vs. Deterministic

不确定性 vs. 确定性

量子力学-上帝掷骰子

薛定谔的猫

把一只猫、一个装有氰化氢气体的玻璃烧瓶和镭225物质放进封闭的盒子里。当盒子内的监控器侦测到衰变粒子时，就会打破烧瓶，杀死这只猫。根据量子力学的哥本哈根诠释，在实验进行一段时间后，猫会处于又活又死的叠加态。可是，假若实验者观察盒子内部，他会观察到一只活猫或一只死猫，而不是同时处于活状态与死状态的猫。

爱因斯坦觉得不对，他说：“我不相信上帝掷骰子。”

这个实验争论的焦点是，猫是在没有打开前就已经决定了死活，还是打开盒子那一瞬间才决定了死活。经典物理学派认为这只猫在没打开盒子前，早就生死已定，这是基本常识；而哥本哈根派则认为，没打开盒子，猫处于又死又活的状态，只有打开盒子才决定了猫的生死，这是微观粒子的特性。

哥本哈根派认为，这只猫实验的根本错误在于，人们用宏观世界的常识来判断微观世界的特性。

学术界的结论

微观世界：上帝掷骰子，在量子世界似乎真的存在着“上帝掷骰子”现象，也就是随机性概率性很大
宏观世界：上帝不会掷骰子，规律主导着一切，科学就是科学。

在软件开发领域，尤其在大模型进入工作流后，也有确定性vs不确定性的区别。

传统软件开发-确定性 Deterministic：

注：这边的软件不考虑故意的随机性输出，比如随机数生成器。

在软件开发的数据流中，我们一般会遇到三种问题，白洞，黑洞，灰洞。解决掉这三类问题，数据流就成了。但隐含前提是确定的输入会产生确定的输出，软件要保证幂等，即不管第几次输入相同的内容，输出要是一致的。在实际开发中，没有幂等是不同次的输入事实上是不一样的，只是你以为一样而已。

对于特定的输入，软件的输出是确定的，这就是确定性。

白洞：没有输入，但是有输出
黑洞：有输入，但是没有输出
灰洞：输入不足以产生输入

大模型应用开发-不确定性 Probabilistic：

大模型的token生成本质上是基于概率的，当输入完全一致的时候，输出也会不一样。

Greedy

大模型没有采用这个策略！

选择概率最高的单词/token，这样的方法叫做贪心算法，但是贪心算法会导致输出的重复性，因为贪心算法只会选择概率最高的单词，而不会考虑其他单词的概率。

Sampling

大模型采用这个策略！！

使用随机策略在所有token的概率中选择一个token。在这里，“cake”被选中的概率为 20%，但实际上选中的是“banana”。

Top-k

使用随机策略后，从前k个结果中选择一个token作为输出。

Top-p

使用随机策略选择一个输出，候选集为按概率排名靠前的连续结果，且累积概率<=p

经验教训 Bitter Lessons：

不确定性是一把双刃剑

一方面，我们的生成更加的多样化，在一定程度上提高了生成的质量，比如生成的文本更加的丰富多样，更加的有趣。

另一方面，在期望json或者sql/代码等严格输出要求时，这种不确定性有时候是无法接受的。

大模型的不确定性，是由于模型的特性决定的，不是因为模型的实现问题。在LLM应用开发中，全流程的参与者都需要预判这种不确定性，以便更好的处理edge case。

FAQ：
原来的机器学习/深度学习是什么类型的？
一般来讲，这些的输出都是Greedy策略：只会选择概率最高的。对于确定的输入，会给出确定的输入。如果两次输出不一样，那一定是模型层面的输入不一样。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-27

OpenAI深夜引爆GPT-5.6，三箭齐发全面围剿Anthropic

2026-06-27

Agent 发邮件踩坑全记录：从 SMTP 翻车到 Agently Mail

2026-06-27

AgentTeams 和 Claude Tag 都进入群聊模式，是新范式还是新叙事？

2026-06-27

GPT-5.6 Sol深夜炸场发布！OpenAI最强模型碾压Claude 5！

2026-06-26

腾讯混元AI Infra如何优化Hy3 Preview：一次大模型推理性能提升的技术拆解

2026-06-26

多智能体的记忆接线：同一任务，每个角色看到的不一样

2026-06-26

Agent 从 Demo 到生产级，中间到底差什么？

2026-06-26

Loop Engineering 到底是什么？看这一篇就够了

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

突发！Claude Code 源码泄露，扒出这些隐藏功能

2026-03-31

GPT-6，曝光了

2026-04-05

GLM-5.1 实测：面向 Agent 长程任务的国内第一模型

2026-04-02

重磅！GPT-6曝光了

2026-04-05

大家都在问

AgentTeams 和 Claude Tag 都进入群聊模式，是新范式还是新叙事？

2026-06-27

Agent 从 Demo 到生产级，中间到底差什么？

2026-06-26

微信在金矿上孵化了啥？

2026-06-25

企业智能体的下半场，如何让智能体越用越聪明？

2026-06-18

Agent 记忆，我们全都理解错了？

2026-06-18

如何利用 Harness “一句话交付产品功能”？

2026-06-10

Loop Engineering 循环工程又是什么鬼？

2026-06-10

Agent 工程化五件套：Prompt、Skill、MCP、CLI 到底怎么配合？

2026-06-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部