微信扫码
添加专属顾问
我要投稿
Probabilistic vs. Deterministic
不确定性 vs. 确定性
薛定谔的猫
把一只猫、一个装有氰化氢气体的玻璃烧瓶和镭225物质放进封闭的盒子里。当盒子内的监控器侦测到衰变粒子时,就会打破烧瓶,杀死这只猫。根据量子力学的哥本哈根诠释,在实验进行一段时间后,猫会处于又活又死的叠加态。可是,假若实验者观察盒子内部,他会观察到一只活猫或一只死猫,而不是同时处于活状态与死状态的猫。
爱因斯坦觉得不对,他说:“我不相信上帝掷骰子。”
这个实验争论的焦点是,猫是在没有打开前就已经决定了死活,还是打开盒子那一瞬间才决定了死活。经典物理学派认为这只猫在没打开盒子前,早就生死已定,这是基本常识;而哥本哈根派则认为,没打开盒子,猫处于又死又活的状态,只有打开盒子才决定了猫的生死,这是微观粒子的特性。
哥本哈根派认为,这只猫实验的根本错误在于,人们用宏观世界的常识来判断微观世界的特性。
学术界的结论
在软件开发领域,尤其在大模型进入工作流后,也有确定性vs不确定性的区别。
注:这边的软件不考虑故意的随机性输出,比如随机数生成器。
在软件开发的数据流中,我们一般会遇到三种问题,白洞,黑洞,灰洞。解决掉这三类问题,数据流就成了。但隐含前提是确定的输入会产生确定的输出,软件要保证幂等,即不管第几次输入相同的内容,输出要是一致的。在实际开发中,没有幂等是不同次的输入事实上是不一样的,只是你以为一样而已。
对于特定的输入,软件的输出是确定的,这就是确定性。
大模型的token生成本质上是基于概率的,当输入完全一致的时候,输出也会不一样。
Greedy
大模型没有采用这个策略!
选择概率最高的单词/token,这样的方法叫做贪心算法,但是贪心算法会导致输出的重复性,因为贪心算法只会选择概率最高的单词,而不会考虑其他单词的概率。
Sampling
大模型采用这个策略!!
使用随机策略在所有token的概率中选择一个token。在这里,“cake”被选中的概率为 20%,但实际上选中的是“banana”。
Top-k
使用随机策略后,从前k个结果中选择一个token作为输出。
Top-p
使用随机策略选择一个输出,候选集为按概率排名靠前的连续结果,且累积概率<=p
不确定性是一把双刃剑
一方面,我们的生成更加的多样化,在一定程度上提高了生成的质量,比如生成的文本更加的丰富多样,更加的有趣。
另一方面,在期望json或者sql/代码等严格输出要求时,这种不确定性有时候是无法接受的。
大模型的不确定性,是由于模型的特性决定的,不是因为模型的实现问题。在LLM应用开发中,全流程的参与者都需要预判这种不确定性,以便更好的处理edge case。
FAQ:
原来的机器学习/深度学习是什么类型的?
一般来讲,这些的输出都是Greedy策略:只会选择概率最高的。对于确定的输入,会给出确定的输入。如果两次输出不一样,那一定是模型层面的输入不一样。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-09
奥特曼重磅发声:全AI公司是未来!OpenAI官宣Frontier,让管理Agent像管人一样简单
2026-02-09
全网最详细的Codex入门教程,手把手教你玩转Vibe Coding。
2026-02-09
张一鸣讲Context Not Control,真正的管理高手从不是在分配任务,而是请别人入局
2026-02-08
【访谈对话】造过 Codex 的人,为什么每天用 Claude Code
2026-02-07
程序员的最后一块拼图:为什么你必须学会用 Claude Code?
2026-02-07
OpenClaw 爆火却难部署?用 Cherry Studio 一键解锁,零门槛打造你的超级 AI Agent
2026-02-06
国产最强 AI 进军终端!Kimi Code CLI 正式发布,让你的命令行直接起飞
2026-02-06
AI记忆正成为新操作系统:检索已过时,生成式记忆才是未来
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2025-12-21
2026-01-09
2026-02-07
2026-02-04
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31