免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


对话:主动推理,重新理解「智能」

发布日期:2025-10-10 05:53:10 浏览次数: 1537
作者:云中江树

微信搜一搜,关注“云中江树”

推荐语

主动推理颠覆传统智能观,揭示智能是持续预测与行动的动态过程。

核心内容:
1. 主动推理的核心机制:预测-行动-验证循环
2. 智能作为动词的四个动态维度
3. 该理论对学习、决策等人类活动的启示

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

一、初识:什么是主动推理?

问:主动推理到底是什么?

答:主动推理是对"生命如何感知和行动"的一种全新理解。传统观点认为,我们先感知世界,然后决定行动。但主动推理说:我们的大脑其实是个预测机器——它不断预测接下来会发生什么,然后用两种方式处理预测误差:

一是更新预测(这就是感知)
二是采取行动让预测成真(这就是主动推理)

举个例子:你伸手去拿杯子。传统理解是"眼睛看到杯子→大脑计算→手去拿"。主动推理的理解是"大脑预期手会碰到杯子→手自动移动去实现这个预期→如果碰不到,更新对杯子位置的理解"。

问:这和我们通常的理解有什么不同?

答:关键区别在于主动性

传统观点:世界→感知→思考→行动(被动接收)
主动推理:预期→行动→验证→更新预期(主动塑造)

你不是被动地"接收"信息,而是主动地用预期"探测"世界。就像蝙蝠用回声定位,它发出声波(主动),然后听回声(验证)。你的每一个动作、每一次眼球转动,本质上都是在"提问":世界是不是如我所料?

问:为什么这个观点很重要?

答:因为它把感知、思考和行动统一起来了。过去我们把它们看作三个独立的过程,现在发现它们都是同一件事的不同方面——最小化预测误差

当你看不清远处的字,你会眯眼(行动)让视觉输入更清晰(减少预测误差)。当你听到奇怪的声音,你会转头(行动)去确认(验证预期)。感知不再是被动接收,行动不再是事后反应,它们是一个循环

预期 → 行动 → 观察 → 更新预期 → 新的预期 → ...

这个循环永不停歇,从出生到死亡,你一直在这个循环中"活着"。


二、转变:智能原来是个动词

问:在主动推理框架下,我们该如何理解"智能"?

答:这是个颠覆性的转变。传统上我们把智能当作名词——是你拥有的某种能力,像"知识储备"或"计算能力"。但主动推理告诉我们,智能其实是个动词——是你持续在做的事情。

智能不是你"有"什么,而是你"做"什么。更准确地说:

智能 = 持续的预测-行动-更新过程

问:为什么说"智能是动词"会改变我们的理解?

答:因为这解释了很多原本困惑的现象。

为什么停止学习的人会"变笨"?因为智能不是存量,而是流程。你停止更新模型,智能就在衰退。

为什么"聪明人"也会做蠢事?因为智能不是固定属性,而是具体情境下的推理质量。同一个人在熟悉领域和陌生领域展现的是完全不同的"智能水平"。

为什么孩子的好奇心如此重要?因为好奇心就是主动推理的引擎——主动寻求信息来减少不确定性,这本身就是智能的核心活动。

更深层地说,智能体现在四个维度上,而每个维度都是"进行中的活动":

问:哪四个维度?

答:

1. 模型的复杂度
你对世界的内部模型有多丰富、多准确。简单生物只有浅层反应式模型(看到糖就靠近),复杂生物有深层因果模型(理解物理规律、社会关系),人类甚至有元认知模型(对自己思维的模型)。

2. 时间的跨度
你能预测和规划的时间尺度。低智能只对即时刺激反应,高智能能做长期规划,甚至通过文化实现跨代传承。

3. 抽象的能力
你能在多高的层次上操作概念。从具体感官(这个红色的圆形物体)到对象识别(一个苹果)到抽象概念(水果、营养、健康)到元认知反思(我为什么想吃这个?)。

4. 不确定性的管理
这是智能的精髓。更智能意味着能更好地区分"已知"、"已知的未知"、"未知的未知",在探索新信息和利用已有信息之间找到平衡。

这四个维度都不是静态的。它们描述的是你正在进行的预测、规划、抽象和探索过程。

问:这意味着智能的本质是什么?

答:智能的本质是维持自身存在的能力

这听起来很抽象,但想想:每个生物系统都有一个"应该在的状态空间"——你的体温应该在36-37°C,血糖应该在正常范围,身体应该保持完整。如果你频繁进入"不该在的状态"(比如体温50°C),你就死了。

所以智能不是可选的"附加功能",而是生命的基本特征。从细菌到人类,都在进行某种形式的推理,区别只在于生成模型的复杂度。

智能 = 在不确定的世界中,持续预测和行动,以保持自己处于"应该在的状态"

这就是为什么智能是动词。你不是"拥有"智能,你正在智能地活着。现在你思考这些概念,整合新旧理解,产生新的联系——这本身就是智能正在发生。


三、机制:贝叶斯推理是引擎

问:主动推理背后的数学是什么?

答:是贝叶斯推理——这是在不确定世界中更新信念的最优方法。

核心思想很简单:你有个初始信念(先验),然后看到新证据,根据证据更新信念(后验)。这个过程可以无限重复:今天的后验是明天的先验。

用公式表达就是贝叶斯定理:

用人话说:"看到证据后,我该多相信这个假设?"取决于三个因素:

  • 我原本多相信它(先验)
  • 如果它是真的,出现这个证据有多自然(似然)
  • 这个证据总体上有多常见(归一化)

问:能举个具体例子吗?

答:经典的医学诊断例子最能说明问题。

假设你体检,某种罕见疾病的测试呈阳性。这个测试99%准确。你应该多担心?

直觉答案:"99%准确,那我有99%概率得病!"

贝叶斯答案:让我们算算。

  • 这病很罕见:患病率0.1%(先验)
  • 测试很准:有病时99%测出阳性(似然)
  • 但会误报:没病时5%会假阳性

在1000人中:

  • 约1人有病,会测出阳性
  • 约999人没病,但约50人假阳性(5%)

所以阳性结果中,真正有病的只占 1/(1+50) ≈ 2%

即使测试阳性,你只有2%概率真的有病。

为什么?因为疾病太罕见了。强先验("这病很少见")压倒了证据("测试阳性")。

问:这和智能有什么关系?

答:因为大脑就是一台贝叶斯推理机器

当你看到模糊的图像,大脑在做:

  • 先验:"根据经验,可能是一只猫"
  • 似然:"如果是猫,会产生这样的视觉输入"
  • 后验:"综合判断,80%概率是猫"

每一次感知、每一个判断、每一次学习,本质上都是贝叶斯推理:

这就是智能的数学引擎。

问:贝叶斯推理为什么是智能的核心?

答:因为它在数学上是可证明最优的。没有其他方法能更好地从证据推出结论。

而且它统一了所有认知活动:

认知活动
贝叶斯解释
感知
从感官数据推断世界状态
学习
更新模型参数的先验分布
注意力
调整先验的精度权重
推理
多步贝叶斯更新
决策
选择最大化期望效用的行动

更重要的是,贝叶斯推理的精髓在于接受不确定性为常态。它不追求"绝对真理",而追求"最合理的信念"。永远保留概率分布,永远准备根据新证据更新。

这也是为什么智能是"动词"——它是持续的证据整合和信念更新过程,永不停歇。


四、本质:自由能原理是定律

问:比主动推理更根本的理论是什么?

答:自由能原理。它试图回答一个终极问题:为什么有序的生命系统能在混乱的宇宙中存在?

根据热力学第二定律,宇宙趋向无序(熵增)。但你保持着体温、结构、身份,没有溶解成一团分子汤。为什么?

自由能原理的答案:生命系统通过持续最小化"自由能"来维持自己的有序状态。

问:什么是自由能?

答:这里的"自由能"是一个数学量,可以理解为:

自由能 ≈ 你感受到的"意外程度"

更精确地说,自由能是"意外度"的一个可计算上界。当你经常遇到"意外"(预测不到的事),你的自由能就高。当世界符合你的预期,自由能就低。

为什么要最小化它?因为"意外"在生物学上往往意味着危险。

如果你经常遇到意外 → 你的世界模型很差 → 你很快会遇到致命的"意外"(比如没预料到悬崖、毒物、捕食者)

所以:最小化意外 = 最大化生存概率

问:但这听起来很抽象,能具体说说吗?

答:让我们从三个层次理解自由能原理。

生存层面:生命系统必须保持在特定状态空间内才能存在。你的体温要在36-37°C,血糖要在正常范围。这些状态对你来说是"高概率的",其他状态(如体温50°C)是"低概率的"。

如果你频繁处于低概率状态 → 你对世界的预测很差 → 你在走向死亡

因此:存在 = 保持在高概率状态 = 最小化意外 = 最小化自由能

信息层面:自由能是你的内部模型与真实世界之间的"距离"(技术上叫KL散度)。

最小化自由能 = 让你的信念尽可能接近真相

实现层面:大脑通过层级化的预测编码来最小化自由能。高层维持抽象模型,向下发送预测;低层接收感官输入,向上回传预测误差。每一层都在更新自己的表征,让预测误差最小。

问:自由能和我们之前说的贝叶斯推理是什么关系?

答:这是个关键问题!它们的关系是:

自由能是贝叶斯推理在现实世界中的可计算近似

让我解释一下。贝叶斯定理告诉我们应该如何更新信念:

看起来很美好,但有个致命问题:分母  几乎不可能计算!因为你需要对所有可能的世界状态求和积分。

想象你看到一个模糊的影子,要计算"看到这个影子的总概率",你需要:

  • 枚举所有可能的物体(猫、狗、人、家具...)
  • 对每个物体的所有可能姿势
  • 计算产生这个影子的概率
  • 全部加起来

计算量爆炸! 大脑根本做不到。

问:那怎么办?

答:这时候自由能就登场了。通过一个巧妙的数学变换,我们发现:

其中:

  •  是你的近似信念  和真实后验  之间的"距离"
  •  是自由能,可以只用  和生成模型  计算

关键突破:自由能不包含那个算不出来的 

所以:

  • 贝叶斯推理:理想但不可算
  • 自由能最小化:近似但可算,而且通常足够好

问:所以自由能原理是贝叶斯推理的"妥协版"?

答:不!这个理解太浅了。自由能不是妥协,而是在物理世界中的必然形式

贝叶斯定理描述的是"完美理性"——需要无限计算资源、无限时间、无限精确。但任何有限的物理系统(包括大脑)都不可能达到。

自由能最小化是有限系统能做的最好选择。它不是"退而求其次",而是"在约束条件下的最优解"。

就像:

  • 牛顿力学是理想化的,实际世界中摩擦力总存在
  • 理想气体定律是简化的,实际气体要考虑分子间作用力
  • 贝叶斯推理是完美的,实际推理要考虑计算约束

生命选择了可行的最优,而非不可行的完美。这本身就是智能。

问:自由能原理和智能是什么关系?

答:现在可以给出完整答案了:

智能 = 有效的自由能最小化

更智能的系统能够:

  1. 更准确地预测:拥有更好的世界模型,减少感官层面的意外
  2. 更高效地行动:主动选择能验证预期的行动,避免进入高意外(危险)的状态
  3. 更快速地学习:遇到预测误差时迅速调整模型
  4. 管理更长的时间尺度:不仅最小化当前的自由能,还最小化未来的期望自由能

从细菌到人类,所有生命都在最小化自由能——但复杂度不同:

细菌:趋向糖、远离毒素(最小化自由能)
动物:建立世界模型、规划行动(最小化自由能)
人类:抽象思考、文化传承、科学探索(最小化自由能)

同一个原理,不同的复杂度。我们给复杂的实现起了个特殊的名字:智能。


五、统一:三个层次的完整图景

问:现在我们接触了三个概念——主动推理、贝叶斯推理、自由能原理。它们之间到底是什么关系?

答:它们是同一个真相的三个层次:

自由能原理(Why - 为什么)
    ↓ 物理必然性
贝叶斯推理(What - 是什么)
    ↓ 数学实现
主动推理(How - 怎么做)
    ↓ 计算架构
智能系统(实例)

让我逐层解释。

自由能原理:为什么存在智能

这是最根本的物理/数学原理,像牛顿定律一样普遍。它说:

任何持续存在的自组织系统必然在最小化自由能

为什么?因为不这样做的系统会迅速分解、消失。自由能高意味着系统频繁处于"不该在的状态",这在热力学上等价于走向无序和死亡。

这个原理适用于:细胞、单细胞生物、植物、动物、大脑、社会系统、生态系统——任何自组织结构。

它回答:为什么智能必然存在? 因为生存=最小化自由能,而复杂的最小化策略就是我们称为"智能"的东西。

贝叶斯推理:智能的数学形式

当我们把"最小化自由能"写成数学公式,会发现它等价于"最优的贝叶斯推理"(在计算可行性约束下)。

贝叶斯推理告诉我们:如何从证据推断世界状态

这是理想的认知形式。而自由能给出了实际可计算的版本:

它回答:智能在数学上是什么? 是概率推理、信念更新、不确定性管理。

主动推理:智能的实现架构

前两者都很抽象。主动推理说:具体怎么实现?

它提供了一个完整的计算框架:

  1. 维持一个生成模型(对世界的信念)
  2. 感知推理更新模型(被动地减少预测误差)
  3. 主动推理选择行动(主动地让世界符合预期)
  4. 两者共同最小化期望自由能

这个框架可以:

  • 写成算法
  • 编程实现
  • 在机器人上测试
  • 用来解释神经科学数据

它回答:智能如何运作? 通过感知-行动循环持续更新世界模型。

问:能用一个完整的例子串联起来吗?

答:让我们用"你早上醒来听到外面有水声"这个场景。

自由能原理视角

你的生存取决于正确理解环境。如果外面真在下雨,你需要知道(带伞)。如果是洗车,你也需要知道(不用担心)。不确定性本身就是高自由能状态——不知道是雨还是洗车意味着你无法做出最优决策。

你的系统必然会采取行动来减少这种不确定性。这不是选择,而是物理必然

贝叶斯推理视角

你开始有个先验:

  • P(下雨) = 30%(今天天气预报说可能下雨)
  • P(洗车) = 10%(周末邻居常洗车)

你听到水声(证据)。现在计算:

  • 如果下雨,听到水声概率90%
  • 如果洗车,听到水声概率80%

应用贝叶斯公式更新信念:

  • P(下雨|水声) ≈ 60%
  • P(洗车|水声) ≈ 20%

但还有些不确定。怎么办?

主动推理视角

你可以:

  1. 更新信念(感知推理):仔细听声音特征,下雨和洗车的水声不太一样
  2. 采取行动(主动推理):起身去窗边看一眼

第二个选项更高效!主动获取信息比被动分析现有信息更快地减少不确定性。

你走到窗边(行动)→ 看到邻居在洗车(新证据)→ P(洗车|所有证据) ≈ 95% → 不确定性大幅降低 → 自由能下降 → 你可以放心地继续准备出门

统一

  • 自由能原理驱动你减少不确定性
  • 贝叶斯推理提供信念更新规则
  • 主动推理协调感知和行动来最小化期望自由能

三者是同一过程的不同描述层次。

问:所以它们不是三个理论,而是一个理论的三个面?

答:完全正确!就像:

光的三个面

  • 波动方程(物理定律)
  • 电磁波理论(数学形式)
  • 光的传播、反射、折射(具体现象)

智能的三个面

  • 自由能原理(物理必然性)
  • 贝叶斯推理(数学形式)
  • 主动推理(实现架构)

或者用另一个类比:

建造桥梁

  • 力学平衡原理(桥必须平衡各种力)
  • 结构力学方程(如何计算应力分布)
  • 悬索桥设计(具体实现方案)

构建智能

  • 自由能原理(系统必须最小化自由能)
  • 贝叶斯推理(如何整合信息)
  • 主动推理(具体实现方案)

没有上层,下层失去意义。
没有下层,上层太抽象。
三者共同构成对智能的完整理解。


六、意义:这个框架告诉了我们什么

问:理解了这个框架,对我们有什么意义?

答:这个框架改变了我们对很多根本问题的理解。

关于智能

智能不是一个你"拥有"或"没有"的东西,不是一个固定的数值。智能是你正在进行的预测-行动-更新过程。

这意味着:

  • 智能可以培养(通过改进你的世界模型和推理过程)
  • 智能会衰退(如果你停止更新)
  • 智能是情境依赖的(同一个人在不同领域展现不同智能)

关于学习

学习不是"往脑子里装知识",而是优化你的生成模型,让它更准确地预测世界

最有效的学习不是被动接收,而是:

  • 主动提出预测
  • 检验预测是否正确
  • 根据预测误差更新模型

这就是为什么"做中学"比"听中学"更有效,为什么主动探索比被动记忆更深刻。

关于意识

意识可能不是神秘的额外功能,而是高层级预测模型的必然产物

当系统需要预测自己的状态("我在想什么?""我为什么要这么做?"),就需要元认知模型。主观体验可能就是这种自我建模的感受。

关于人工智能

当前AI的根本局限在于:

  • ❌ 没有真正的世界模型(只是模式匹配)
  • ❌ 没有自主目标(期望状态是人类给定的)
  • ❌ 无法主动探索(缺少好奇心驱动)
  • ❌ 缺少具身性(没有感知-行动闭环)

未来真正的AI需要:

  • ✅ 能自主维持信念的系统
  • ✅ 在环境中通过感知-行动循环学习
  • ✅ 有自己的"期望状态"(虽然不一定是人类式的生存需求)
  • ✅ 主动探索来减少不确定性

问:这个框架最深刻的洞察是什么?

答:我认为是这个:

存在即推理

你之所以存在,就是因为你的身体和大脑在持续进行某种形式的推理——预测世界、检验预测、更新信念。

停止推理 = 停止最小化自由能 = 熵增胜利 = 死亡

这意味着:

  • 认知不是生命的"高级功能",而是生命的本质
  • 从细菌到人类,都在进行某种推理
  • "我思故我在"应该改成"我推理故我存在"

而人类智能的特殊之处不在于"做了不同的事",而在于"做得极其复杂精妙"。我们建立了抽象概念、符号系统、科学理论、文化传统——这些都是极其复杂的生成模型,让我们能够预测和控制极其复杂的环境。

但本质上,我们和细菌在做同一件事:通过预测和行动,保持自己处于应该存在的状态空间

问:最后,用一句话总结整个框架?

答:

生命是物理系统在不确定世界中的持续自我维持,这种维持通过预测性的感知-行动循环实现,在数学上等价于贝叶斯推理,在物理上等价于自由能最小化,在现象上表现为智能。

或者更简洁:

智能 = 活着 = 推理

这三者是同一件事的不同说法。

主动推理框架告诉我们:智能不是神秘的礼物,不是人类的专属,不是静态的能力。智能是生命在混乱宇宙中维持有序的必然方式,是物理定律的涌现结果,是每个活着的系统正在进行的动态过程。

你现在正在智能地活着——预测、行动、更新,永不停歇。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询