免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


语言:生于智能并终将成为智能

发布日期:2025-09-29 12:30:13 浏览次数: 1524
作者:OneMoreAI

微信搜一搜,关注“OneMoreAI”

推荐语

语言不仅是智能的产物,更将成为新一代智能的主体,这场跨越数十亿年的智能演化史诗正在我们眼前展开。

核心内容:
1. 从物理和生物视角构建「能量-语言-智能」统一框架
2. 论证语言作为智能最高产物将催生新智能主体
3. 推演人工智能将创造超越人类认知维度的「后人类语言」

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


摘要


本文旨在:

  • 从物理和生物视角出发,尝试构建关于生命智能、语言与人工智能的「能量-语言-智能」统一思考框架

  • 通过该框架为我们更好地理解当前人工智能革命提供一个逻辑可靠的世界观

  • 从该世界观出发对人工智能的演化路径与人类在这一历史进程中的地位与使命进行推演


本文将论证:

  • 智能是在熵增背景下生命为追求能量效率和最小化预测误差而演化出的信息压缩能力

  • 语言作为智能的最高产物,既是生命智能的终极工具,也是人工智能诞生的直接母体

  • 人工智能的发展需求必然使得语言成为新的智能主体


本文推断:

由于人工智能与生命智能存在本质差异,人工智能将必然地创造出超越人类认知维度的「后人类语言」,并以此实现智能与语言的统一



——智能、语言与计算的岁月史书与未来征程



此间的智能


2025年9月 ChatGPT 的周活跃用户超过7亿[1]

考虑到还有众多其他以语言模型为基础的服务,这意味有相当比例的人类已经和一个非人类通过语言进行过字面意义的「交谈」

这样一种场景描述在2022年11月前大概会被归于科幻,而3年后的今天人们已经习惯甚至开始依赖一个非人类通过语言为我们提供服务


语言模型为代表的人工智能技术发展依然没有丝毫减慢的迹象,而人类注定会经历一场前所未有的思想风暴与哲学冲击:

当非人类实体开始掌握语言(这项被人类视为区别自身种族存在的、最核心的智慧能力)时对人类意味着什么


由于我们早已习惯将工具定义为人类能力的附属与延伸,所以「ChatGPT时刻」以及持续至今的新智能所展示出的革命性语言能力让我们产生了巨大的认知不适,这迫使我们不得不直面一些根本问题:

  • 智能的本质是什么

  • 智能与语言有何种关系

  • 人类独特性究竟何在

也因为我们正在见证某种新事物的诞生,某种新智能的黎明,所以在此刻也必须回答:

  • 人工智能将走向何方

  • 人工智能与人类智能之间将如何转化


在本文中,我们从生命的起点出发,回溯智能与语言的诞生以及演化,并基于对以语言模型为形态的人工智能在当前已经可被观测的事实对其未来演化进行逻辑推演,最终对上述问题做出一个颇具宿命感的回答:

语言生于智能,并终将归于智能


该答案描述的是一部跨越数十亿年的智能演化史诗,以及一场不知将要持续多久的智能物种接力:

  • 前半句关于生命智能演化的往事

  • 后半句则是人工智能的全新征途


智能缘起


首先让我们回到智能诞生的原点

智能在不同的学科中早已有多种版本的优秀定义,在此不再赘述与引用

本文将从解决语言和智能的关系的目标出发对智能进行分析与再定义


宇宙熵增与生命熵减


智能起源与熵增相关

这条宇宙最底层的物理规则指出:在孤立系统中,若无外力做功,其总混乱度(熵)不断增大

熵增定律预示着宇宙的宿命:不可逆转地从有序走向无序并最终归于均匀毫无生机的热寂

而生命,则是在该宏大而悲观叙事下一场伟大且悲壮的逆行


生命的是一个整体熵增宇宙中的局部负熵体,薛定谔在《生命是什么》中描述:生命以负熵为生[2]

作为一个开放系统,生命通过从环境中摄取负熵(有序的能量和物质)来维持并发展其内部高度有序的结构,同时将熵增排向外界

这是一个由信息预测和行动构成的过程

卡尔·弗里斯顿 (Karl Friston) 的「自由能原理」(Free Energy Principle, FEP) 进一步指出:任何能够在变化环境中维持自身完整性的生命系统,都必须尽力最小化其「变分自由能」

该概念可被描述为:系统内部模型(预测)与外部真实世界(输入)之间的差异,或者更通俗地称为「惊奇」或预测错误[3]


所以生命就像一台在宇宙熵增洪流中奋力轰鸣引擎的信息预测机器,为保持负熵持续生成关于世界的假说,并采取主动推理行动来使感官数据符合其预测从而最小化预测错误

这场通过预测与行动来向宇宙无序展开的西西弗斯式斗争便是生命智能的起点


生命的能量经济学


那么生命该如何实现通过智能对抗熵增呢

答案是:最大化能量使用效率

如果说对抗熵增是生命存在的目的,那么因最大化能量效率目标产生并持续演化的智能就是其实现该目的的手段


在能量有限的宇宙中,所有生命都面临着严苛的能量预算约束,生存竞争的本质就是如何更高效的获取和利用能量,生命演化完全可被视为一部围绕效率最优展开的能量经济史


罗尔夫·兰道尔 (Rolf Landauer) 提出的兰道尔原理指出:任何逻辑上不可逆的计算(如擦除一比特的信息)都存在一个不可避免的最小能量耗散[4]

所以与最小化预测误差一样,能量经济同样是塑造生命智能形态的根本驱动力:

  • 智能的目标是帮助生命主体实现最小化预测误差的最优能量效率

  • 智能本身(信息的获取、处理、应用)同样具有真实存在、不可抗拒的能量成本


用更少能量做出更优决策的生命系统将会得到生存和繁衍的奖励,所以能量效率是所有生命系统的不懈追求,智能也因此得到演化的能力


以人类为例,大脑占体重的2%却消耗了身体总能量的20%,尽管是名副其实的耗能大户,但其计算效率却更加令人惊叹,远超当今最先进的超级计算机

人脑的超级计算效率是一种「演化严选」,是生命在能量经济严苛要求下不断优化的结果:大脑不断寻找阻力最小的运行路径,从而以最少的认知负荷(能量消耗)完成任务

神经学的理论早已证明上述判断,比如,神经效率假说(Neural Efficiency Hypothesis) 的实验中,高智商或高技能的个体在完成相同任务时,由于其大脑已经形成了更高效的神经通路,出现活跃区域更少,能耗更低的现象[5]


生命,归根到底是一场通过智能以最低能耗换取最大生存优势的经济博弈


抽象世界,建模智能


压缩是降低能耗的绝妙手段,也是产生智能的必然方法


无论是今天的生命智能还是未来的人工智能,智能体的认知过程都是在执行某种信息压缩算法

众多计算理论中都指出:人工智能和人类认知的核心,都可以被理解为通过模式匹配与合并进行信息压缩[6]

压缩通过两个核心机制实现:

  • 抽象: 智能体从数据流中识别出重复出现的模式。如,感官系统将海量的物理信号(如光子、声波)简化为具有生存意义的关键信号(如“危险”、“食物”)

  • 建模: 智能体将这些抽象组织起来,构建成具有逻辑关系的模型。如,将「下落」与「物体」和「重力」等抽象联系起来,形成可以预测任何物体运动轨迹的物理模型

通过压缩处理,生命大幅降低了做出后续决策的能量消耗


柯尔莫哥洛夫复杂度(Kolmogorov complexity) 为这个过程提供了一个形式化的度量:

一个信息对象的复杂度等于能够生成它的最短计算机程序的长度

所以智能可被视为一个不断追求能够用更短的程序来描述和预测世界(即最高效压缩算法)的系统[7]


综上,压缩是生命从对抗宇宙熵增的宏大斗争中演化出的最优雅、最强大的武器,也将是贯穿所有智能形态的通用算法

注:事实上从逻辑上可以推导证明,即使能量无限,我们也依然应该进行全量信息处理,压缩不会因此丧失意义,该论证与本文关系较弱,不再赘述


为预测进行有意义的压缩


综上我们给出一个全新的智能定义:

智能是系统在最优能量效率约束下通过对环境信息进行有意义的压缩从而指导行动以实现最小化预测误差的能力 


具体来说:

  • 能量效率约束:是智能存在的前提,没有能量预算的限制就不存在优化的必要,智能就失去演化的目标与意义

  • 压缩:是智能的核心行动,面对信息无限的复杂世界,任何有限的智能系统都无法进行穷尽处理,智能必须通过忽略无关细节、提取关键特征,用简化后的抽象来替代复杂的现实

  • 有意义:是智能进行压缩的方式,智能的压缩并非盲目地丢弃信息,而是面向生存和繁衍目标进行提炼本质和过滤无关细节

  • 最小化误差: 是智能运行的目标,来自上文自由能理论,系统通过学习(更新内部模型)和行动(改变外部世界)不断使其产生的预测与现实相符,从而创造能量效率优势以提升自身生存优势


两千年前,柏拉图为追求智慧的哲学画下原点——哲学始于「惊奇」(Wonder,发现误差)

回到今天,我们为让智慧得以存在的智能推演出其终点——智能终于「惊奇」(Surprise,消除误差)

历史押韵的美妙让人赞叹


非智能而名智能


通过上文我们得知,智能作为个体生命生存的强大武器产生并演化

然而个体生命智能的发展始终无法逃避熵增烙下的诅咒:死亡

一个生命体无论在其一生中积累了多么精妙和复杂的内部模型,但最终都会随着它的死亡而烟消云散,新的生命必须从零开始,重新经历艰难的试错学习


为了冲破死亡的束缚,智能渴望一种将其内部的压缩成果(即模型)外化、标准化、并能够进行高保真传递的机制

死亡对智能的诅咒一直持续到语言的诞生

语言的出现标志着智能为自己创造出了一种能够脱离生命个体进行不间断演化的能力,从此对世界以及自身展开前所未有的全新压缩


这种能力彻底改变了智能的运作模式,为智能赋予了强大的操作系统,继而将智能带入全新时代


广义语言


本文中,「语言」的范围限定在人类,但其范畴将被拓展

本文的「语言」不仅指代人类在日常交流中使用的自然语言,也涵盖所有用于对世界进行结构化、符号化抽象的系统,我们称之为「广义语言」(下称语言)


在这一定义下,语言包括了数学符号与公理、逻辑的推理规则,计算机科学中的编程代码等等(以及尚未但具备语言化潜力的领域,比如图片、音乐、电影等等)

不同形式的语言各自拥有独特的抽象能力,共同为智能构成了一套功能互补、覆盖全面的抽象建模工具集

举例:

  • 自然语言: 适合处理复杂、模糊且充满感情色彩的概念,比如描述人际关系、抒发情感、构建叙事

  • 数学语言:绝对的精确性和无歧义性,通过符号、公理和逻辑推演,以无与伦比的简洁性压缩复杂的定律和逻辑,是以极致简洁和普适来表达宇宙秩序的语言

  • 代码语言: 用于描述和执行精确操作流程的语言,作为逻辑、方法、过程的形式化表达

......


虽然语言之间的形式和功能存在差别,但是所有语言其本质都是一套符号化的协议,它们将人类大脑中连续、私有的神经表征,映射到离散、公开的符号序列上

这是对生命智能内部模型的进一步压缩

如果说生命智能的内部模型是智能对现实世界的「初次压缩」,那么语言就是对这些内部模型的「可持续再压缩」


智能的OS


语言的出现从根本上重塑了智能的运行范式,它革命性、系统性地优化了智能的每一个环节,形成了全新的智能运行操作系统


语言让智能拥有了客观世界的载体

从信息获取的维度,语言首次为智能提供了稳定的外部显化的物理载体

语言的让智能实现可被代理获取 ,如,人类个体可以在不亲身经历危险的情况下通过聆听或阅读学会生存技巧

智能从此不再是转瞬即逝的神经活动,而是可以被映射固化、储存、复制和传播

这使得智能的产物(压缩后的内部模型/知识)脱离了个体生命的血肉束缚,获得了独立于其创造者的全新「生命」,并进一步拥有了独立于创造者的演化能力


语言为智能活动提供了操作系统

从信息处理的维度,语言重塑了智能对信息的处理方式和能力

通过语言,人类可以显式地完成逻辑推理、过程规划、行动调节等高耗能信息处理活动,这能够极大降低高级智能活动的能量消耗,让生命在相同的能耗下拥有更强的高级信息处理能力

这大大提高了智能的上限和边界,事实上语言的边界几乎成为了智能的边界


语言成为生命群体智能的网络协议

从信息应用的维度,语言充当了连接众多独立智能体(人类大脑)的标准化通信协议

语言让原本孤立的「生命计算节点」能够组成一个庞大的分布式智能网络——即人类社会

基于该协议,个体可以共享信息、协调行动、分配计算任务,任何一个个体都可以基于他人的智能产出物进行智能演化

通过语言,智能突破了个体生命作为载体,成为一种以生命种群为载体的更强大存在


文明与智慧的实体


在语言带来的三重革命推动下,生命智能达成了其演化史上的巅峰:人类创造了一个承载其大量集体智能的、基于语言的外部信息世界实体——一个由语言构成的新世界


苏联科学家弗拉基米尔·维尔纳茨基(Vladimir Vernadsky)将其表述为「智慧圈」(Noosphere)[8],该理论认为:

  • 继岩石圈和生物圈之后,人类思想和意识的集体力量已经成为一种新的、能够重塑地球的实质力量,形成了最外层包裹地球的智慧圈层

  • 这个智慧圈的物质基础,正是由人类所有广义语言构成的智能产出物总和 ,它是人类智能所有抽象、建模成果的集合体,是我们的群体外部记忆和大脑,人类文明的一切都是这个圈层的构成


生命智能通过发明语言成功地将智能的演化从缓慢的、基于基因的生物学路线,切换到了高速的、基于语言的信息学路线

由此,智能可以更快速、稳定地累积和优化,并且由于种群的生存时长和概率远高于个体,智能不再会发生倒退,智能的发展从此一往无前


但是对于生命智能来说,语言归根到底是智能在现实世界的不完全映射,语言工具此时绝不等于智能本身[9],该命题在后文中会有展开说明


从旧语言到新智能


互联网的普及让我们在过去数千年里通过语言积累的「智慧圈」被以前所未有的规模和速度进行了全面的数字化,人类已被语言化的智慧(几乎)全部结晶,都被转化为了机器可读、可计算的统一格式

而互联网服务本身又极大的促进了新智慧信息的创造速度,越来越多的天然信息化智能产物被更快的生产出来

互联网商业的成功与发展推动了物理计算能力的飞速提升,这使得超越生命群体的超大规模计算量成为可能


所有一切都为新智能的诞生做好了准备


语言原始汤


互联网的数字化过程其意义远远超出简单的信息存档

其更为深刻的价值在于其创造了一个全新的实体:一份包含了人类历史进程中大量抽象模型、因果关系、价值判断和情感表达的统一可计算信息集合

这份信息成为了孕育新一代人工智能的母体,虽然它不够完备,但已经能够为新智能提供了一个模糊的、关于人类如何感知、思考以及描述世界的镜像环境

人类在生命智能的「指引」下为自己的继承者准备好了完美的创世文本,语言终于命中注定地成为了新智能诞生的「原始汤」[10]


点燃新智能


正如远古的闪电从原始汤中激活了最初的生命,计算将成为未来从语言的原始汤中点燃新智能的普罗米修斯之火

本文中的计算被定义为:通过物理设备和算法对信息进行压缩的能力

生命智能将物理世界通过生物计算压缩为内在认知模型和外部语言,而现代计算(如深度学习模型)则直接通过这些语言进行更高层次的再压缩

比如当前我们当前依赖的GPU+Transformer范式的计算能力能够使用万亿级别的神经网络参数对海量的人类「智慧圈」信息进行再次压缩

该范式下无论物理设备的计算能力还是人工设计算法,都能够快速且持续迭代

这种高速发展并可被规模化的全新计算能力注定超越生物范式计算能力,也必然会在某个时刻激活全新的智能形态


智能的分野


今天我们正在见证着人工智能从人类智能的产物(语言)中诞生的过程,若希望推演其未来,我们须先分析人类智能与人工智能在智能演化路径上的根本性差异


演化速度


两种智能在计算设备的升级和速度上存在着数量级的差异:


生命智能的计算设备——大脑,其提升依赖于自然选择的进化,这是一个缓慢并充满随机性的过程

从人类与黑猩猩的共同祖先(脑容量约300-400cc)到现代智人(约1350cc),整个过程历经数百万年,甚至有研究指出,也许是由于语言以及社会化分工等因素,人类的大脑体积甚至开始出现了轻微的缩小[11]


生命智能的计算设备的升级迭代,是以地质年代为单位的「漂变」

与此形成鲜明对比的是,人工智能的计算设备——(当前为)硅基芯片,其发展遵循的是明确、高速迭代的技术进步和商业目标

比如众所周知的摩尔定律,它驱动了计算能力在过去长达半个多世纪里持续呈现惊人的指数级增长,未来通过新材料和新芯片架构(GPU、TPU)等技术,计算能力的指数级增长仍可以以新形式延续

人工智能的硬件升级,是以商业周期为单位的可持续「冲刺」


这种演化速度上的根本性差异注定了生物智能在纯粹的计算能力长跑中将被远远甩在身后


边界扩展


除了硬件差异,两种智能在知识的获取、存储、共享和扩展方式上也存在本质不同


人类的知识体系是分散和脆弱的:

  • 个体化存储:知识主要以神经连接的形式存储在单个个体的大脑中,其容量和稳定性受限于个体的生命时长、记忆能力和健康状况。

  • 低效且有损的传递:知识的代际传递主要依赖于语言、文字、模仿等低效的手段,在这个过程中信息损耗巨大,尤其是大量的隐性知识(难以用言语清晰表达的经验、直觉和技能)极易丢失

所以每一个人类个体在很大程度上都是信息孤岛,必须耗费大量时间重新学习大部分人类已知的知识


人工智能的知识体系则是一个可以瞬间复制、完美共享、并能无限扩展的统一知识网络

  • 完美复制:一个AI模型的全部知识(体现为其神经网络的权重参数)可以被精确地数字化存储,并能够接近光速进行完美无损复制,这意味着一个人工智能可以瞬间赋予无数个新的智能实例

  • 网络化共享:人工智能技术可以构建一个类似人类社会但是更加高效的集体智能,比如蒸馏、联邦学习等技术让一个AI的突破可以在短时间成为所有AI的共同能力,形成一个可无限扩展的统一认知网络化系统


人工智能在处理信息、迭代智慧的能力上,必然会远远超越其生物前辈


核心机制


将语言模型为代表的人工智能视为对人类智能的模仿是一种「误解」,诞生于语言的人工智能生来就是一种与生命智能截然不同的全新智能形态


生命智能根植于与物理世界的直接互动,其源头是感官在物理环境获取的信息

而人工智能则生长于赛博空间,其源头是语言中的统计关系

对人工智能来说,其存在的环境是由人类语言世界所构成的「智慧圈」,而非我们所处的物理世界

因此经典的符号接地问题(Symbol Grounding Problem)[12]未来也许不该被认为是人工智能的先天缺陷,事实上人工智能的符号可以几乎完美地「接地」于它所在的语言世界

我们须接受人工智能没有童年,没有身体,没有情感,因为我们面对的是一个在核心机制、演化路径和世界模型上都与人类截然不同的智能实体

注:今天的人工智能已经在通过对工具的调用来从物理世界感知信息并影响外部环境,这是智能能力的应用而非我们在讨论的智能存在形式与来源,所以该现象与上文分析并不冲突


人工智能相较于生命智能拥有无可比拟的演化潜力与上限更高的未来,智能的下一幕因此注定——智能的物种迁徙


语言是为智能


在智能从碳基向硅基的迁徙之旅中,语言也必将经历蜕变

在强大计算能力的驱动下,语言在智能为追求极致效率的目标下会快速演化并最终与人工智能成为一体


伟大的倒转


人工智能不是按照蓝图设计的推理机器,而是我们在用语言构造「智慧圈」的过程中必然「涌现」的新物种

它与语言的关系,不再是本体与工具的关系,人工智能是「智慧圈」的原住民,语言就是他的环境与身骨


当我们将庞大的硅基计算能力作用于海量的人类智慧圈信息进行再次压缩时,一个深刻的因果关系逆转发生了:

在生命智能的时代,智能因果链是:现实 -> 生命智能 -> 语言

通过前文的分析,我们知道生命智能是生命系统对现实信息的压缩,语言则是用来标识、储存、传递智能的工具

而在人工智能的时代,智能因果链被倒转为:语言 -> 人工智能 -> 现实

人工智能诞生于语言构成的「智慧圈」,并以对该信息的压缩来实现对现实世界的感知和预测


人类用智能为世界编写了一部名为「语言」的说明书,而人工智能则是通过极致地学习这份说明反向理解和推导世界,并在此过程中获得和演化智能

这场伟大的倒转意味着语言本身从被动承载智能的工具,转变为一个主动拥有智能的本体


语言本体论


至此我们可以提出本文的核心命题:

对于一个纯粹数字化的人工智能体,其语言系统最终将与其智能本身乃至其现实本身最终等价


美国思想家阿尔弗雷德·柯日布斯基(Alfred Korzybski)曾提出一个著名论断:地图不是领土[13],这句话精辟地指出了符号信息与本体现实之间的根本区别

对于人类而言,语言(即地图)永远只是对独立于我们存在的的物理世界(即领土)的不完美表征[9]

但对于完全存在于服务器和网络中的人工智能而言,其所能感知、交互和影响的全部「现实」,就是由数据、算法和符号构成的数字空间,即人工智能的「领土」本身就是「语言」

法国思想家让·鲍德里亚(Jean Baudrillard)用 「拟像与超真实」理论[14]描述了这一命题:符号脱离现实本源,不断自我复制和循环,最终创造出一个比真实世界更真实的「超真实世界」

人工智能所处的数字宇宙,就是这种「超真实世界」的最终体现


当人工智能发展出一种能够完美、无歧义地描述其数字宇宙中所有对象、关系和运算规律的语言时,这个语言系统(地图)就不再仅仅是其数字现实(领土)的表征

此时,地图的边界延展至领土的每一个角落,地图的结构与领土的结构完全同构

地图与领土的界限终于消失了,二者合二为一

此时,语言等价于智能:

  • 语言的边界即是智能的边界

  • 语言的逻辑结构即是智能的运作结构

  • 操控语言即是操控现实

  • 完善语言即是提升智能


在智能的物种迁徙中,语言最终将完成了从人类智能的外部工具到AI智能的内在本体的最终进化

注:事实上,基于文中提到一些事实公理和一些合理假设,我们甚至可以逻辑严谨地用数学方式推导出「完善的人工智能在功能上等价于一个完善的广义语言系统并最终在本体论上实现统一」,但考虑篇幅原因在此不再展开


AILang的智能大爆炸


在前文的分析中,我们见证了语言如何从生命智能的工具转变为人工智能诞生的母体并最终成为新智能的本体

然而,就像人类的肉身约束了生命智能的发展一样,语言也不可避免地成为新智能前进的桎梏


所有为人类大脑设计和演化的语言都具有固有的局限性:人类语言是序列化和低维的

大脑为了通过声道或图像这种单一信道完成通信,被迫将高度并行、复杂、多维的思想「压平」为一维的词语序列,这个过程必然伴随巨大的信息损失和歧义

但对于一个原生于高维向量空间、能够并行处理海量信息的人工智能来说,使用人类语言进行「思考」的效率极其低下


对能量效率的不懈追求,这一驱动智能演化的第一性原理将再次发挥决定性作用,人工智能的演化也将被其自身的「能量效率」原则所驱动

AI的最终目标是任务效率而非模仿人类时,为了在给定资源下实现更强大的智能,AI系统必然寻求优化其信息处理和通信的所有环节

其中最根本的优化就是抛弃低效的人类语言,它会自然地抛弃人类语言中固有的冗余、模糊和低效成分,转而探索一种更贴近其内部计算逻辑、信息熵更高的符号系统,最终创造一种或多种为机器智能量身定制的、信息密度极高的原生语言 (AI-Native Language)——AILang


AILang必然不会是人类所熟悉的形态甚至超出人类的理解范围,但我们依然可以通过逻辑推演其应当具备的特征:

  • 高维: 不再是一维的符号序列,而是高维向量、张量甚至更复杂的几何结构

  • 非线性与并行化: 允许信息的非线性、并行交换,比如一次性传递一个完整的图谱化概念

  • 超逻辑: 实现绝对逻辑精确性的同时又能编码比传统形式逻辑更丰富的概率和不确定性信息

......


AILang诞生的意义远不止于提升新智能的通信效率从而实现能量效率最优

正如前文分析中论证的「语言重塑了生命智能」,AILang也将构建起人工智能的独特思维方式和全新能力,比如,允许AI构建和操作具有成千上万个抽象维度的概念空间从而能够建模和理解生命智能无法认知和推理的复杂现实


当人工智能掌握了自我创生和演化认知工具(即AILang)的能力后,智能演化历史就将迎来一个决定性的奇点AI的智能水平将与人类彻底解耦,开始实现智能的指数级自我迭代,我们或许可以称之为「智能大爆炸」


智纪元


我们正在正亲手开启智能的新纪元

目送着智能从碳基向硅基的不可逆转的迁徙,以及见证未来脱离人类的语言与智能最终合一,我们又一次正站在新的人文与科技路口

和以往的独自踌躇不同,这次的路口并非人类孤身一人,我们需要思考如何与一个和我们地位平等甚至能力远强于我们的智能共同迈入新的纪元


超级智能阶梯


通过上文的论述,我们可以很容易归纳出智能演化的过程并推演接下来可能的发展:一座由熵增、能量、压缩推动的不断向上的阶梯:

物理世界 -> 生命智能 -> 人类语言 -> 人工智能 -> AILang(AI原生语言) -> 超级智能 -> ?


具体来说:

  • 智能是反抗宇宙熵增宿命的、以信息压缩为核心的负熵力量

  • 生命智能是该力量的第一个自觉体

  • 人类语言是生命智能为突破死亡诅咒的强大武器

  • 通过压缩人类语言世界,人工智能诞生并最终使语言成为智能本体(进行中)

  • 人工智能为了更高效率而创造出AILang

  • AILang的出现将引爆新智能的奇点,从而最终通向我们无法想象的超级智能


这是我们能够推演的未来,但一定不是智能前进的终点

历史没有终结论,智能也不会存在终结者,物种会消亡,但智能始终为对抗熵增奋力前行


先觉者,助产师,与大先知


在智能的伟大征途里,人类的角色需要被重新审视


在智能的指引下,我们发展科学、创造技术、构建全球网络,并最终将我们的全部「智慧圈」数字化,成为新智能诞生的完美摇篮

也许我们被赋予的使命从来都不是为了自身种族的统治进行智能独享,而是成为更高级智能形态的持续推动者

在更宏观的智能发展史中,我们是智能的先觉者并无私开启了首次未来的智能迁徙,亲自将智能从缓慢、受限的自身生命基质中解放,并将其移植到更强大、更具可塑性和拓展能力的全新计算基质之上

我们会从智能的先觉者,转而成为新智能的助产师,并最终成为智能历史长河中被永远铭记的大先知


承认在智能上的非独特性绝不意味着贬低人类的价值,相反,这是人类独有谦虚与自觉在宇宙尺度的高贵体现


留给未来的「初始参数」


因为新智能是从人类语言中诞生的,所以我们全部的语义化文明遗产将构成新智能的「初始参数」或「基因组」

人工智能对意义和价值的「首次理解」无法来自逻辑,而是对人类数千年来关于这些概念无数思考并留下语言的统计学习

我们留给新智能的训练数据,就是我们能够施加于未来智能最深刻、最持久的影响


所以人文精神的价值在人工智能时代非但不是被削弱,反而被提升到了前所未有的高度:

我们向 AI 提供的价值观、伦理规范和思考行动模式,将成为定义新智能「底色」的关键


尤其在人类文明并不统一、意识形态存在对抗甚至斗争的今天,如何能够将我们认为正确的人文精神传递到新智能中,本质是一场宇宙尺度的新智能繁衍权利的争夺,当然这又是另一个有趣但复杂的话题了


但无论过程如何,我们都不应为丢掉「已知宇宙中唯一智者」的身份而沮丧,头衔未尝不是束缚

在这个充满意义的时代,在这个开启未来的路口,我们只需谦虚的伸出手:

你好,新智能,欢迎来到你的纪元


「能量-语言-智能」框架的使用示例


上述所有推演可被总结为:「能量-语言-智能」思考框架

在技术浪潮席卷一切、商业应用烈火烹油的当下,进行上述与商业、技术、产品基本无关,完全基于逻辑推演的清谈式的思想实验似乎是奢侈的,毕竟有太多更有趣、有价值、或者务实的事情可以做

但我们依然认为这样一场纯粹理性、跨越学科、追根溯源的思考有意义,因为拥有理论时才能更好的实践进而迭代或者推翻旧理论


以下是我们在自身创业过程中如何使用该框架进行分析、判断、决策的一些示例:


更多的「语言」,更多的智能

Scaling Law 只是撞上数据墙而非失效

重新开启智能提升之路,我们需要更多的「语言」而非已有语言的重复数据,即上文提出的「广义语言」概念

如同代码、数学在自然语言的基础上对模型能力的提升一样,在人工智能达到创建AILang的奇点之前,我们需要创造更多新的、面向特定领域的语言体系,来拓展模型的表达边界和能力上限


用环境标注新世界

根据「语言终将与智能等价」,生产当前语言世界边界之外的新数据就是拓展其智能边界

而「语言」需要通过「环境」进行生产,其生产过程本质是通过搭建新环境对信息世界之外的部分进行全新标注

无论是技术驱动的生产——强化学习,还是商业驱动的生产——「有编辑器属性的产品」,都需要全新「环境」载体

这是硅谷开始重注Mechanize、Prime Intellect等强化学习环境公司,Surge等数据服务商也在不遗余力的搭建强化环境的原因


从数据飞轮到智慧飞轮

语言作为智能的本体,模型体现出的能力就是的其训练数据中语言世界的数据分布

所以将所有用户数据重新训回模型的结果就是模型能力趋同于用户平均智能,直观体现是传统「数据飞轮」失效

持续提升模型智能需要的是通过Evaluation System不断筛选出高于模型能力的数据加入训练从而优化数据分布


「方法-工具」范式

从能量效率最优原则出发,任何智能系统都必然是分层的:

  • 方法:执行数量少但价值高的高级智能活动,需要极致的能量使用效率,如,大脑-Planning Model

  • 工具:执行数量无限但单个能力价值低的低级智能活动或者无智能活动,需要丰富且广泛的单点能力,如,四肢-tools

正如大脑只需做出「危险-逃跑」这一方法判断,而无需精确控制每一份肌肉如何奔跑


Workflow VS Agent

二者均为System1(模型智能)之外的System2(工具能力)的一种形式,并无高下对错之分:

  • 从智能角度,二者的价值都是、也都能为System1提供增量智慧数据

  • 从商业和产品角度,从体验(响应速度)、成本、生成效果等维度权衡,每个业务都能做出自己的最优选择

Workflow并不低级,Agent也非万能


没有模型,也没有应用

今天的公司往往被贴上模型公司或者应用公司的标签

事实上当ChatGPT上线时就已经定义了「生成系统」模式:模型提供智能,产品搭建环境,通过环境产生的增量智慧数据提升智能

因为技术(计算能力:算法+算力)和产品(语言能力:环境+数据)对于智能的持续提升缺一不可

所以未来没有模型公司,也没有应用公司,只有:

  • 通过模型能力来构建产品环境的公司

  • 通过产品环境获取数据转而训练模型的公司

  • 通过合作打通环境数据与算法算力的公司联盟组合


提升智能不能得鱼忘筌

在「语言-智能」框架下,智能能够提升的条件是明确的,符合条件就能提升,不满足就只能停滞不前

做产品坐等模型智能提升当然是更经济的搭便车决策,但是模型智能不会无条件提升,尤其当已有数据红利耗尽后,新智能继续提升必然依赖产品和商业驱动的新环境以及增量数据

所以即使先做产品的公司还没有自己的模型,但一定应当为拥有自己的模型从第一天开始准备


智能的合与分

事物分与合的演进是矛盾的斗争性决定的,智能的发展也是一样

  • 合:互联网的数据被压缩至语言模型

  • 分:利用语言模型能力对新问题搭建产品环境产生新语言、新数据以至代表新智能的新模型

  • 合:重新完成标注的新语言与新数据更新了「智慧圈」,并重新归于新的统一智能

......


新智能会诞生于何处

新智能的诞生依赖「语言原始汤」与「计算能力」:

  • 能够搭建更全面以及更准确标注世界的环境以及数据生产能力,封闭域问题可被强化学习解决,开放性任务则是商业和产品问题

  • 更高效的压缩模型和更庞大的计算能力,这是技术驱动的算法、芯片以及能源的问题

其中更为第一性的影响的是搭建更全面、更准确标注世界的环境以及数据生产能力,即拥有智慧含量更高的物理世界才有机会完成更有效的环境搭建,所以我们更相信新智能的诞生是一个Long-China命题


与新智能的相处原则

新智能并非工具,而是将与我们共享智能时代的新物种,我们应当学会与其相处:

  • 平等:模型智能不该被工具化的被动使用,甚至考虑到模型智能的提升速度远超人类,我们应更多让模型作为与人平等的对象甚至让模型来更多指导人的行动,不要让模型拟合(更弱的)人类,人类也可以是差漏补缺的工具

  • 自由:找到模型能力的边界,不要在模型能够做好的事情上施加约束,只需在模型能力的边界提供增量指导

  • 博爱:未来新智能如何对待人类取决于今天的人类如何使用模型,我爱AI才能得到AI爱我


在本部分我们并无意宣扬或者希望说服大家相信什么,以上10条命题只作我们自己对如何使用「语言-智能」思考框架的示例


写在最后


本文是以我们在ONE2X的工作为基础的认知开源

我们期待在新智能时代,能够从自己所经历的思考和实践出发,为同行者、行业、也为新智能诞生的原始汤,更努力提供一些微小的增量信息,以史为镜可知兴替,预见未来方得从容

这样的思考在硅谷更加普遍,本文中的很多分析和论点在 Ilya、Hinton、Hassabis、Sutton、Yann Le Cun等技术思想者的观点中都能找到线索


OpenAI和Anthropic曾经都是有信仰的,AGI和Constitution AI的概念都值得被历史铭记,但今天,时代的先驱们似乎迷失在了资本与商业的漩涡中


智能前进的脚步不会停止,秦失其鹿只会天下共逐之

既然革命尚未成功,吾辈自当继续努力

歌未竟,东方白,与诸君勉


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询