支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI应用的三层结构

发布日期:2025-05-25 11:46:22 浏览次数: 1525 作者:大声思考ThinkingAloud
推荐语

2025年AI发展深度解析,从"快速回答"到"深度思考"的范式转变。

核心内容:
1. AI发展现状:模型能力提升与应用价值实现的落差
2. AI应用的三层结构:思考层、语境层、行动层
3. 思考模型的崛起:从"慢思考"到超越人类水平的转变

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

当我们站在2025年回望过去两年的AI发展,会发现一个有趣的现象:模型能力的提升速度远超应用价值的实现速度。但这种能力提升的性质正在发生根本改变。


从GPT-4到Claude 3.5 Sonnet,从OpenAI的o1到最新的o3,再到DeepSeek的R1,我们见证的不只是模型规模的增长,而是AI从"快速回答"到"深度思考"的范式转变。这些模型不再追求更快的响应速度,而是愿意花费更多时间进行推理和反思。

然而,即便有了这些突破,真正改变人们工作方式的AI应用依然屈指可数。这个落差值得思考:问题出在哪里?



重新理解AI应用的本质

当前的AI应用正在形成一种明确的三层结构:思考层(模型)、语境层(Context)、行动层(环境)。而真正决定应用成败的,不是模型有多强大,而是这三层如何有机结合。

为什么这么说?

当前的LLM或MLLM,本质上是一个思考引擎,处于结构的核心层。注意,我用的是"思考"而不是"推理"。这个区别很重要。推理是从A到B的逻辑推导,而思考包含了更丰富的过程:提出假设、自我质疑、多角度分析、迭代优化。o1和R1这类模型的出现,正是这种转变的标志。

但仅有思考是不够的。就像一个深邃的思想家,如果没有对世界的理解(语境层),没有影响世界的手段(行动层),他的智慧就无法转化为价值。这就是为什么我们需要围绕模型构建完整的"工作空间"(Work Space)。

一个真正有效的AI应用,需要这三个层次的有机结合:

第一,强大的思考引擎(思考层)。这不仅是基础,更定义了AI能力的上限。从Claude 3.5 Sonnet在编程任务上的卓越表现,到o1在数学和科学推理上的突破,再到o3在ARC-AGI测试上以87.5%的成绩超越人类平均水平,我们看到的是AI思考深度的不断提升。

第二,充分的语境(语境层)。这就像人类需要知识和经验才能做出正确判断一样。没有context的模型,就像一个失忆的天才,空有能力却无从发挥。

第三,能够充分行动的数字环境(行动层)。思考的目的是为了行动,如果模型只能"想"而不能"做",那它永远只是一个哲学家而非实干家。

这三层的关系,就像人类的大脑、感知和身体。只有当它们协同工作时,才能完成真正的"工作"。而我们称之为Work Space的,正是这个完整的三层结构。


思考模型的崛起改变了什么

2024年末到2025年初,AI领域发生了一个重要转变:从追求更快的响应到追求更深的思考。

OpenAI的o1模型第一次向我们展示了"慢思考"的价值。它不急于给出答案,而是会花时间推理、验证、反思。在国际数学奥林匹克竞赛题目上,o1的表现甚至超过了许多人类选手。

紧随其后的o3更进一步,在ARC-AGI这个被认为是AGI试金石的测试中,以87.5%的成绩超越了人类平均水平(80%)。而DeepSeek的R1则展示了开源社区在思考模型上的追赶能力,通过强化学习实现了包括自我验证、反思和生成长链思考在内的深度推理能力。

这些模型的成功告诉我们一个重要信息:AI的价值不在于它能多快地回答,而在于它能多深入地思考。

但这也带来了新的挑战。当AI需要花费几分钟甚至更长时间来思考一个问题时,传统的对话式交互就显得不够了。我们需要新的交互范式,需要能够支撑长时间思考和复杂任务执行的环境。这正是Work Space理念的价值所在。


让我用一个具体的例子来说明。假设你是一位律师,需要为客户准备一份合同。

在传统的AI助手模式下,你可能会这样操作:

"帮我起草一份软件开发合同" → AI生成一个模板 → "加入知识产权条款" → AI修改 → "调整付款方式" → AI再修改...

这个过程繁琐且容易出错。更重要的是,AI缺乏对整个项目的理解,每次修改都是局部的、割裂的。

而在工作空间模式下,情况完全不同。AI能够:

  • 访问公司的合同模板库和历史案例
  • 了解客户的特殊需求和过往沟通记录
  • 参考相关的法律法规和最新判例
  • 在修改时保持整体的一致性和专业性
  • 自动生成相关的附件和说明文档

这不再是简单的对话,而是在一个完整的工作环境中协作。AI从一个"回答者"变成了一个"同事"。


Context:被严重低估的护城河

在过去的一年里,大家都在关注模型能力的提升。但我认为,真正决定AI应用成败的,是Context的构建和管理。

Context不仅仅是给模型的提示词或背景信息。它是一个多层次、动态演化的知识体系。

想象一下,一个经验丰富的程序员在编写代码时,他的"context"包括什么?

首先是即时的上下文:他正在解决的具体问题,相关的代码片段,刚才的调试结果。这是最表层的context。

然后是项目级别的上下文:整个代码库的架构,团队的编码规范,项目的技术栈选择,已知的技术债务。

再往上是组织级别的上下文:公司的技术战略,团队成员的能力模型,历史项目的经验教训。

最后是行业级别的上下文:编程语言的最佳实践,开源社区的解决方案,技术发展的趋势。

一个优秀的AI编程助手,需要在所有这些层次上都能有效地管理和利用context。这就是为什么Cursor能够如此成功——它不只是一个代码补全工具,而是真正理解了程序员工作的context结构。

值得注意的是,这样的Context层次,不仅仅在编程领域,在所有的工作领域都存在。


为什么AI编程是最完美的应用场景

如果要选出目前最成功的AI应用领域,毫无疑问是编程。Cursor、GitHub Copilot、Replit等产品不仅获得了用户的认可,更重要的是真正提升了程序员的生产力。

这不是偶然的。编程领域有几个独特的优势:

1. 代码本身就是最好的Context。不同于自然语言的模糊性,代码是精确的、结构化的。函数签名告诉你输入输出,类型系统定义了数据结构,测试用例明确了预期行为。这些都是高质量的context,能够支撑AI进行深度思考。

2. 开发环境天然就是一个完整的工作空间。IDE不只是一个文本编辑器,它包含了编译器、调试器、版本控制、包管理器等一整套工具。AI可以无缝地融入这个环境,进行长时间的思考和迭代。

3. 结果的可验证性提供了即时反馈。代码能不能运行,测试能不能通过,这些都是客观的、可验证的。这种即时反馈对于AI的思考过程至关重要——它可以不断验证自己的假设,调整思考方向。

4. 开源社区提供了海量的训练数据。GitHub上的数十亿行代码,Stack Overflow上的问答,技术博客和文档,这些都是公开可用的高质量数据。


让我们具体看看Cursor是如何利用这些优势的。当你在Cursor中编程时,它能够:

理解你的整个代码库,而不只是当前文件。它知道你定义的每个函数、每个类,理解它们之间的依赖关系。

根据你的编码风格学习。如果你习惯使用某种命名规范或设计模式,Cursor会遵循这些习惯。

预测你的意图。基于当前的代码上下文和你的历史行为,Cursor能够猜到你接下来要做什么。

提供超越代码补全的帮助。它可以解释复杂的代码,建议重构方案,甚至帮你调试错误。

这种深度的集成和理解,正是Work Space理念的体现。


成功的AI应用都在构建自己的Context优势

让我们看看其他领域的成功案例。

Lovable.dev:重新定义应用开发

Lovable.dev展示了另一种可能性。这家瑞典创业公司不满足于在现有的开发流程中做增强,而是重新定义了应用开发的方式。截至2025年2月,Lovable已经拥有50万用户,每天创建超过25,000个新产品,年收入达到1700万美元。

Lovable的独特之处在于它构建了一个完整的开发环境,而不仅仅是代码生成工具。在Lovable中,你用自然语言描述想要的功能,AI直接生成可运行的React应用,包括前端UI、状态管理、路由配置等完整架构。平台支持Supabase数据库集成用于数据持久化,支持GitHub同步进行版本控制,真正实现了从想法到产品的无缝转换。

这需要对前端开发的完整context有深入理解:组件库的使用模式、Tailwind的样式系统、React的状态管理、现代Web应用的架构模式。创始人Anton Osika(前Depict.ai联合创始人)的愿景是让那99%不会编程的人也能获得一个AI软件工程师。从产品的快速增长来看,这个愿景正在变为现实。

Harvey AI:法律领域的Work Space先驱

Harvey AI在法律领域的成功也印证了这一点。这家由前律师Winston Weinberg和前DeepMind研究员Gabriel Pereyra于2022年创立的公司,在短短三年内就达到了惊人的增长。2025年5月,Harvey的估值已达50亿美元,年化收入达到7500万美元。

Harvey的成功秘诀在于它深刻理解法律工作的Context结构。法律工作天然需要大量的context:相关法条、历史判例、客户背景、行业惯例。Harvey不只是一个法律问答机器人,而是构建了一个完整的法律工作环境。在最新的法律AI基准测试中,Harvey Assistant在6项任务中的5项获得最高分,包括在文档问答中达到94.8%的准确率,在4项任务中超越了人类律师的表现。

更重要的是,Harvey的扩张策略展示了Work Space理念的商业价值。它不仅服务于Allen & Overy、Macfarlanes等顶级律所,还通过与PwC等咨询公司的战略合作,以及直接向大型企业的法务部门销售,构建了多层次的市场覆盖。这种从专业律所到企业法务的扩张路径,正是因为Harvey理解了不同场景下的Context需求差异。

这些成功的应用都有一个共同特点:它们不是通用的AI助手,而是深深扎根于特定领域,构建了该领域特有的context管理能力。


SaaS公司的独特优势

这就引出了一个重要观察:传统的SaaS公司在AI时代可能拥有独特的优势。

为什么?因为SaaS公司已经在各自的领域积累了大量的context和环境基础设施。

以Salesforce为例。它不仅有CRM系统本身,更重要的是积累了企业销售流程的最佳实践、客户互动的模式、销售预测的方法论。这些都是宝贵的context。当Salesforce推出Einstein AI时,它可以立即利用这些积累。

类似的例子还有很多:

Figma 积累了设计系统的结构化表达、组件复用的模式、设计协作的工作流。这些为AI辅助设计提供了完美的context。

Notion 理解了知识管理的层次结构、不同类型信息的组织方式、团队协作的模式。

Slack 掌握了团队沟通的模式、信息流转的路径、决策形成的过程。

这些SaaS公司不需要从零开始构建AI应用,他们已经有了环境,已经有了数据,已经有了用户的工作流。他们需要做的,是把AI能力有机地融入到现有的系统中。

这可能是AI应用竞争格局的一个重要变量:拥有领域context和环境的公司,比拥有模型技术的公司更有优势。


构建Work Space的技术挑战

理念很美好,但实现起来充满挑战。构建一个有效的Work Space需要解决许多技术问题。

Context的动态管理是第一个挑战。在一个真实的工作环境中,context是不断变化的。新的代码被提交,新的文档被创建,新的决策被做出。如何让AI始终保持对最新context的理解?如何决定哪些历史context依然相关?如何在context的完整性和处理效率之间找到平衡?

执行的可靠性是另一个关键问题。当AI不只是生成文本,而是要执行实际操作时,错误的代价就大大提高了。如何确保AI的操作是安全的?如何实现细粒度的权限控制?如何在AI犯错时快速回滚?

个性化和泛化的平衡也很重要。每个用户、每个团队都有自己的工作方式。AI需要学习这些个性化的模式,但又不能过度拟合。如何在保持通用能力的同时,又能适应特定的工作风格?

隐私和安全更是不能忽视的。Work Space中包含了大量敏感信息:代码、文档、客户数据。如何保护这些信息?如何确保AI不会无意中泄露机密?如何让用户信任AI?

这些挑战都不简单,但正是这些挑战构成了竞争壁垒。谁能更好地解决这些问题,谁就能在AI应用的竞争中胜出。


对创业的启示

基于以上的分析,可以给AI应用领域的创业者几点建议。

第一,不要再做通用助手了。这个赛道已经被OpenAI、Anthropic、Google等巨头占据。更重要的是,通用助手很难深入到具体的工作场景中,很难构建深度的context,通用助手还是更加像模型能力的"展示空间"。

第二,选择一个深刻理解的垂直领域。不要因为AI技术很酷就去做AI应用。先问问自己:你真的理解目标用户的工作流程吗?你知道他们的痛点在哪里吗?你能设计出比现有方案好10倍的产品吗?

第三,Context的积累是真正的护城河。技术可以被复制,模型可以被替换,但高质量的领域context需要时间和经验来积累。这应该是你的核心资产。

第四,从完整的工作流出发思考产品。不要只是在现有工具上加一个AI按钮。要重新思考:如果AI从一开始就参与到这个工作中,整个流程会是什么样子?

第五,拥抱激进的产品形态。AI带来的不是渐进式改进,而是范式转换。不要被现有的工具形态限制了想象力。


展望未来:人机协作的新范式

当我们把视角拉长到未来3-5年,可以预见几个重要趋势。

Work Space会成为AI应用的主流形态。就像今天每个知识工作者都离不开Office软件一样,未来每个人都会有自己的AI Work Space。这些Work Space不是被动的工具,而是主动的合作伙伴。

行业会出现新的领导者。那些最早理解并实践Work Space理念的公司,有机会颠覆现有的市场格局。Cursor在开发工具领域的成功只是一个开始。

工作方式会发生根本改变。当AI能够处理大部分执行层面的工作时,人类的角色会更多地转向创意、决策和关系维护。这需要我们重新思考教育、培训和职业发展。

新的社会问题会出现。当AI深度参与到工作中时,责任如何划分?成果如何归属?这些都需要我们认真思考和解决。


结语

回到文章开头的问题:为什么模型能力的提升没有带来相应的应用价值?

我的答案是:因为我们还在用旧的思维方式使用新的技术。我们把AI当作一个更聪明的搜索引擎,而不是一个可以培养的数字同事。

真正的突破在于认识到:AI应用的价值不在于模型有多强大,而在于它能多深入地融入到实际工作中。这需要的不仅是技术,更需要对工作本质的理解,对context的精心构建,对用户需求的深刻洞察。

当我们停止追逐更大的模型、更长的context窗口、更快的推理速度,开始关注如何构建更好的工作环境、如何积累更有价值的context、如何设计更自然的协作方式时,AI应用的春天才真正到来。

从推理引擎到工作空间,这不只是产品形态的演化,更是我们理解和使用AI方式的根本转变。而这个转变,正在发生。

写于2025年5月

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询