我要投稿

为什么我觉得AGI并不会马上到来

发布日期：2025-07-07 11:36:28 浏览次数： 1796

作者：宝玉AI

微信搜一搜，关注“宝玉AI”

持续学习是一大瓶颈

“事情往往比你预期的慢，但一旦发生，又快得超出你的想象。”
— 鲁迪格·多恩布什（Rudiger Dornbusch）

在我的播客^[1]中，我经常跟嘉宾聊到实现AGI（通用人工智能）的时间表。有些嘉宾认为还需要20年^[2]，而有些人则认为2年就够^[3]。截至2025年6月，我自己的观点如下。

持续学习能力问题

有时候人们会说，即使现在AI技术不再进步，当下的AI智能体也会比互联网带来的经济变革更加巨大。但我不同意这一点。现在的大语言模型（LLM）确实神奇，但《财富》500强企业之所以没有全面用它们改变业务，不是因为管理层保守，而是真的很难用这些AI智能体替代常规的人类工作，原因在于它们缺乏一些基础的能力。

在Dwarkesh播客，我算是“AI前卫派”，已经花了上百小时尝试为自己的内容制作流程打造各种小工具。可这些经历却拉长了我对AGI到来的预期。我曾尝试让LLM改写自动生成的播客文本，让它更易读；或让LLM从文字稿中选出适合发推的精彩片段；有时还试着逐段与AI共同写作。这些任务看起来应该很适合LLM，但实际效果只能给到5分（满分10分），虽说也挺了不起。

真正的问题是，LLM不像人一样可以随时间不断进步。缺乏持续学习的能力是个巨大瓶颈。LLM在许多任务上的初始表现可能比普通人强，但你无法有效地对它们提供高层次的反馈，从而改进和提升其表现。用户只能调整提示（prompt），但这远远不如人类员工日常学习和成长的方式有效。

人之所以能高效工作，不主要是靠纯粹智力，而是靠不断积累经验、自我反省错误，并在实践中持续优化效率。

就像教小孩吹萨克斯风，你会让她先试着吹，听听效果，再调整技巧。但现在教AI更像是：学生只吹一次萨克斯，吹错了你就把他赶走，然后写下详细的失败总结给下一个学生看。下一个学生接过笔记，直接尝试演奏查理·帕克的作品，失败后再完善笔记……如此循环。

这种方式显然不会奏效。再怎么精细的提示词，也不可能仅凭阅读说明就教会孩子吹萨克斯。但现在用户唯一能“教”AI智能体的方式只有这种。

当然，目前也有强化学习（RL）微调方式。但这并非像人类学习一样灵活、快速和自适应。我自己的视频剪辑师就是靠自主观察和实践，逐渐理解了我的偏好、观众的兴趣和工作流中的优化点，这种高效的成长绝非通过定制RL环境能够轻易实现。

或许我们可以想象更聪明的模型，能自主搭建强化学习环境，自己练习和提升技能。但这种方式听起来非常困难，而且我怀疑这种方法在不同任务间的通用性。目前还看不到明显的方法能在未来几年内让LLM拥有类似人类的在线持续学习能力。

不过，有时候LLM确实会在对话中“临时学习”。比如我和LLM合作写文章，刚开始它的建议总是很差。但当我明确指出它的问题并重新撰写之后，它的建议往往会逐渐变好。然而，这种“临时学习”只能维持短暂的上下文，一旦对话结束，这种细致的理解也随之消失。

或许更长的滚动记忆（像Claude Code的记忆总结功能）是一种简单的方案。但我认为这种压缩方式在文字之外的领域会变得脆弱，像教萨克斯风的例子一样，仅靠文字总结远远不够。

对经济影响的看法

这也是为什么我不同意Sholto和Trenton在我播客上所说的话：

“即便AI技术进步完全停滞，模型仍然能够在短期内自动化几乎所有白领工作。”

我认为，如果现在AI技术停滞，最多只能取代25%的白领就业。确实，很多单独的任务可以自动化，但AI缺乏持续学习能力，难以真正全面取代人类员工。即使技术上能完成任务，也无法真正理解企业具体的偏好和上下文。

尽管我在短期内看淡AI对经济的颠覆性影响，但长期而言我极其看好。一旦我们解决持续学习的问题，AI智能体的价值会出现大幅飞跃。因为AI能够快速在整个经济领域部署并自主学习，更何况AI的学习成果能在多个实例之间同步，这很可能快速地导致超级智能的诞生，而无需进一步的算法突破。

但我也不认为我们会一觉醒来发现OpenAI宣布彻底解决了持续学习问题。我更倾向认为，我们会先看到一些不完美的初步方案，然后逐渐改进。我们将有充分的时间察觉到这种瓶颈的消失。

计算机操作能力

当我采访Anthropic的研究员Sholto Douglas和Trenton Bricken时，他们预测到明年底就能实现可靠的计算机自动操作，比如完整处理小型企业的税务事务。

但我对此表示怀疑，因为：

• 更长的任务意味着更长的训练周期。
• 缺乏多模态（图像、视频）计算机使用的数据用于预训练。
• 即使看似简单的算法创新也需要很长时间去磨合和完善。

因此，我认为2028年左右能实现这种AI“税务经理”的功能是合理的预测。

推理能力的发展

不过也别全是泼冷水。o3或Gemini 2.5这样的模型已经展现出了真正的推理能力！它们能分解问题、自我反思，甚至自我纠正。这种能力的出现是巨大的突破，我们正逐步实现真正的智能。

我的具体预测是什么？

我个人对AI发展前景持宽泛的概率分布观点，仍然认为我们有可能2028年就看到超级智能的出现，但我更具体的预测如下：

• AI能完整处理小企业税务事务（追踪票据、邮件往来、填写表格等）：2028年
• AI在白领工作中实现像人类一样高效、有机的持续学习，能快速积累深厚的上下文理解：2032年

你可能会觉得奇怪，为什么我强调持续学习这么难，却又给出了7年这么短的预测。因为AGI发展的曲线呈现对数正态分布：它要么在这个十年内快速实现，要么在很长一段时间内停滞。毕竟计算资源增长无法无限持续，到2030年后，AI的进步主要依靠更难的算法创新，速度自然会变慢。

总之，我们的未来要么快速走向惊人的智能爆发，要么长期停留在缓慢的演进状态。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-22

告别“收藏等于白看”：全面解析腾讯ima，你的AI第二大脑

2025-11-22

AI Agent 正在杀死 toB 软件

2025-11-22

Gemini 3 Pro打通任督二脉，不但“能说”还“会干”

2025-11-21

OpenAI 的「群聊」，可能比你想得更重要！

2025-11-21

Aiops探索：基于 Dify + Prometheus MCP 的运维智能体实践

2025-11-21

融资800万美金，AI原生的文件夹也来了

2025-11-21

The Wasted Modes——界面模式消亡史

2025-11-21

大厂CIO独家分享：AI如何重塑开发者未来十年

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

从需求场景出发的AI应用项目落地方法论

2025-09-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

Qwen3-Coder与Claude Code深度对比：谁是你的AI编程助手？

2025-09-14

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

Claude Sonnet4.5发布，号称世界最强模型，超越gpt-5-codex

2025-09-30

大家都在问

如何利用 Google NotebookLM 实现精准、可溯源的内容生成呢？

2025-11-19

Snowflake CEO 复盘：为什么 LLM 时代企业需要一个 AI Data Cloud？

2025-11-19

为什么Mac在AI时代更有性价比？

2025-11-19

EI Search：生成式AI时代的知识探索新范式？

2025-11-18

Kosmos发布：一个让博士生“失业"的科研AI？

2025-11-18

oLLM 如何在 8GB 3060 Ti 上实现 100k 上下文推理？

2025-11-17

这种全新的交互方式，会成为未来AI应用的标配吗？

2025-11-15

Claude Skills 不就是把提示词存个文件夹吗？

2025-11-14

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB