微信扫码
添加专属顾问
我要投稿
陶哲轩揭示AI如何重塑数学研究:想法生成成本归零,但深度思考仍无可替代。 核心内容: 1. AI如何将想法生成成本降至接近零 2. 陶哲轩亲述AI辅助数学研究的真实体验与局限 3. 人类数学家在未来科研中的独特价值与定位
这是陶哲轩在使用了一年AI后的最新观点。
著名播客主持人 Dwarkesh Patel 与陶哲轩最新对谈来了,整个视频持续接近1个半小时,想看原视频请自行搜索:Terence Tao – How the world’s top mathematician uses AI
陶哲轩坦言自己用上 AI 之后,核心的数学工作其实没有变快多少。它让论文更丰富、更广泛,但不更深入。解决数学问题最难的部分,还是用笔和纸。但AI和人的协作正在发生快速变化,无法预测。
那 AI 到底在改变什么?人类数学家又还剩下什么?陶哲轩在这场对话里,给出了一些出人意料的答案。
以下是完整对谈
Dwarkesh: 今天,我与陶哲轩对话,他无需介绍。
陶哲轩,我想先请你重新讲述一下开普勒发现行星运动定律的故事,因为我认为这将是讨论 AI 与数学的一个很好的切入点。
陶哲轩: 我一直对天文学有业余兴趣。我喜欢早期天文学家如何研究宇宙本质的故事。
开普勒是在哥白尼的工作基础上进行研究的,而哥白尼又是在阿里斯塔克斯的工作基础上。哥白尼非常著名地提出了日心模型,即不是行星和太阳围绕地球转,而是太阳位于太阳系的中心,其他行星围绕太阳转。
哥白尼提出行星的轨道是完美的圆形。他的理论符合希腊人、阿拉伯人和印度人在几个世纪里得出的观测结果。
开普勒在学习中了解了这些理论,他注意到哥白尼预测的轨道大小比例似乎具有某种几何意义。他开始提出,如果你把地球的轨道用立方体包围起来,包围立方体的外接球几乎与火星的轨道完美匹配,以此类推。
当时已知有六颗行星,它们之间有五个间隙,而正好有五种完美的柏拉图立体:立方体、四面体、二十面体、八面体和十二面体。于是他有了这个理论,他认为这绝对美丽——你可以在行星球体之间内接这些柏拉图立体。
它似乎很符合,在他看来,上帝对行星的设计与柏拉图立体的数学完美相匹配。他需要数据来证实这个理论。
当时只有一个真正高质量的数据集存在。第谷·布拉赫,这位非常富有、古怪的丹麦天文学家,成功说服丹麦政府资助这个极其昂贵的天文台。实际上,那是一座整个岛屿,他在那里用肉眼对火星和木星等所有行星进行了数十年的观测,至少每个天气晴朗的夜晚都在观测。
他是最后一位肉眼天文学家。他有所有这些数据,开普勒可以用这些数据来证实他的理论。
开普勒开始与第谷合作,但第谷对数据非常嫉妒。他一次只给他一点点。开普勒最终偷走了数据。他复制了数据,不得不与布拉赫的后代发生争执。他确实得到了数据,然后他发现,令他失望的是,他美丽的理论不太奏效。数据与他的柏拉图固体理论相差大约 10%。
他尝试了各种调整,移动圆圈的位置,但都不太奏效。但他在这个问题上工作了多年,最终他找到了如何利用数据来计算出行星实际轨道的方法。那是一项极其聪明、天才的数据分析工作。
然后他发现轨道实际上是椭圆而不是圆形,这让他很震惊。于是他得出了行星运动的两个定律:椭圆定律,以及相等面积扫过相等时间的定律。
十年后,在收集了大量数据之后——最远的行星如土星和木星对他来说最难计算——他终于得出了这第三定律,即行星完成轨道运行的时间与到太阳距离的某个幂成正比。这就是著名的开普勒三大运动定律。
他对这些定律没有解释。这完全是由实验驱动的,一个世纪后牛顿才给出了能够同时解释这三个定律的理论。
Dwarkesh: 我想尝试的一个观点是,开普勒是一个高温大语言模型。牛顿提出了为什么行星运动三大定律必须成立的解释。当然,正如你所说,开普勒发现行星运动定律或计算不同行星相对轨道的方式是天才之作。
但在他的职业生涯中,他只是在尝试各种随机关系。事实上,在他写下行星运动第三定律的书中,这只是《世界的和谐》中的一个旁注,这本书只是关于所有这些不同行星如何具有不同和谐的书。地球上饥荒和苦难如此之多的原因是因为地球是 mi-fa-mi,这是地球的音符。
所有这些都是随机的占星术,但其中包含了平方-立方定律,告诉你周期与行星到太阳距离的关系。正如你所详述的,如果你把它加上牛顿的 F=ma 和向心加速度方程,你就会得到平方反比定律。于是牛顿推导出了这个。
但我认为这是一个有趣的故事,因为我觉得大语言模型可以做这种尝试随机关系二十年的事情,其中一些毫无意义,只要有一个可验证的数据库,比如布拉赫的数据集。"好吧,我要尝试关于音符、柏拉图物体或不同几何形状的随机东西,我有一种偏见,认为这些轨道的几何形状有某种重要的东西。"然后有一件事奏效了。只要你能验证它,这些经验规律就能推动真正的深度科学进步。
陶哲轩: 传统上,当我们谈论科学史时,想法生成一直是科学中最受重视的部分。一个科学问题包含许多步骤。你必须确定一个问题,然后你必须确定一个值得研究的好问题。然后你需要收集数据,找出分析数据的策略,并提出假设。在这一点上,你需要提出一个好的假设,然后你需要验证。然后你需要撰写并解释。
有十几个不同的组成部分。我们庆祝的是这些想法生成的尤里卡天才时刻。开普勒肯定不得不经历许多想法,其中一些不起作用。我敢打赌有很多他甚至根本没有发表,因为它们就是不合适。这是过程中的重要部分,尝试各种随机的东西,看看它们是否有效。
但正如你所说,它必须与同等数量的验证相匹配,否则就是垃圾。
我们庆祝开普勒,但我们也应该庆祝布拉赫,因为他勤奋地收集数据,其精确度是任何先前观测的十倍。那额外的一位小数的准确度对开普勒得出他的结果至关重要。
他使用欧几里得几何和他当时能使用的最先进数学来将他的模型与数据匹配。所有方面都必须发挥作用:数据、理论和假设生成。
我不确定现在假设生成是否还是瓶颈。自那以后,科学已经改变了。
传统上,科学的两大范式是理论和实验。然后在 20 世纪,数值模拟出现了,所以你可以进行计算机模拟来测试理论。最后,在 20 世纪末,我们有了大数据。我们进入了数据分析时代。
现在很多新进展实际上是由分析海量数据集驱动的。你收集大型数据集,然后从中提取模式来推导思想。这与科学过去的工作方式有些不同,过去你是做几个观测或有一个突如其来的想法,然后收集数据来测试你的想法。那是经典的科学方法。现在几乎反过来了。你先收集大数据,然后试图从中得到假设。
开普勒可能是最早的数据科学家之一,但即使他也不是从第谷的数据集开始然后分析它。他有一些先入为主的理论。似乎这越来越不是我们取得进展的方式,只是因为数据如此庞大和有用。
Dwarkesh: 哦,有意思。我觉得你描述的 20 世纪科学实际上非常符合开普勒身上发生的事情。他确实在 1595 年和 1596 年提出了多边形和柏拉图物体理论——但它们是错的。然后几年后,他得到了布拉赫的数据,只有在尝试了二十年的随机东西之后,他才得到了这个经验规律。
实际上感觉布拉赫的数据有点像某种大规模模拟数据库,现在你有了数据,你可以不断尝试随机的东西。如果没有那个,开普勒就会在那里写关于和谐和柏拉图物体的书,而实际上没有什么可以验证的。
陶哲轩: 数据极其重要。我想做的区分是,传统上,你先提出假设,然后用数据来测试它。但现在有了机器学习、数据分析和统计学,你可以从数据开始,通过统计学得出以前不存在的规律。
开普勒的第三定律有点像这样,只不过不是有布拉赫的一千个数据点,开普勒只有六个数据点。对于每颗行星,他知道轨道长度和到太阳的距离。有五六个数据点,他做了我们现在称之为回归分析的事情。他给这六个数据点拟合了一条曲线,得到了平方-立方定律,这很惊人。
但他很幸运,这六个数据点给了他正确的结论。这不足以真正可靠。后来有一位天文学家,约翰·波得,他采用了相同的数据——到行星的距离——受开普勒启发,他预测到行星的距离形成了一个偏移的几何级数。他也拟合了一条曲线,只不过有一个点缺失了。火星和木星之间有一个大缺口。他的定律预测有一颗缺失的行星。
这有点像怪人的理论,但当赫歇尔发现天王星时,天王星的距离完全符合这个模式。然后谷神星在小行星带被发现,它也符合这个模式。人们非常兴奋,认为波得发现了这个惊人的自然新定律。但后来海王星被发现了,它差得很远。基本上这只是个数字巧合。
有六个数据点。也许开普勒没有像前两个定律那样强调他的第三定律的一个原因是,直觉上,即使他没有现代统计学,他也知道用六个数据点,他必须对结论持一定的保留态度。
Dwarkesh: 为了更明确地问你关于这个类比的问题,如果将来我们有越来越聪明的 AI 呢?我们会有数百万个 AI,它们可以出去寻找所有这些经验规律。听起来你认为科学中的瓶颈不是找到更多相当于每个领域的行星运动第三定律的东西,以便以后有人说,"哦,我们需要一种方法来解释这个。让我们推导出数学。这就是平方反比引力定律。"
陶哲轩: 我认为 AI 已经将想法生成的成本降低到几乎为零,这与互联网将通信成本降低到几乎为零非常相似。这是一件了不起的事情,但它本身并不能创造丰裕。现在的瓶颈不同了。我们现在处于这样一种情况:人们突然可以为给定的科学问题生成数千个理论。现在我们必须验证它们,评估它们。
这是我们必须改变科学结构才能真正解决这个问题的事情。传统上,我们建立围墙。在过去,在 AI 垃圾出现之前,我们有业余科学家有自己的宇宙理论,其中很多价值很低。我们建立了这些同行评审出版系统来过滤并试图分离出高信号的想法来测试。
但现在我们可以大规模生成这些可能的解释,其中一些是好的,很多是糟糕的,人类评审员已经被压得喘不过气来。许多期刊报告说,AI 生成的投稿正在淹没他们的投稿。
能够用 AI 生成各种东西是很好的,但这意味着科学的其他方面必须跟上:验证、验证和评估哪些想法实际上推动了学科发展,哪些是死胡同或红鲱鱼。这不是我们知道如何大规模做的事情。
对于每一篇单独的论文,我们可以让科学家进行辩论,并在几年内达成共识。但当我们每天生成一千个这样的东西时,这就行不通了。
Dwarkesh: 有一个非常有趣的问题。如果你有数十亿个 AI 科学家,不仅你如何衡量哪些是真正进展,而且你如何……这实际上是人类科学不得不面对并设法解决的问题,我实际上不确定我们是如何解决这个问题的。
假设在 1940 年代,如果你在贝尔实验室,有这些新技术出现。脉冲编码调制,如何传输信号?如何数字化信号?如何通过模拟线路传输它们?有关于工程约束和细节的各种论文,然后有一篇提出了比特的概念,这对许多不同领域都有影响。你需要某种系统能够看着它说,"好吧,我们需要把它应用到概率上。我们需要把它应用到计算机科学上,"等等。
在未来,AI 正在提出这种统一概念的下一个版本。你如何在数百万篇可能确实构成进展但具有更少一般统一思想的论文中识别它呢?
陶哲轩: 很多都靠时间的考验。许多伟大的想法在首次提出时实际上没有得到很好的反响。只有在其他科学家意识到他们可以将其进一步发展并应用到他们自己的……深度学习本身在很长一段时间内都是 AI 的一个小众领域。完全通过数据训练而不是通过第一性原理推理来获得答案的想法非常有争议,只是花了很长时间才开始取得成果。
你提到了比特。还有关于计算机架构的其他提议,而不是今天通用的零一。我想有三进制,三值逻辑。在一个平行宇宙中,也许会出现不同的范式。例如,Transformer 是所有现代大语言模型的基础,它是第一个真正足够复杂以捕捉语言的深度学习架构。但它不一定是那样的。可能是某种其他架构是第一个做到这一点的,一旦被采用,它就会成为标准。
评估一个给定的想法是否会有成果很难的一个原因是,它取决于未来。它还取决于文化和社会,哪些被采用,哪些不被采用。
数学中的十进制数字系统非常有用,比罗马数字系统好得多。但同样,十没有什么特别的。这个系统对我们有用是因为其他人都用它。我们已经将其标准化。我们已经围绕它建立了所有的计算机和数字表示系统,所以我们现在被它困住了。有些人偶尔推动使用十进制以外的其他系统,但惯性太大了。
这不是你可以孤立地看待任何给定的科学成就并给它一个客观评分而不了解过去和未来的背景的事情。所以它可能永远不是你可以像对更局部的问题那样进行强化学习的事情。
科学史上经常发生这样的情况:当一个新的理论出现时,事后看来我们意识到它是正确的,它似乎会做出要么没有意义的推论,因为它们是错的,我们后来意识到为什么它们是错的,要么它们是正确的,但在当时看起来极不可信。
正如你所说,阿里斯塔克斯在公元前 3 世纪就有了日心说。古代雅典人说,"这不可能,因为如果地球围绕太阳转,我们应该看到当我们围绕太阳运行时恒星的相对位置发生变化,而唯一不会发生这种情况的方法是如果它们离我们太远以至于你注意不到任何视差,"这实际上是正确的推论。
但有时推论是不正确的,我们只需要提升到更好的理解水平。莱布尼茨会责备牛顿,不同意牛顿的引力理论,理由是它意味着超距作用,他们不知道机制,而牛顿本人也对惯性质量和引力质量是同一个量感到震惊。所有这些东西后来都被爱因斯坦解决了。但这仍然是进步。
所以对于 AI 的同行评审系统来说,问题是:即使你可以证伪一个理论,你如何注意到它相对于以前的东西仍然构成进步?通常,最终正确的理论最初在很多方面更差。哥白尼的行星理论比托勒密的理论更不精确。地心说已经被发展了一千年,他们做了许多调整和越来越复杂的临时修正,使其越来越精确。哥白尼的理论简单得多,但精确度差得多。直到开普勒,它才比托勒密的理论更精确。
科学总是一个进行中的工作。当你只得到部分解决方案时,它看起来比一个不正确但不知何故已经完成到可以回答所有问题的理论更差。正如你所说,牛顿的理论有大谜团。他们有质量的等效性和超距作用,这些直到几个世纪后才用概念上非常不同的方法解决。
通常,进步不是通过增加更多理论,而是通过删除你脑海中的一些假设来实现的。地心说坚持如此之久的一个原因是我们有这种想法,认为物体自然想要保持静止。这是亚里士多德的物理学概念,所以地球在运动的这个想法……为什么我们都没有摔倒?一旦你有了牛顿的运动定律——运动中的物体保持运动等等——那么它就有意义了。
从概念上讲,意识到地球在运动是一个非常大的飞跃。它感觉不像在运动。像达尔文的进化论这样的最大进步,是物种不是静态的这个想法。这并不明显,因为你在有生之年看不到进化。嗯,现在我们实际上可以了,但它看起来是永久和静态的。
现在我们正在经历哥白尼革命的认知版本,我们曾经认为人类智能是宇宙的中心,现在我们看到有非常不同类型的智能,具有非常不同的优势和劣势。我们对哪些任务需要智能、哪些不需要的评估必须重新排序。试图将 AI 纳入我们关于科学进步以及什么是困难、什么是容易的理论中,我们正在挣扎。我们必须问我们以前从未真正问过的问题。或者也许哲学家问过,但现在我们都必须面对它。
Dwarkesh: 这让我想起一个我一直很好奇的话题。你提到了达尔文的进化论。有一本书,爱德华·多尔尼克的《钟表宇宙》,涵盖了我们正在谈论的这个时代的很多历史。他在里面有一个有趣的观察。《物种起源》出版于 1859 年。《自然哲学的数学原理》出版于 1687 年。所以《物种起源》比《原理》晚两个世纪。
从概念上讲,达尔文的理论似乎更简单。有一位与达尔文同时代的生物学家,托马斯·赫胥黎,他读了《物种起源》,他说,"怎么没想到呢。"没有人对《原理》这样说,责备自己没有在引力上击败牛顿。所以有一个问题,为什么花了更长时间?很大一部分原因似乎是你在说的。自然选择的证据在某种意义上是压倒性的,但它是累积的和回顾性的,而牛顿可以说,"这是我的方程式。让我看看月球的轨道周期和它的距离,如果它对得上,那么我们就取得了进步。"
卢克莱修实际上在公元前 1 世纪就有物种适应环境的想法,但直到达尔文才真正有人谈论它,因为卢克莱修不能运行一些实验来强迫人们注意。
我想知道,回顾过去,我们是否最终会看到在具有这种紧密数据循环的领域取得更多进展,在那里你可以很容易地验证它们,即使它们在概念上要困难得多。
陶哲轩: 科学的一个方面是,它不仅仅是创造一个新理论并验证它,而是将其传达给他人。达尔文是一位了不起的科学传播者。他用英语写作,用自然语言。我说得像——
Dwarkesh: 不用 Lean。
陶哲轩: 我必须摆脱我的技术思维定势。他用简单的英语说话,不用方程式,他综合了许多不同的事实。进化的碎片在过去已经被研究出来了,但他有一个非常引人注目的愿景。同样,他仍然缺少东西。他不知道遗传的机制,他没有 DNA。但他的写作风格有说服力,这帮助很大。牛顿用拉丁语写作。他发明了全新的数学领域来解释他在做什么。他也来自一个科学家更加保密和竞争的时代。学术界仍然有竞争,但在牛顿时代更糟糕。他保留了一些他最好的见解,因为他不想让竞争对手获得任何优势。他也是一个有点不愉快的人,据我所知。
直到牛顿之后几十年,其他科学家用简单得多的术语解释了他的工作,它们才广泛传播。阐述和论证、创造叙事的艺术也是科学的一个非常重要的部分。如果你有数据,它会有帮助,但人们需要被说服,否则他们不会进一步推动它,或者不会进行初始投资来学习你的理论并真正探索它。
Dwarkesh: 这是另一件很难进行强化学习的事情。你如何给你的说服力打分?嗯,有整个营销部门试图做到这一点。也许 AI 还没有被优化来说服人是件好事。
陶哲轩: 科学有一个社会方面。尽管我们为自己有客观的一面而自豪,那里有数据、实验和验证,我们仍然必须讲故事并说服我们的科学家同行。这是一个软绵绵的东西。它是数据和描绘叙事的结合,它是一个关于空白的叙事。即使是达尔文,正如我所说,他的理论中有一些他无法解释的部分。但他仍然可以论证,在未来,人们会发现过渡形式,他们会找到遗传机制,他们确实找到了。我不知道你如何以如此精确的方式量化这一点,以至于你可以开始进行强化学习。也许这将永远是科学的人性化一面。
Dwarkesh: 我从阅读和观看你关于宇宙距离阶梯的内容中得到的一个收获是,许多领域的演绎过剩可能比人们意识到的要大得多。如果你只是对如何研究一个问题有正确的见解,你可能会惊讶于你对世界还能了解多少。我想知道你认为这是你在研究的特定历史时期天文学的特殊产物,还是仅仅基于现在照射到地球的数据,我们实际上可以推断出比我们碰巧知道的更多?
陶哲轩: 天文学是最早真正接受数据分析和从他们拥有的信息中榨取每一滴可能信息的科学之一,因为数据是瓶颈。收集天文数据仍然非常困难。天文学家在从少量数据痕迹中提取各种结论方面是世界级的,几乎像福尔摩斯一样。
Dwarkesh: 我听说对于很多量化对冲基金来说,他们首选的雇员是天文学博士,实际上。他们也出于其他原因对从各种随机数据位中提取信号非常感兴趣。
陶哲轩: 我们确实探索不足如何从各种信号中提取额外信息。只是随便举一个研究例子,我记得有一次读到人们试图测量科学家实际阅读他们引用的论文的频率。你如何测量这个?你可以尝试调查不同的科学家,但他们有一个聪明的技巧。
许多引用有小错误,比如数字错了或标点符号几乎错了。他们测量了错误从一篇参考文献复制到下一篇参考文献的频率,他们可以推断作者是否只是复制粘贴参考文献而没有真正检查它。从那里,他们能够推断出人们注意力的一些衡量标准。
所以有一些巧妙的技巧可以提取……你之前提出的关于我们如何评估科学进展是否有成果、有趣或代表真正进步的问题……也许数据中有真正有用的指标或这种现象的足迹。我们可以检查引用以及某物在会议上被提及的频率。也许有很多科学社会学研究可以做,实际上可以检测到这些东西。
Dwarkesh: 也许我们真的应该让一些天文学家来研究这个问题,实际上。
Dwarkesh: 这很好地引出了从外部看,AI 在数学方面似乎正在取得的进展。你最近有一篇文章指出,在过去几个月里,AI 程序解决了 1100 多个埃尔德什问题中的 50 个。我不知道这是否仍然正确,但就在一个月前,你说已经暂停了,因为低垂的果实已经被摘完了。
首先,我好奇是否仍然是这样,我们已经摘了低垂的果实,现在正处于这个平台上。
陶哲轩: 看起来确实如此。大约有 50 个问题在 AI 辅助下被解决了,这很好,但还有大约 600 个要解决。人们现在仍在逐个解决其中的一两个问题。我们现在看到的纯 AI 解决方案少多了,即 AI 一次性解决问题的方案。有一个月发生过这种情况,然后停止了,不是因为缺乏尝试。我知道有三次独立的尝试,让前沿模型 AI 同时攻击每一个问题。它们挑出了一些次要的观察结果,或者可能发现某个问题已经在文献中被解决了,但还没有进一步的纯 AI 驱动的解决方案。
人们现在大量使用 AI。有人可能会用 AI 生成一个可能的证明策略,然后另一个人会用另一个单独的 AI 工具来批评它、重写它、为它生成一些数值数据,或进行文献调查。一些问题已经通过许多人类和许多 AI 工具之间的持续对话得到解决。但这似乎是一次性的。
也许这些问题的一个类比是,你在某种山脉中,有各种各样的悬崖和墙壁。也许有一堵小墙只有三英尺高,一堵六英尺高,然后是十五英尺高,还有一些一英里高的悬崖。你试图爬上尽可能多的这些悬崖,但这是在黑暗中。我们不知道哪些高,哪些矮。所以我们试着点一些蜡烛,做一些地图,慢慢地我们发现其中一些是可以爬上去的。其中一些我们可以识别出墙上的部分路径,你可以先到达。
这些 AI 工具,它们就像跳跃机器,可以跳到两米高的空中,比任何人都高。有时它们跳错了方向,有时它们会坠毁,但有时它们可以到达我们以前无法到达的最矮墙壁的顶部。我们刚刚把它们放到这个山脉中,跳来跳去。曾经有一个令人兴奋的时期,它们实际上可以找到所有矮的并到达它们。
也许下次模型有重大进展时,他们会再试一次,又会有一些被突破。但这是一种不同的数学风格。通常我们会爬山,做一些小标记,试图识别部分东西。这些工具要么成功,要么失败。它们在创造部分进展或识别你应该首先关注的中间阶段方面真的很糟糕。
回到之前的讨论,我们没有一种评估部分进展的方法,就像我们评估解决问题的成功或失败一样。
Dwarkesh: 有两种不同的方式来思考你刚才说的话。一种是更看跌 AI 进展,另一种是更看涨。看跌的是,"哦,它们只能到达一定高度的墙,这不如人类达到的高度高。"第二种是它们有这种强大的特性,一旦它们达到某个水位线,它们可以填满该水位线上的每一个可用问题,而我们用人类根本做不到这一点。
我们不能复制一百万个你,给每个人一百万美元的推理计算,让你在百万个不同问题上做一百年的主观时间研究。但一旦 AI 达到陶哲轩的水平,它们就可以做到这一点。一旦它们达到中级水平,它们就可以做到中级版本。我们现在应该看跌的原因就是我们应该特别看涨的原因。甚至不是当它们达到超人类智能时,而是当它们达到人类水平智能时,因为它们的人类水平智能在质量上比我们的更广泛、更强大。
陶哲轩: 我同意。它们在广度上表现出色,而人类在深度上表现出色,至少人类专家是这样。我认为它们是非常互补的。但我们目前做数学和科学的方式专注于深度,因为那是人类专长的领域,因为人类做不到广度。我们必须重新设计我们做科学的方式,以充分利用我们现在拥有的这种广度能力。
我们应该在创建非常广泛的问题类别上投入更多精力,而不是一两个非常深入的、重要的问题。我们仍然应该有深入的、重要的问题,人类仍然应该在它们上面工作。但现在我们有这种做科学的另一种方式。我们可以通过首先让这些广泛的、中等能力的 AI 来绘制它并做出所有简单的观察,来探索全新的科学领域。然后识别某些困难岛屿,人类专家可以来研究。我非常看好互补科学的未来。最终,你会希望同时获得广度和深度,并以某种方式获得两全其美。但我们需要在广度方面进行实践。它太新了。我们甚至没有真正充分利用它的范式。但我们会,然后科学将变得面目全非,我认为。
Dwarkesh: 关于这种互补性,程序员已经注意到,由于这些 AI 工具,他们的生产力大大提高了。我不知道你作为数学家是否有同样的感觉,但似乎 vibe coding 和 vibe 研究之间的一个很大区别是,对于软件来说,工作的全部意义是通过你的工作对世界产生某种影响。如果它导致你更好地理解问题或想出一些干净的抽象来体现在你的代码中,那是实现最终目标的手段。
而对于研究来说,我们关心解决千禧年大奖问题的原因是, presumably 在解决它们的过程中,我们发现新的数学对象或新技术,推动我们文明对数学的理解。所以证明是对中间工作的手段。
我不知道你是否同意这种二分法,或者这是否会以任何方式解释我们在软件与研究方面看到的相对提升。
陶哲轩: 当然在数学中,过程往往比问题本身更重要。问题是衡量进展的一种代理。我想即使在软件中,也有不同类型的软件任务。如果你只是创建一个与一千个其他网页做同样事情的网页,就没有什么技能可学。嗯,也许个人程序员仍然可以学到一些技能。但对于样板代码类型的东西,这绝对是你应该卸载给 AI 的东西。
有时一旦你制作了代码,你仍然必须维护它。有升级并使其与其他东西兼容的问题。我听说程序员报告说,即使 AI 可以创建第一个工具原型,使其与所有其他东西配合并以他们想要的方式与现实世界互动是一个持续的过程。如果你没有从编写代码中获得的技能,那可能会影响你日后维护它的能力。
所以是的,当然数学家,我们用问题来建立直觉,并训练人们对什么是真的、什么是可以期待的、什么是可证明的、什么是困难的有很好的认识。直接得到答案实际上可能会抑制这个过程。
我之前区分了理论和实验。在大多数科学中,理论方面和实验方面之间存在平等的分工。数学的独特之处在于它几乎完全是理论性的。我们高度重视试图对为什么事物是真或假有连贯、清晰的理论。我们没有做很多实验,比如如果我们有两种不同的方法来解决问题,哪种更有效。我们有一些直觉,但我们没有做过大规模的研究,我们拿一千个问题来测试它们。但我们现在可以做到了。
我认为 AI 类型的工具实际上将彻底改变数学的实验方面,在那里你不是那么关心个别问题和解决它们的过程,而是想收集关于什么有效、什么无效的大规模数据。就像如果你是一家软件公司,你想推出一千个软件,你真的不想手工制作每一个并从每一个中学习教训。你只想找到让你规模化的工作流程。
大规模做数学的想法还处于起步阶段。但这正是 AI 将真正彻底改变这门学科的地方。
Dwarkesh: 我对这些关于 AI 对科学有多好效果的对话有一个很大的关键问题,我想是你说的,它们正在使用现有技术并对其进行修改。了解仅使用现有技术可以取得多少进展会很有趣。如果我查看顶级数学期刊,有多少论文是在提出一种新技术,无论那意味着什么, versus 将现有技术应用于新问题?过剩有多少?如果你只是将每种已知技术应用于每个开放问题,那会对我们文明的知识构成巨大的提升,还是不会那么令人印象深刻和有用?
陶哲轩: 这是一个很好的问题,我们还没有足够的数据来完全回答它。当然,人类数学家所做的很多工作……当你遇到一个新问题时,我们做的第一件事就是查看所有在过去类似问题上奏效的标准东西,我们一个接一个地尝试它们。有时这奏效了,这仍然值得发表,因为问题很重要。有时它们几乎奏效了,你必须再添加一个 wrinkles,这也很有趣。
但进入顶级期刊的论文通常是那些现有方法可以解决 80% 的问题,但然后有 20% 是顽固的,必须发明一种新技术来填补空白。现在很少有问题是在不依赖过去文献的情况下解决的,所有想法都凭空出现。这在过去更常见,但数学现在如此成熟,不使用文献首先就是一个很大的障碍。
AI 工具在尝试所有标准技术解决问题方面做得非常好,通常在应用它们时犯的错误比人类少。它们仍然会犯错误,但我已经在我能做的这些小任务上测试了这些工具,有时它们会发现我犯的错误。有时我发现它们犯的错误。现在大约是平局。
但我还没有看到它们迈出下一步。当论证中有漏洞,没有任何东西奏效时,你该怎么办?它们可以建议随机的东西,但我经常发现,试图追逐它们让它们奏效,然后发现它们不奏效,浪费的时间比节省的时间多。
我认为我们目前认为困难的一些问题会从这个方法中消失,特别是那些没有得到足够关注的问题。对于埃尔德什问题,AI 解决的 50 个问题中,几乎所有都是基本上没有文献的问题。埃尔德什提出了一两次问题。也许有些人随便尝试过,做不到,但他们从来没有写下来任何东西。但结果证明有一个解决方案,它只是将一种没有多少人知道的晦涩技术与文献中的其他结果结合起来。这就是 AI 能够完成的中位数水平,这真的很好。它解决了 50 个这样的问题。所以我想你会看到一些孤立的成功。
但我们发现的……有些人对这些埃尔德什问题进行了大规模扫描。如果你只关注成功故事,那些在社交媒体上被传播的,它看起来很惊人。所有这些几十年都没有解决的问题,现在它们正在倒下。但每当我们进行系统研究时,对于任何给定的问题,AI 工具的成功率可能只有 1% 或 2%。只是它们可以购买规模,你只是挑选赢家。看起来很棒。我认为对于数百个真正有声望、困难的数学问题,也会发生类似的事情。有些 AI 可能会走运,真正解决它们,会有一个解决每个人都错过的问题的后门。那会得到很多宣传。但然后人们会在他们自己最喜欢的问题上尝试这些花哨的工具,他们会再次经历 1% 到 2% 的成功率。会有大量的噪音在信号中,关于它们什么时候工作,什么时候不工作。
收集这些真正标准化的数据集将变得越来越重要。现在有一些努力在为 AI 创建一套标准的挑战性问题,而不仅仅依赖 AI 公司只公布他们的胜利而不披露他们的负面结果。这可能会给我们更多关于我们实际处于什么位置的清晰度。
Dwarkesh: 尽管我认为值得强调,拥有能够将一些没有人写下适用于这个特定问题的技术应用的模型,这已经构成了多大的进步。进展同时令人惊叹又令人失望。看到这些工具在行动是一种非常奇怪的感觉。但人们也适应得非常快。我记得 20 年前谷歌的网络搜索出来时。它把所有其他搜索都吹走了。你在首页得到相关的点击,正是你想要的。这很惊人,然后几年后,你只是理所当然地认为你可以谷歌任何东西。
2026 年的 AI 在 2021 年会令人惊叹。其中很多——面部识别、自然语音、做大学水平的数学问题——我们现在只是理所当然地认为。
说到 2026 年的 AI,你在 2023 年做了一个预测,到 2026 年它会成为数学中的同事?
陶哲轩: 一个值得信赖的合著者,如果使用得当。回顾起来看起来很不错。
Dwarkesh: 是的,我很高兴。那么让我们看看你能不能继续这个连胜。你个人因为 AI 而生产力提高了 2 倍。你会说哪一年?
陶哲轩: 生产力,我认为,不完全是单维的数量。我肯定会注意到我做数学的方式正在发生很大变化,以及我做的类型。例如,我的论文现在有更多的代码,更多的图片,因为现在生成这些东西太容易了。一些以前需要我花几个小时做的图表,现在我可以几分钟内完成。但在过去,我根本不会把图表放在我的论文里。我只是用文字描述它。
所以很难衡量 2 倍意味着什么。一方面,我认为我今天写的论文类型,如果我必须在没有 AI 辅助的情况下做,肯定会花五倍的时间。但我不会那样写我的论文。五倍?是的,但这些是辅助任务。比如做更深入的文献搜索或提供更多数值。它们丰富了论文。我做的核心事情,实际上是解决数学问题最困难的部分,没有太大变化。我仍然用笔和纸来做。
但有很多愚蠢的事情。我现在用一个 AI 智能体来重新格式化。有时如果我所有的括号大小不太对,我以前用手动修改,现在我可以让一个 AI 智能体在后台很好地完成所有这些。
它们真的加速了很多次要任务。它们还没有加速我做的核心事情,但它允许我在论文中添加更多东西。同样,如果我要重写我在 2020 年写的一篇论文——不添加所有这些额外的功能,只是具有相同功能水平的东西——实际上并没有节省那么多时间,说实话。它让论文更丰富、更广泛,但不一定更深入。
Dwarkesh: 你区分了人工聪明和人工智能。我想更好地理解这些概念。什么是聪明的例子,而不仅仅是智能?
陶哲轩: 智能是出了名的难以定义。它是这些东西之一,你看到时就知道。但当我和某人交谈,我们试图协作解决一个数学问题时,有这种对话,我们最初都不知道如何解决这个问题。我们中的一个有一些想法,看起来很有希望,所以我们有某种原型策略。我们测试它,它不起作用,但我们修改它。有适应性和想法随时间的持续改进。最终,我们系统地绘制出了什么不起作用和什么起作用,我们可以看到前进的道路,但随着我们的讨论而演变。
这与 AI 做的并不完全一样。AI 可以稍微模仿这一点。回到这些跳跃机器人的类比,它们可以跳跃和失败,跳跃和失败。但它们做不到的是跳一点点,到达某个支撑点,待在那里,把其他人拉上来,然后试图从那里跳跃。没有这种从部分进展中累积建立的过程,这是互动建立的。它似乎更多的是试错和重复:暴力破解。它规模化,在某些情况下可以惊人地奏效。但这种从部分进展中累积建立的想法仍然还没有实现。
Dwarkesh: 有意思。你是说如果 Gemini 3 或 Claude 4.5 解决了问题,并不是说它对数学的理解进步了。或者即使它在一个问题上工作而没有解决它,也不是说它对数学的理解进步了。
陶哲轩: 是的。你运行一个新会话,它就忘了它刚才做了什么。它没有新技能可以在相关问题上建立。也许你刚才做的是下一代训练数据的 0.001%。所以也许最终其中一些会被吸收。
Dwarkesh: 你最近发帖说,拥有一种形式化或半形式化的数学策略语言会很有帮助,而不是像 Lean 专长的数学证明。我很想了解那将涉及什么或看起来像什么。
陶哲轩: 我们不知道。我们在数学上非常幸运,我们已经制定了逻辑和数学的法则,但这是一个相当最近的成就。它始于两千年前的欧几里得,但直到 20 世纪初,我们最终才列出了数学的公理,我们所说的 ZFC 的标准公理,一阶逻辑的公理,以及什么是证明。这个我们已经设法自动化并有了形式语言。
可能有一些方法来评估合理性。你有一个猜想某事是真的,你测试几个例子,它奏效了。这如何增加你对猜想为真的信心?我们有一些数学方法来建模这个,比如贝叶斯概率。但你经常必须设定某些基本假设,这些任务中仍然有很多主观性。
这更像是一个愿望而不是开发这些语言的计划,只是看到拥有一个形式框架,如 Lean,使演绎证明自动化和训练 AI 变得如此成功……使用 AI 创建策略和提出猜想的瓶颈是我们必须依靠人类专家和时间考验来验证某事是否合理。如果有一些半形式框架可以半自动地完成这一点,而不是容易被黑客攻击……
对于这些形式证明助手来说,没有后门或漏洞可以利用,以某种方式获得你的认证证明而实际上没有证明它,这真的很重要,因为强化学习非常擅长找到这些后门。如果有一些框架模仿科学家用数据和论证以半正式方式相互交流,但也构建叙事……科学有一些主观的方面,我们不知道如何以我们可以以任何有用的方式将 AI 插入其中的方式来捕捉。
这是一个未来的问题。有一些研究努力试图创建自动猜想,也许有方法来对这些进行基准测试和模拟,但这都是全新的科学。
Dwarkesh: 你能帮我获得一些直觉吗?我有两个子问题。一,有一个具体的例子来说明这会是什么样子会非常有帮助,就像我们还没有形式化的科学家交流方式。二,说你正在构建某种叙事或自然语言解释,然后也有你可以形式化的东西,这似乎几乎是定义上矛盾的。我相信那里有一些直觉,我很想更好地理解。
陶哲轩: 一个猜想的例子:高斯对素数感兴趣,并创建了最早的数学数据集之一。他只是计算了前 10 万个左右的素数,希望找到模式。他确实找到了一个模式,但也许不是他期望的模式。他在素数中发现了一个统计模式,如果你计算到 100、1000、100 万等等有多少个素数,它们变得越来越稀疏,但密度的下降与数字范围的自然对数成反比。于是他猜想我们现在所说的素数定理:到 X 的素数数量是 X 除以 X 的自然对数。他没有办法证明这个。这是数据驱动的。这是一个猜想。
这在当时可能是革命性的,因为它是数学中第一个真正重要的统计性质的猜想。通常你在谈论一个模式,比如素数之间的间距有一定的规律性。但这并没有告诉你任何给定范围内确切的素数数量。它只是给你一个近似值,随着你越走越远,这个近似值越来越好。
它开启了我们所说的解析数论领域。它是许多此类猜想中的第一个,其中很多得到了证明,这开始巩固素数并没有真正的模式这个想法,它们表现得像具有一定密度的随机数字集合。它们有一些模式,比如它们几乎都是奇数。它们实际上也不是随机的,它们被称为伪随机的。创建素数时没有涉及随机数生成。但随着时间的推移,把素数想象成只是由某个神一直在掷骰子创建这个随机集合而生成,变得越来越有成效。这使我们能够做出所有其他预测。
数论中仍然有一个未解决的猜想,叫做孪生素数猜想,应该有无限多对素数是孪生的,只差两个,比如 11 和 13。我们无法证明这一点,有很好的理由解释为什么我们无法证明。但因为这个素数的统计随机模型,我们绝对相信它是真的。我们知道,如果素数是通过抛硬币生成的,我们只是——像无限猴子在打字机上一样——会一遍又一遍地看到孪生素数出现。
随着时间的推移,我们基于统计和概率发展出了关于素数应该表现得什么样的非常准确的概念模型。它主要是启发式的、非严格的,但极其准确。我们实际上能够证明关于素数的事情的少数几次,它总是与我们所说的素数随机模型的预测相匹配。我们有这个猜想性的概念框架来理解素数,每个人都相信它。这也是我们相信黎曼猜想为真的原因,也是我们相信基于素数的密码学在数学上是安全的原因。这都是这个信念的一部分。
事实上,我们关心黎曼猜想的一个原因是,如果黎曼猜想失败了,如果我们知道它是假的,那将是对这个模型的严重打击。这将意味着素数有一个我们不知道的秘密模式。我想我们会非常迅速地放弃任何基于素数的密码学,因为如果有一个我们不知道的模式,可能还有更多,这些模式可能导致密码学中的漏洞。那将是一个巨大的冲击。所以我们真的想确保那不会发生。
我们已经随着时间的推移被说服了黎曼猜想这样的事情。其中一些是实验证据,一些是我们能够做出理论结果的少数几次,它们总是一致。有可能共识是错误的,我们都错过了一些非常基本的东西。科学史上过去有过范式转变。但我们真的没有一种方法来衡量这个,部分原因是我们没有关于数学或科学如何发展的足够数据。我们有一个历史时间线,我们有大约 100 个历史转折点的故事。如果我们能接触到一百万个外星文明,每个文明都有不同的历史和科学发展顺序,那么我们也许真的有不错的机会来理解我们如何衡量什么是进展,什么是好的策略。我们也许可以开始形式化它并真正拥有一个框架。
也许我们需要做的是开始创建许多迷你宇宙或 AI 解决算术或什么的非常基本问题的模拟,但提出它们自己的策略来做这些事情,并有这些小实验室来测试。有些人研究能够做 10 位数乘法的最小神经网络是什么。我想我们可以从进化小型 AI 解决简单问题中学到很多。
Dwarkesh: 你不仅要非常迅速地学习新领域,而且要深入到足以对前沿做出贡献的程度。所以在某种意义上,你也是世界上最伟大的自学者之一。你学习数学新子领域的过程是什么样的?
陶哲轩: 我们之前谈论过深度和广度。这不是纯粹的人机区别。人类也是,我想是柏林把它们分成了刺猬和狐狸。刺猬非常了解一件事,狐狸对每件事都了解一点点。我绝对认为自己是一只狐狸。我经常和刺猬一起工作,如果需要的话,我有时可以成为刺猬。
我一直有点强迫症的倾向。如果我读到一些我觉得我有能力理解,但我不理解它为什么有效、其中有一些魔法的东西……有人能够使用我不熟悉的数学类型得到我想要证明的结果。我自己做不到,但他们可以用他们的方法做到,我想找出他们的诀窍是什么。有人能做我认为我能做的事情但我做不到,这让我很困扰。我一直有这种强迫性的、完美主义的倾向。我不得不让自己戒掉电脑游戏,因为如果我开始一个游戏,我想把它玩通关,通过所有关卡。
这是我学习新领域的一种方式。我与很多教给我其他类型数学的人合作。我只是和另一个研究数学另一个领域的数学家交朋友。我发现他们的问题很有趣,但他们必须教我一些基本技巧,什么是已知的,什么是未知的。我从中学到了很多。
我发现写下我学到的东西很有帮助。我有一个博客,有时我会记录我学到的东西。在过去我年轻的时候,我会学到一些东西,做这个很酷的技巧,然后说,"好吧,我会记住这个。"然后六个月后,我就忘了。我记得我曾经记得它,但我无法重建我的论证。前几次,理解了什么东西然后又失去了它,这太令人沮丧了。我决心我应该总是写下我学到的任何很酷的东西。这也是这个博客的由来之一。
Dwarkesh: 你写一篇博客文章需要多长时间?
陶哲轩: 这是我在不想做其他工作时经常做的事情。有一些审稿报告或什么让我觉得当时做起来有点不愉快。写博客感觉有创意和有趣。这是我为自己做的事情。根据主题的不同,可能是快速的半小时或几个小时。因为这是自愿做的事情,我写这些东西时时间过得很快,相比之下,做一些我因为行政原因必须做的苦差事。
顺便说一下,这些任务是 AI 现在真正在帮助的。
Dwarkesh: 如果文明可以从第一性原则决定如何使用陶哲轩的时间,作为一种有限资源,最大的区别是什么?如果无知之幕要决定如何使用陶哲轩的时间 versus 现在的情况?这个播客就不会发生了。
陶哲轩: 尽管我抱怨某些我不想做但必须做的任务……随着你在学术界变得更加资深,你得到越来越多的责任,更多的委员会,等等。我也发现,很多我因为某种原因不情愿地去参加的活动……因为它在我的舒适区之外,它经常导致与我不 normally 交谈的人的互动,比如你。我会学到有趣的东西,有有趣的经历。我会有机会与以前从未有过的人建立联系。所以我很相信偶然性。
我确实非常仔细地安排我一天的部分时间。但我愿意留出一些部分来做一些不寻常的事情。也许这会浪费我的时间,但也许我会学到一些东西。更多时候,我会得到一个我不会计划的积极体验。所以我很相信偶然性。
也许现代社会有一个危险,不仅仅是 AI,我们已经变得非常擅长优化一切。我们没有优化我们自己的优化。以 COVID 为例,我们很多都转向了远程会议,所以一切都是安排好的。我们在学术界保持忙碌。我们几乎见了与面对面相同数量的人,但一切都必须提前计划。我们失去的是在走廊上敲门、只是在喝咖啡时遇到某人的随意性。这些偶然的互动可能看起来不是最优的,但它们实际上非常重要。
当我还是研究生时,我会去图书馆找期刊文章。你必须亲自去借期刊并阅读文章。你可以浏览,有时下一篇文章也很有趣。有时不是,但你可以偶然发现有趣的东西。这现在基本上已经失去了。如果你想访问一篇文章,你只需把它输入搜索引擎或 AI,你立刻得到你想要的确切东西。但你不会得到如果你用更低效的方式做可能会偶然发现的东西。
我曾经在高等研究院待过一年,那是一个没有干扰的好地方。你在那里只是做研究。你在那里的头几个星期,太棒了。你正在完成所有你一直想要完成的论文。你一次几个小时地思考问题。但我发现如果我在那里待几个月以上,我就会失去灵感。我感到无聊。我更多地上网冲浪。你实际上确实需要生活中有一定程度的干扰。它增加了足够的随机性和高温度。我不知道安排我生活的最佳方式。它似乎奏效了。
Dwarkesh: 我很好奇你预计什么时候 AI 能够真正做前沿数学,至少和最好的人类数学家一样好。在某些方面,它们已经在做超级智能的前沿数学,人类做不到,但这是一个与我们习惯的不同前沿。
你可以说计算器在做人类无法完成的数字运算的前沿数学,但那是数字运算。但完全取代陶哲轩。我的意思是,你要我干什么?你就去上所有的播客吧。
陶哲轩: 这可能不是正确的问题。我认为在十年内,数学学生目前做的很多事情——我们花大部分时间做的很多事情,以及我们今天放在论文中的很多东西——可以由 AI 完成。但我们会发现,那实际上并不是我们所做的最重要的事情。
一百年前,很多数学家只是解微分方程。物理学家需要某个系统的精确解,他们雇佣一个数学家来费力地通过微积分计算,算出这个流体方程的解,无论什么。19 世纪数学家所做的很多事情,你可以调用 Mathematica、Wolfram Alpha、计算机代数包,或者现在更近期的 AI,它会在几分钟内解决问题。但我们继续前进了。计算机出现之后——计算机曾经是人类。人们曾经费力地创建对数表并计算素数,就像高斯做的那样,那都已经外包给计算机了。但我们继续前进了。
在遗传学中,测序单个生物体的基因组曾经是一个遗传学家的整个博士学位,仔细地分离所有染色体等等。现在你可以花 1000 美元,把它送到测序仪,就完成了。但遗传学作为一个学科并没有死亡。你转移到一个不同的规模。也许你研究整个生态系统而不是个体。
Dwarkesh: 我接受你的观点,但什么时候大部分数学进展,或几乎所有数学进展,都是由 AI 完成的?如果你今年发现一个千禧年大奖问题被解决了,你会押注 95% 的概率是 AI 自主完成的。肯定会有这样的一年。
陶哲轩: 我想我确实相信人机混合将在更长时间内主导数学。这将取决于。它将需要一些超出我们已有的额外突破,所以它是随机的。我认为 AI 目前在某些事情上非常好,但在其他事情上真的很糟糕。虽然你可以在上面添加越来越多的框架来降低错误率,让它们更好地相互配合,但感觉我们没有所有的成分来真正拥有一个真正令人满意的所有智力任务的替代品。它目前是互补的。它不是替代品。
因为当前水平的 AI 将在很多方面加速科学,希望新的发现和新的突破会更频繁地发生。也有可能通过破坏偶然性,我们实际上抑制了某些类型的进展。现在任何事情都有可能。我认为世界在这个时候非常非常不可预测。
Dwarkesh: 对于考虑从事数学职业或正处于数学职业早期的人,尤其是在 AI 进步的背景下,你有什么建议?他们应该如何不同地思考他们的职业,如果有的话,作为 AI 进步的结果?
陶哲轩: 我们生活在一个变革的时代。正如我所说,我们生活在一个特别不可预测的时代。我们认为理所当然了几个世纪的事情可能不再成立。我们做一切事情的方式,不仅仅是数学,都会改变。
在很多方面,我宁愿要一个更无聊、更安静的时代,事情与 10 年前、20 年前大致相同。但我认为人们必须接受会有很多变化。你学习的东西,其中一些可能会变得过时或革命化,但有些东西会被保留。
你总是必须留意你以前无法做的事情的机会。在数学中,你以前必须经过多年的教育并成为数学博士才能对数学研究前沿做出贡献。但现在在高中水平,或无论什么,你有可能参与一个数学项目并做出真正的贡献,因为所有这些 AI 工具、Lean 和其他东西。会有很多非传统的机会来学习,所以你需要一个非常适应性强的心态。
会有空间去追求仅仅出于好奇心和玩耍的东西。你仍然需要获得你的证书。在一段时间内,通过传统教育并以老式方式学习数学和科学仍然很重要。但你也应该对非常不同的科学方式持开放态度,其中一些还不存在。
这是一个可怕的时代,但也非常令人兴奋。
--end--
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-23
我提议,放开AI做作业的限制
2026-03-23
我把 Dan Koe 的写作工业化流程,做成了分身写作系统,爆款文章频出
2026-03-21
设计师慌了:Google Stitch 一出,Figma 两天跌了 12%
2026-03-21
Anthropic 产品经理:PRD 已死,原型万岁
2026-03-19
一部5分钟短剧让你惊出冷汗,它的成功却不在于此
2026-03-13
“洗代码即服务”火了!“开源代码洗白”奇葩网站上线,反讽白嫖企业:开源合规太昂贵了!CC逆向复刻客户软件,十分之一的价格转卖!
2026-03-12
为什么 LSP Language Server 对 Coding Agent 很重要
2026-03-09
给“氛围编程”系上安全带:阿里集团 AI 代码评审实践与 Benchmark 开源
2026-01-23
2026-01-06
2026-01-12
2025-12-25
2026-01-28
2026-01-29
2026-02-11
2026-01-18
2026-02-28
2026-01-20
2026-02-28
2026-02-07
2026-01-29
2026-01-21
2026-01-06
2025-12-22
2025-12-15
2025-12-09