免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

当AI工程师开始研究AI如何改变自己的工作——Anthropic内部调研揭示的职场变革

发布日期:2025-12-05 14:28:23 浏览次数: 1519
作者:至顶AI实验室

微信搜一搜,关注“至顶AI实验室”

推荐语

AI工程师亲身体验AI变革:Anthropic内部调研揭示生产力跃升与职场焦虑并存。

核心内容:
1. Anthropic工程师使用Claude后的生产力翻倍现象
2. AI带来的技能退化担忧与协作模式改变
3. 研究对未来各行业AI转型的前瞻启示

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

你有没有想过,那些每天开发AI工具的工程师们,他们自己的工作又是如何被AI改变的?这就像让厨师品尝自己烹饪的菜肴,或者让建筑师住进自己设计的房子。

Anthropic公司决定把镜头对准自己,深入探究AI助手Claude如何重塑着公司内部工程师和研究人员的日常工作。这是一次罕见的由AI公司对自身员工进行的深度田野调查,在2025年8月进行数据采集时,Claude Sonnet 4和Claude Opus 4是当时最先进的模型。研究团队对132名工程师和研究人员进行了问卷调查,与其中53人进行了深度访谈,同时分析了公司内部使用Claude Code(一款AI编程工具)产生的海量数据。

这不是一项简单的满意度调查。研究团队想要回答的是更深层的问题:当最了解AI的人开始大规模使用AI工作时,究竟会发生什么?他们的工作效率提升了吗?工作方式改变了吗?他们对未来感到兴奋还是焦虑?这些问题的答案对于我们所有人都至关重要,因为Anthropic工程师今天经历的变化,很可能就是其他行业明天将要面对的现实。

研究揭示了一个充满矛盾的职场图景。一方面,工程师们的生产力大幅提升,能够完成以前不敢触碰的任务,学习速度加快,处理了许多过去被搁置的琐碎工作。另一方面,这种能力的扩展也带来了深刻的担忧——有人担心自己的核心技能正在退化,有人发现自己与同事的协作变少了,还有人开始质疑自己的职业未来。这是一场真实的职场实验,没有预设的答案,只有正在发生的变化和人们真实的困惑。

研究团队坦承,在AI公司内部研究AI的影响存在特殊性——Anthropic的工程师拥有最前沿工具的优先使用权,在相对稳定的领域工作,而且他们本身就是AI变革的推动者。但正因如此,这些发现才更具前瞻意义。发生在Anthropic工程师身上的事情,可能就是整个社会即将面临的转型的预兆。研究提出的挑战和思考,值得各行各业提前关注和准备。

生产力的跃升:数字背后的真实体验

当研究团队询问工程师们现在多频繁地使用Claude时,答案令人震惊。工程师们自述,在过去12个月里,他们工作中使用Claude的比例从28%飙升至59%,生产力提升幅度从20%跃升到50%。这意味着在短短一年时间里,这两项指标都翻了一倍多。更极端的是,有14%的受访者报告说,使用Claude让他们的生产力提升了超过100%——这些人成了公司内部的"超级用户"。

要理解这些数字的含义,可以考虑这样一个场景:过去一个工程师可能需要一整天才能完成的调试工作,现在可能只需要半天,而且还能顺带完成其他任务。调查显示,55%的工程师每天都用Claude来调试代码,42%的人每天用它来理解现有代码库,37%的人每天用它来实现新功能。这不是偶尔为之的辅助工具,而是已经深度融入日常工作流程的核心助手。

Figure 1: Proportion of daily users (x-axis) for various coding tasks (y-axis).

当研究者深入挖掘这些生产力提升的本质时,发现了一个有趣的模式。在几乎所有任务类别中,工程师们花费的时间略有减少,但产出的工作量却大幅增加。这就好比一个厨师虽然做每道菜的时间缩短了一点点,但因为流程更顺畅,一个晚上能完成的菜品数量却翻了一番。关键在于,人们不是简单地把同样的工作做得更快,而是能够完成更多种类、更大规模的工作。

Figure 2: Impact on time spent (left panel) and output volume (right panel) by task (y-axis). The x-axis on each plot corresponds to either a self-reported decrease (negative values), increase (positive values) or no change (vertical dashed line) in time spent or output volume for categories of Claude-assisted tasks, compared to not using Claude. Error bars show 95% confidence intervals. Circle area is proportional to the number of responses at each rating point. Only respondents who reported using Claude for each task category are included.

研究还发现了一个特别值得注意的现象:27%由Claude协助完成的工作,如果没有AI的帮助,根本就不会被执行。这些工作包括扩展性项目、制作实用但非必需的工具(比如交互式数据看板)、进行探索性研究,以及撰写文档和测试等繁琐但有用的任务。工程师们描述说,他们现在可以修复更多"小烦恼"——那些过去会影响工作体验但因为不够紧急而被搁置的问题,比如重构结构混乱的代码,或者制作能提升其他任务效率的小工具。这就像终于有时间去修理那些"还能用但不太顺手"的东西,让整个工作环境更加舒适。

一位研究员分享了他的工作方式:他会同时运行多个Claude实例,让它们探索解决同一个问题的不同方法。他说:"人们倾向于把超级强大的模型想象成单一实例,就像拥有一辆更快的车。但拥有一百万匹马...能让你测试一堆不同的想法...当你有了这种额外的广度去探索时,工作变得更令人兴奋和更有创造性。"这种并行探索的能力,在没有AI之前是难以想象的。

研究团队必须指出的是,生产力的精确测量本身就很困难。来自METR(一个AI研究非营利组织)的最新研究显示,经验丰富的开发者在高度熟悉的代码库上使用AI时,可能高估了生产力提升。METR发现,在大型复杂环境中,或者需要大量隐性知识和上下文的地方,AI的表现会变差。但有趣的是,METR指出的这些会降低生产力的因素,恰恰与Anthropic员工说他们不会委托给Claude的任务类型高度一致。Anthropic员工报告的生产力提升,可能反映了他们已经发展出了战略性的AI委托技能——这是METR研究中没有考虑到的因素。

虽然大多数工程师频繁使用Claude,但超过半数的人表示,他们只能"完全委托"0-20%的工作给Claude。这里的"完全委托"含义各有不同——从完全不需要验证的任务,到只需要轻度监督的可靠任务。工程师们解释说,他们倾向于与Claude积极合作并验证其输出,特别是在复杂任务或代码质量标准严格的高风险领域。这意味着,大部分时候,工程师是在与Claude紧密协作并检查其工作,而不是完全放手不管,他们对什么算"完全委托"设定了很高的标准。

新技能的获得与旧技能的忧虑

后端工程师突然能够构建精美的用户界面,研究人员开始创建复杂的数据可视化工具,安全工程师轻松分析不熟悉的代码——这些场景在Anthropic内部已经成为常态。工程师们报告说,他们正在变得"更全栈"(full-stack),能够胜任核心专长之外的各种任务。一位后端工程师描述了他使用Claude构建复杂UI的经历:"它做得比我能做的好太多了。我本来不可能做到,肯定不能按时完成...设计师们看到后问'等等,这是你做的?'我说'不,是Claude做的——我只是给它提示。'"

这种能力的扩展带来了实实在在的好处。工程师们可以更快地完成反馈循环,加速学习。一位工程师说,过去需要"几周时间"的构建、安排会议和迭代过程,现在可以变成"几小时的工作会议",同事们可以现场提供反馈。人们对自己能够快速原型化、并行开展工作、减少繁琐劳动并提高雄心水平感到振奋。一位高级工程师说:"这些工具确实让初级工程师更有生产力,对他们敢于承担的项目类型也更加大胆。"使用Claude降低了开始解决问题所需的"激活能量",一些人说这"极大地降低了我想要开始解决问题所需的精力,因此我愿意去处理许多额外的事情"。

与此同时,一些工程师开始担心"随着委托更多工作,技能会退化",以及失去在手动解决问题过程中发生的附带学习。一位工程师说:"如果你亲自去调试一个棘手问题,你会花时间阅读文档和代码,这些可能对解决你的问题并不直接有用——但在整个过程中你正在建立对系统如何运作的理解。现在这种情况少多了,因为Claude可以直接把你带到问题所在。"另一位说:"我过去会探索每个配置来理解工具能做什么,但现在我依赖AI告诉我如何使用新工具,所以我缺乏专业知识。在与其他队友的对话中,我以前可以立即回忆起事情,现在我必须问AI。"还有人担心:"使用Claude有可能跳过我通过解决简单实例来学习如何执行任务的部分,然后在以后难以解决更复杂的实例。"

一位资深工程师表达了他的看法,如果他处在职业生涯的早期阶段,会对技能退化更加担忧:"我主要在我知道答案应该是什么或看起来应该是什么样子的情况下使用AI。我是通过'艰难方式'做软件工程发展出这种能力的...但如果我处在职业生涯的早期,我认为需要花很多刻意的努力来继续提升自己的能力,而不是盲目接受模型输出。"

技能退化令人担忧的一个原因是"监督悖论"——有效使用Claude需要监督,而监督Claude需要的正是可能因过度使用AI而退化的编程技能。一位工程师说:"老实说,我更担心监督和审查问题,而不是我的具体技能组...我的技能退化或未能发展,主要会在我安全使用AI完成我关心的任务的能力方面产生问题,而不是我独立完成这些任务的能力。"为了对抗这种退化,一些工程师刻意在没有AI的情况下练习:"时不时地,即使我知道Claude可以解决一个问题,我也不会让它做。这帮助我保持敏锐。"

关于是否还需要这些动手编程技能,工程师们的看法出现了分歧。也许软件工程正在向更高的抽象层次移动,这在历史上曾经发生过。早期程序员的工作离机器要近得多——手动管理内存,用汇编语言编写,甚至切换物理开关来输入指令。随着时间推移,出现了更高级、更易读的语言,自动处理复杂的底层操作。也许,特别是随着"感觉编程"(vibe coding)的兴起,我们现在正在转向将英语作为一种编程语言。一位员工建议有抱负的工程师"学会让AI写代码,并专注于学习更高层次的概念和模式"。

少数员工表示,这种转变使他们能够在更高层次思考——"关于最终产品和最终用户"而不仅仅是代码。一个人通过比较学习链表(计算机科学中的基础结构,现在高级编程语言会自动处理)来描述当前的转变。"我很高兴我知道如何做...但做这些底层操作在情感上并不特别重要。我宁愿关心代码让我能做什么。"另一位工程师做了类似的比较,但指出抽象是有代价的——随着向高级语言的转变,大多数工程师失去了对内存处理的深入理解。

继续在某个领域发展技能可以带来更好的Claude监督能力和更高效的工作("我注意到,当我熟悉某事时,我自己做通常更快")。但工程师们对这是否重要存在分歧。一些人保持乐观:"我不太担心技能侵蚀。AI仍然让我仔细思考问题,帮助我学习新方法。如果有的话,能够更快地探索和测试想法加速了我在某些领域的学习。"另一位更务实:"作为软件工程师,我的技能肯定在退化...但如果需要,这些技能可以恢复,而我现在就是不再需要它们了!"一位指出,他只丢失了制作图表等不太重要的技能,"真正关键的代码我仍然可以写得很好"。

或许最有趣的是,一位工程师质疑了这个前提:"'技能生疏'的说法依赖于一个假设,即编程有一天会回到Claude 3.5之前的样子。而我认为不会。"

编程的意义与工作的乐趣

工程师们对是否怀念动手编码的看法截然不同。一些人感到真正的失落——"对我来说这是一个时代的终结——我已经编程25年了,在这项技能上感到胜任是我职业满足感的核心部分。"其他人担心不再享受新工作性质:"整天提示Claude并不有趣或令人满足。自己放点音乐,进入状态并实现某些东西要有趣和令人满足得多。"

一些人直接面对这种权衡并接受了它:"写代码的某些部分我确实怀念——重构代码时进入禅意流动状态,但总体而言我现在的生产力高得多,所以我很乐意放弃那些。"

一个人说与Claude迭代更有趣,因为他可以对反馈更挑剔,不像对人类那样。其他人更关注结果。一位工程师说:"我原以为到这时候我会感到害怕或无聊...然而我并没有真正感到这两种感觉。相反,我感到相当兴奋,因为我能做的事情大大增加了。我以为我真的很享受写代码,但实际上我只是享受写代码带给我的东西。"

人们是否拥抱AI辅助还是哀悼失去动手编码,似乎取决于他们认为软件工程的哪些方面最有意义。

职场社交动态的微妙变化

一个更突出的主题是,Claude已经成为过去会向同事提问的第一站。"我现在提的问题总体上多得多,但其中80-90%都问的是Claude,"一位员工指出。这创造了一种过滤机制,Claude处理常规询问,留给同事处理超出AI能力的更复杂、更具战略性或需要更多上下文的问题("它让我对团队的依赖减少了80%,但最后20%至关重要,我会去和他们交谈")。人们也会向Claude"反弹想法",类似于与人类合作者的互动。

大约一半的人报告团队协作模式没有改变。一位工程师说,他仍在与人会面、分享上下文和选择方向,他认为在不久的将来仍会有很多协作,但"你不会做标准的专注工作,而是会与很多Claude对话"。

其他人描述与同事的互动减少了("我与Claude一起工作的时间远多于与任何同事")。一些人欣赏减少的社交摩擦("我不觉得占用同事时间有什么不好的")。其他人抵制这种变化("我实际上不喜欢常见的回应是'你问过Claude了吗?'我真的很享受与人面对面工作,非常重视这一点")或怀念旧的工作方式:"我喜欢与人一起工作,现在我'需要'他们的频率降低了,这让我感到难过。"几位指出了对传统师徒动态的影响,因为"Claude可以为初级员工提供很多指导"而不是资深工程师。一位资深工程师说:"更初级的人不像以前那样经常带着问题来找我,这让我感到难过,尽管他们的问题确实得到了更有效的解答,学习也更快。"

职业不确定性与角色演变

许多工程师描述他们的角色正在从编写代码转向管理AI。工程师们越来越把自己视为"AI代理的管理者"——一些人已经"经常至少有几个Claude实例在运行"。一个人估计他的工作已经转变为"70%以上是代码审查者/修订者而不是全新代码编写者",另一个人将"为1个、5个或100个Claude的工作负责"视为未来角色的一部分。

从长期来看,职业不确定性很普遍。工程师们将这些变化视为更广泛行业转型的预兆,许多人说"很难说"几年后他们的职业会是什么样子。一些人表达了短期乐观和长期不确定之间的冲突。"我对短期感到乐观,但从长期来看,我认为AI最终会做所有事情,让我和许多其他人变得无关紧要,"一位表示。其他人更直白:"感觉就像我每天来上班都在让自己失业。"

一些工程师更乐观。一位说:"我为初级开发人员感到担忧,但我也认识到初级开发人员可能对新技术最渴望。我对这个职业的发展轨迹总体感到非常乐观。"他们认为,虽然经验不足的工程师可能会发布有问题的代码,但更好的AI护栏、更多内置教育资源以及从错误中自然学习的结合,将帮助这个领域随着时间适应。

研究团队询问人们如何设想他们的未来角色以及是否有任何适应策略。一些人提到计划进一步专业化("发展有意义地审查AI工作的技能将需要更长时间并需要更多专业化"),一些人预计未来会专注于更多人际和战略工作("我们将花更多时间寻求共识,让AI花更多时间在实施上")。一位说他专门使用Claude进行职业发展,从中获得对工作和领导技能的反馈("我学习东西的速度,甚至不完全学习就能有效的速度完全改变了。我几乎感觉天花板对我来说刚刚破碎了")。

总体而言,许多人承认深刻的不确定性:"我对未来什么具体技能会有用非常没有信心。"一位团队负责人说:"没人知道会发生什么...重要的是要真正有适应能力。"

使用数据揭示的趋势

调查和访谈数据显示,Claude使用的增加正在帮助人们更快工作并承担新类型的工作,尽管这伴随着围绕AI委托和技能发展的紧张关系。不过,自我报告的数据只讲述了部分故事。为了补充这一点,研究团队还分析了Anthropic各团队的实际Claude使用数据。由于调查受访者报告Claude Code占其使用的大部分,研究团队使用隐私保护分析工具分析了2025年2月和8月的20万份Claude Code内部对话记录。

Claude Code的使用在过去六个月里转向了更困难和更自主的编程任务。员工们正在用Claude Code处理越来越复杂的任务。研究团队按1-5分量表估计了每个对话的任务复杂度,其中1对应"基本编辑",5是"需要人类专家数周或数月工作的专家级任务"。任务复杂度平均从3.2增加到3.8。为了说明分数之间的差异:平均3.2分的任务包括"排查Python模块导入错误",而平均3.8分的任务包括"实现和优化缓存系统"。

Figure 3. Changes in Claude Code usage between August 2025 and February 2025 (x-axes). Average task complexity increased over time (left panel), average maximum consecutive tool calls per transcript increased over time (middle panel), and number of human turns decreased over time (right panel). Error bars show 95% confidence intervals. The data suggest people are increasingly delegating more autonomy to Claude over time.

Claude在每次对话中连续调用工具的最大次数增加了116%。工具调用对应Claude使用外部工具采取的操作,如编辑文件或运行命令。Claude现在在需要人类输入之前可以自主串联21.2个独立的工具调用,而六个月前是9.8个工具调用。人类轮次的数量减少了33%。每次对话的平均人类轮次从6.2次减少到4.1次,表明现在完成给定任务所需的人类输入比六个月前少。这些使用数据证实了调查数据:工程师们将越来越复杂的工作委托给Claude,Claude需要的监督越来越少。看起来这很可能推动了观察到的生产力提升。

研究团队将Claude Code对话分类为一种或多种编程任务类型,研究不同任务的使用在过去六个月如何演变。总体任务频率分布从使用数据估计,大致与自我报告的任务频率分布一致。2025年2月和8月之间最显著的变化是,现在使用Claude实现新功能的对话比例大幅增加(从14.3%增至36.9%),进行代码设计或规划的也增加了(从1.0%增至9.9%)。Claude Code任务相对分布的这种转变可能表明Claude在这些更复杂的任务上变得更好,尽管也可能反映团队如何为不同工作流程采用Claude Code的变化,而不是绝对工作量的增加。

Figure 4. Distribution of various coding tasks (y-axis) as a percentage of the overall number of records (x-axis). We compare the distribution 6 months ago (pink) to present day (purple). The y-axis is ordered by frequency in Feb 2025.

研究从调查中发现,工程师们现在花更多时间进行小的生活质量改进;与此一致,当前8.6%的Claude Code任务被分类为"小烦恼修复"。这些包括较大的任务,如创建性能可视化工具和为可维护性重构代码,以及较小的任务,如创建终端快捷方式。这可能有助于工程师报告的生产力提升(解决以前被忽视的生活质量改进可能随着时间推移带来更高效率),并可能减少日常工作中的摩擦和挫折感。

为了研究任务目前如何在团队间变化,研究团队改进了分类方法,将每个8月对话分配到单一主要编程任务,并按内部团队划分数据。堆叠条形图显示了每个团队的编程任务分布。"所有团队"条显示整体分布,最常见的任务是构建新功能、调试和代码理解。这为团队特定比较提供了基准。

值得注意的团队特定模式包括:预训练团队(帮助训练Claude的人)经常使用Claude Code构建新功能(54.6%),其中很多是运行额外实验。对齐与安全团队和后训练团队使用Claude Code进行最多前端开发(分别为7.5%和7.4%),通常用于创建数据可视化。安全团队经常使用Claude Code进行代码理解(48.9%),特别是分析和理解代码库不同部分的安全影响。非技术员工经常使用Claude Code进行调试(51.5%),如排查网络问题或Git操作,以及数据科学(12.7%);Claude似乎对弥合技术知识差距很有价值。

Figure 5. Each horizontal bar represents a team (y-axis) with segments showing the proportion of that team’s Claude Code usage for different coding tasks (x-axis), color-coded by coding task (legend). Top bar (“All Teams”) represents the overall distribution.

许多这些团队特定模式展示了在调查和访谈中观察到的同样的能力扩展:实现团队原本没有时间或技能组合去做的新工作。例如,预训练团队运行了大量额外实验,非技术员工能够修复代码中的错误。虽然数据表明团队确实使用Claude进行核心任务(例如,基础设施团队最常使用Claude Code进行基础设施和DevOps工作),但Claude也经常增强他们的核心任务(例如,研究人员使用Claude进行前端开发以更好地可视化数据)。这表明Claude正在使每个人在工作中变得更全栈。

委托策略的形成

工程师和研究人员正在发展各种策略,在工作流程中有效利用Claude。人们通常委托以下类型的任务:超出用户上下文且复杂度低的任务,一位说"我将Claude用于我上下文少的事情,但认为整体复杂度也低。"另一位说"我遇到的大多数基础设施问题并不困难,可以由Claude处理...我不太了解Git或Linux...Claude很好地弥补了我在这些领域缺乏的经验。"

容易验证的任务也是常见的委托对象。"对于验证工作与创建工作相比不大的所有事情,它绝对令人惊叹。"定义明确或独立的任务同样适合:"如果项目的一个子组件与其余部分充分解耦,我会让Claude试一试。"

代码质量不关键的场景也适合委托。"如果是一次性的调试或研究代码,直接交给Claude。如果概念上很困难或需要某种非常特定类型的调试注入,或者是设计问题,我自己做。"重复或无聊的任务更是如此:"我对做这个任务越兴奋,就越不太可能使用Claude。而如果我感到很大的阻力...我经常发现与Claude开始对话更容易。"调查显示,平均而言,人们说44%的Claude辅助工作包括他们本来不会享受做的任务。

提示比执行更快的任务也会被委托。"对于我预计不到10分钟就能完成的任务...我可能不会费心使用Claude。""冷启动问题可能是目前最大的障碍。我所说的冷启动是指,关于我们团队代码库如何工作,我有很多内在信息,Claude默认不会有...我可以花时间尝试迭代完美的提示,但我就是会自己去做。"

许多用户描述了Claude使用的递进过程,涉及随着时间推移委托越来越复杂的任务:"起初我用AI工具询问关于Rust编程语言的基本问题...最近,我一直使用Claude Code进行所有编程。"一位工程师将信任递进比作采用其他技术,如谷歌地图:"一开始我只在不知道的路线上使用谷歌地图...这就像我使用Claude编写我不知道的SQL,但不让它编写我知道的Python。然后我开始在大部分知道的路线上使用谷歌地图,也许我不知道最后一英里...今天我一直使用谷歌地图,甚至用于日常通勤。如果它说走另一条路,我就走,只是相信它考虑了所有选项...我今天以类似方式使用Claude Code。"

工程师们对是否在专业领域内外使用Claude存在分歧。一些人在"外围"领域使用它以节省实现时间;其他人更喜欢熟悉的领域,在那里他们可以验证输出("我使用Claude的方式是我仍然完全理解它在做什么")。一位安全工程师强调了当Claude提出"以危险方式真的很聪明的解决方案,那种非常有才华的初级工程师可能会提出的东西"时,经验的重要性。也就是说,这是只有具有判断力和经验的用户才能识别为有问题的东西。

其他工程师对两种类型的任务都使用Claude,要么以实验方式("我基本上总是让Claude先尝试任何编程问题"),要么根据他们在任务中的专业知识水平调整方法:"我将工具用于我专业知识核心的事情(作为加速器,我知道期望什么并可以有效引导代理),以及稍微超出我专业领域的事情,我大致知道期望什么,但Claude能够填补我记忆或对特定定义熟悉程度的空白。""如果是我特别精通的东西,我会更果断,告诉Claude它需要追踪什么。如果是我不确定的东西,我经常让它成为专家,给我选项和关于我应该考虑和研究的事情的见解。"

人们一致表示,他们不对涉及高层次或战略思维的任务,或需要组织上下文或"品味"的设计决策使用Claude。一位工程师解释:"我通常保留高层次思考和设计。我尽可能从新功能开发到调试委托任何事情。"这反映在调查数据中,显示设计和规划任务的生产力提升最少。不过,许多人将委托边界描述为"移动目标",随着模型改进而定期重新谈判(下文中,Claude Code使用数据显示现在相对六个月前有更多编程设计/规划使用)。

展望未来:不确定性中的探索

Anthropic员工在过去一年大幅增加了对Claude的使用,不仅用它加速现有工作,还用于学习新代码库、减少繁琐工作、扩展到新领域以及处理以前被忽视的改进。随着Claude变得更自主和更有能力,工程师们正在发现使用AI委托的新方法,同时也在弄清楚他们未来需要什么技能。这些转变带来了明显的生产力和学习好处,同时也带来了对软件工程工作长期轨迹的真正不确定性。AI会类似于过去的软件工程转型——从低级到高级编程语言,或从个人贡献者到管理者,正如几位工程师所建议的那样?还是会走得更远?

现在还是早期阶段——Anthropic内部有许多早期采用者,局势正在迅速变化,研究发现目前可能不能推广到其他组织或环境。这项研究反映了那种不确定性:发现是微妙的,没有单一共识或明确指令出现。但它确实提出了关于我们如何能够深思熟虑和有效地应对这些变化的问题。

为了跟进这项初步工作,Anthropic正在采取几个步骤。他们正在与工程师、研究人员和领导层交谈,以解决提出的机遇和挑战。这包括审视如何将团队聚集在一起并相互协作,如何支持专业发展,以及如何为AI增强工作建立最佳实践(例如,由他们的AI流畅度框架指导)。他们还在将这项研究扩展到工程师之外,以了解AI转型如何影响整个组织的角色,并支持CodePath等外部组织,因为他们正在调整计算机科学课程以适应AI辅助的未来。展望未来,他们还在考虑随着AI能力提升可能变得越来越相关的结构性方法,如组织内角色演变或再培训的新途径。

Anthropic期待在2026年随着思考成熟分享更具体的计划。Anthropic是负责任职场转型的实验室;他们不仅想研究AI如何改变工作,还想实验如何深思熟虑地应对这种转型,首先从自身开始。

说到底,这项研究展示的不是一个已经有答案的故事,而是一个正在展开的实验。Anthropic的工程师们既是变革的推动者,也是变革的体验者。他们的经历——生产力的飞跃、技能的重塑、协作的变化、对未来的不确定——可能预示着更广泛的社会转型。关键不在于抵制或盲目拥抱这种变化,而在于以开放和审慎的态度去理解它、适应它,并塑造它的发展方向。对于每一个正在或即将使用AI工具的人来说,Anthropic工程师们的思考和困惑,值得我们认真倾听。

论文地址:

https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic

END
本文来自至顶AI实验室,一个专注于探索生成式AI前沿技术及其应用的实验室。致力于推动生成式AI在各个领域的创新与突破,挖掘其潜在的应用场景,为企业和个人提供切实可行的解决方案。


Q&A

Q1:Anthropic的工程师使用Claude后生产力提升了多少?

A:根据Anthropic内部调研,工程师们自述在过去12个月里,工作中使用Claude的比例从28%增至59%,生产力提升幅度从20%跃升到50%。更有14%的受访者报告生产力提升超过100%,成为公司内部的"超级用户"。这些提升主要体现在更大的工作产出量上,而不仅是更快完成同样的工作。

Q2:使用AI编程工具会导致编程技能退化吗?

A:这是Anthropic工程师们普遍担心的问题。一些工程师确实担心"随着委托更多工作,技能会退化",特别是失去手动解决问题过程中的附带学习。但也有工程师认为,软件工程正在向更高抽象层次移动,就像历史上从汇编语言转向高级语言一样。一些人刻意在没有AI的情况下练习以保持技能,而另一些人则认为这些技能在AI时代不再那么重要。关键在于发展有效监督AI输出的能力。

Q3:AI会取代软件工程师的工作吗?

A:Anthropic的调研显示,工程师们对此存在深刻的不确定性。许多人的角色正在从编写代码转向管理AI,有人估计70%以上的工作已变成代码审查和修订。一些工程师表达了"短期乐观但长期不确定"的矛盾心态,甚至有人说"感觉像每天来上班都在让自己失业"。不过也有人认为,AI会创造新的工作方式和机会,关键是保持适应能力。研究团队强调,现在还是早期阶段,没有人能确定未来会如何发展。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询