我要投稿

我们到底在和谁竞速 ——谈AI的应用

发布日期：2026-03-23 15:27:39 浏览次数： 2021

作者：史剑笔谈

微信搜一搜，关注“史剑笔谈”

我们到底在和谁竞速

——谈AI的应用

文：二本海默

序言：加速器

前几天做作业，最大的感受就是，现在的客户端和网页版免费AI越来越强大了，不只是模型本身，还有调用工具的能力。

这点，我最早是在豆包身上发现的。从它的思考过程可以看出，它真的在调用工具。

能调用工具，和过往最大的不同就是，AI不再是只能提出建议和规划行动路线的存在，而是切切实实成为了一个“虚拟”的乙方。就好像，它真的坐在一台电脑或服务器面前，理解了你的需求以后开始调用软件工具去解决你的问题。

过往，这些功能一般也都是有代码背景的人更容易掌握。诸如function calling、MCP等名词，在年初的时候也跟着开源大模型的浪潮火了一把。

但现在，我可以说，除了对上述功能极其熟悉的人，其它所有人，都和没有代码经验的普通人没什么区别了。

AI成为了名副其实的，加速器。

徒劳

最让我感觉到破灭的是，在学了将近一年的提示词、本地配置、模型调教、API调用等等大语言模型的应用端技能后，我的同学，仅仅是一个豆包，一个扣子，一个DeepSeek，就可以在同一个课程作业上，和我做到几乎没什么差距的效果。

这些大模型的公司和开发者是在替用户努力。他们的努力，比我的努力更有价值，效率也更高。

而他们的努力，使得我努力和别人拉开的差距，几乎是瞬间归零。

在这个AI刚刚起步的年代，和AI有关的努力，似乎都变成了徒劳。

也许你苦学两个月的编程和深度学习，到头来发现那些背下来或者copy下来的精妙的提示词，在越来越“通人性”的AI面前，不值一提，普通人仍然什么都不用学，只需要理解自己的需求，就可以用AI做出和你差不多甚至超过你的作品。

我从未见过有这样一个工具，能够如此疯狂地，率先选择贴近用户的需求来做开发。

就像是，要把所有人都拉回到同一个起跑线，公平竞争一样。

毛细

可是AI真的强的离谱吗？至少现在还没有。

这几个月我也在让AI帮我写代码，做一些最简单的前端，AI已经完全可以胜任了，制作精良，虽然一眼AI味，但是效果仍然非常强，至少点进去以后我不会觉得不堪入目。

然而，当我希望AI帮我对现有项目做一些优化的时候，我能感觉到AI的力不从心。

比如，大段大段删改我的原有代码，修改变量的名字，修改function的名字，等等。

好在我是一个在开发过程中喜欢做迭代备份的人。我之前写竞赛用的代码的时候，一共修改了几十个版本，每个版本都有自己的独立名称，哪怕是调整了函数名我也会单独命名。

而任何有问题、不够完美，但是被我判定为“比起给AI提修改意见，不如去自己做个简单修改”的代码，一般也是我自己来处理。

所以，我也发现了这些问题。

年初的时候我尝试过本地部署AI，但我发现我的主板和内存根本带不动我的需求，所以我转向了API，让服务商来帮我处理问题。

很快我就发现，API的处理也是有极限的，不是我发什么发多少它都能处理。

不同的大模型也有自己的术业专攻。

比如，deepseek是推理能力强，但是多模态能力聊胜于无，属于模型本体强势，但是应用高度依赖外部工具调用，高效率调教门槛高。

GPT和Gemini则弥补了deepseek在多模态能力上的短板，并且内容更简洁干练，对用户的目的识别更为准确，但这两者的缺点一个是成本，几乎是deepseek的十倍，另一个是，它们对于工具的调用仍然也是外部居多，尽管能处理的内容类型增加，但是在解决问题的路上，也面临工具调用的门槛高的问题，需要单独学习。

国产这边则很好解决了刚才提到的国内外模型面对的工具调用的问题。豆包就是一个典型，从它的任务完成过程可以很清楚看到，它的确在根据我的需求和上传的内容，模拟一个真实的操作员在调用电脑上的工具，甚至替我运行程序来检查可能出现的问题。

豆包在工具调用和多模态内容处理上的能力要远强于各类大模型软件和接口，但它的推理能力和对于代码以外的数学、社会科学、自然科学等专业类内容的处理能力，完全可以用拉跨来形容。

所以，我现在的工作流是，Gemini优先，为我做任务规划，复杂任务先让豆包做初步的工具调用处理，再把内容喂给Gemini调整，最后纠错和优化这种大量tokens的末端内容扔给deepseek。

学习的流程则是，先让Gemini给我写提示词，然后多模型任务逐个测试能力，择优使用，一般都是deepseek和Gemini最后作为我的工具被选择。

当然，我这些对各家大模型和软件的概括只是很片面的一部分，比如deepseek没被提到的推理过程冗长无效的问题，尽管结果是对的，但是过程浪费时间等等的问题。这个日后再谈了。

但这些都不成熟，因为一些最末端的问题仍然无法解决。

比如说，它为我修改好了代码，但是仍然有一些低级错误的报错，就需要我去手动调整，或者是代码结构出了问题，也需要我手动调整。往往是十步以内的简单调整就可以让代码按照想要的效果运行起来，AI在这里的效率还是值得承认的。

但这不够。

我们对AI的期望，是希望它单纯作为一个工具，还是它能像人一样工作。

无论哪个，AI都做得不够。

我自己的话，大规模复杂任务先扔给豆包或者扣子，做初步的处理，把任务分解为可以让Gemini处理的水平以后再交给Gemini去执行。

过往，我以为提出任务和复盘总结是很简单的，就像是人体循环系统的动、静脉一样，只需要确认和修正大方向即可，过程才是最困难的，就像毛细血管一样，需要尽可能覆盖任何一个细节。

然而，AI的诞生让我意识到，执行任务的“术”也就是具体的技术和方法可能不再那么重要了，因为这些东西，作为方法，只要被发明出来，就可以交给AI去执行和控制了。

反而是最开始的提问、解析问题、提出方案、发布指令，以及结束时的复盘、任务优化、归纳等等，变成了最重要的毛细血管，决定着整个任务执行过程中，是否会出现大的偏差和问题。

我想这就是提示词工程存在的意义，不仅仅是让AI更好理解人的需要，也是让我们自己更好离家我们的需要。

自我竞速

强人工智能的诞生在目前尚未看出端倪。尽管我对强人工智能的诞生短期内持乐观态度，并因此对个人前景持悲观态度。

就我自己的感受来说，我能意识到，在我用嘴和别人说话的时候，我的思维模式，本能而不经思索的谈吐，很像是LLM的运行逻辑，也就是根据之前的所有文本内容，推测下一个字是什么。但也有不一样的地方，就是，AI是基于训练和经验，人则有一些无法确认的因素。

但这个说法也不绝对。LLM的智能涌现仍然是一个不可忽略的话题。

讨论强人工智能对人的彻底取代，从现在来看还不那么现实。就如同LLM的兴盛，很少有人看出了这点。

从比较现实的角度，AI大模型及其开发商们在做的事情，就是以最快的速度和最高的质量，为客户在各种场景中使用大模型，尽可能抹平障碍。

to B也好，to C也好，无论如何，AI的客观效果是，基于互联网基础设施，尽可能拉平每个人所使用的工具的起跑线。

你的单一工具，迟早会变成，不比程序员的复合工具要弱的工具，在明确自己需求的情况下，你+AI不会弱于程序员+AI。

这是一种很理想的状态，吗？

有个段子说，古代的农民认为，皇帝也不过是拿着金锄头耕地的高级农民。

这个段子从反方向说明，真正掌握一个工具，首先要有与之相称的认知水平，要理解工具到底能做到什么，否则AI也只是一个偶尔称职的许愿机。

尽管AI也许可以无限制降低使用门槛，但如果一个人不理解自己到底要创造什么，他迟早会创造出自己无法掌控的事物。灾难往往如此诞生。

从另一个侧面来说，当工具变得万能，能创造什么，实现什么价值，就又回到了我们自身。

当AI进步飞速，适配普通人的速度也在起飞，你所额外学习的调用AI的知识，其边际效益会迅速递减，比较优势相比于其他和你拥有一样专业知识的人几乎为0。

那么，我们自身的价值在哪里呢？

在于，人更有去解决自己所提出问题的动力，前提是，你会提出一个很清晰的问题，或者清晰化你所提出的问题。

提问题的前提在哪里呢？在于你的的确确知道你有什么问题，以及你到底在问什么。

这个话说得很笼统，举个例子好了。

以考研为例，仅仅是举例，不代表个人意愿，我希望考上一所985大学的理工科专业。

这个问题很好，它对于很多双非学校的学生来说很重要。

但它也很不好，因为很不清晰。哪所985大学，哪个专业？

你需要去调研，但是调研，如果单拎出985大学的数量，以及其中有多少个理工科专业，这些数目一旦相乘，就是一个巨大的数量。对AI来说把这些数据筛选出来很轻松，可是人处理得了吗？等人去处理完再做抉择，估计别人一轮复习都一半了。

所以，你必须明确，你选择985大学之后，你的二级指标是什么，是好专业、好城市、好导师，还是别的各种因素。

以我个人经验来说，一般四到五个二级指标就足够规划出有限个可观的选项了，到了人可以处理的范围内。

还是举个例子，江浙沪、二线及新一线以上城市，理工科强，排除浙江除杭州之外的所有地级市，上海高铁2小时范围内。

注意，这里“理工科强”是一个不清晰的指标，其实还可以再清晰一些，但即便如此，仅其他的指标，在AI的帮助下，目标也只剩下7个了。

上交、同济、复旦、华东师范、东南、南大、浙大。

当然，真正制定目标的时候，不能太贪心。毕竟，实力摆在这里，我的实力是双非，那么冲末流211才是最现实的。但即便如此，选择也相当有限了。

这也反映了另一个现实：在能力没有增长的情况下，多任何一个维度的需求，都会极大程度降低个人可选择的道路数量。

这也让我切身体会到了“退一步海阔天空”到底是怎么回事。

回到正题，仅仅是择校就已经到了这个程度，定向的复习资料、复试的双向选择、学校的科研资源等等等等，这些笼统的课题指向无数个需要解决的具体问题。

以往解决这些问题，都是依靠有关系的人提供渠道信息。今天，尽管关系户或者消息贩子仍然是效率最高的内部情报来源，但互联网让这些也不再是遥不可及，只要愿意，总会有门路的。

而如何找到这些信息，在今天仍然是一个难题。尽管信息存在，但哪怕是关键词搜索，就可能面临信息污染、关键词模糊等等问题。

AI暂时不可能做到每一个问题的毛细血管都为你探明。我们说到底，在操作越来越简单的AI工具面前，最大的对手，仍然是自己。

而我们要与自己赛跑，因为年龄增长，一些需求是在不由自主诞生的，一些限制也会自然而然产生。而刚才就提到了，每多一个维度的需求，就会降低个人可选择的道路数量。

自我竞速也是个很笼统的问题，最简化的方式就是——通过最快增加自己理解知识的深度和广度，来培养自己联系与创造的能力。

尾声：精益求精

这篇文章是我考完试后的第一篇，生病的时候写的，很多地方和我最初的设想已经完全不一样了。

即便状态不好，也没什么可狡辩的，到头来我自己的知识储备，也让我在涉及到某些毛细血管的末端的时候，应对乏力。

但我仍然喜欢这些。做完比做好重要。

而AI给我们提了一个更高的要求。

如果做事只是浅尝辄止，那也用不到AI，但代价是，只留下了一个入门的引子，却没有留下属于自己的东西。

至少，不会比AI更好。

所以，AI真正能帮助我们的是，把一个从未设想过能做到结尾的事情，无论成败与否，尽可能最接近那个设想中的结果所在的地方。

但这也要求我们，如果真的想要好好使用AI，要明确自己想要什么。

要么做精，要么不做。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业