我要投稿

百度这件事我跟别人解释了好多次

发布日期：2026-03-19 14:50:38 浏览次数： 1879

作者：王智远

微信搜一搜，关注“王智远”

文心5.0刚出时，我经常跟朋友推荐。

文本能力本身已经很强了，但每次推荐时，我都会额外补一句：你试试它的搜索，真的好用。

大多数人反应差不多，是礼貌性地「哦」一声，然后该用什么还用什么。少数人会直接问，百度搜索现在还行吗？

我理解这种反应。

很多人对百度的印象停留在几年前，觉得它是传统搜索引擎，没什么新鲜感了；你跟他说搜索好用，他心里多少会打个问号，甚至会去用各种AI助理去了。

但我确实在说真话。

我的工作有一个硬性要求，数据不能出错；写商业分析，引一个营收数字、市场规模、融资金额，白纸黑字发出去，错了就是错了，没有「大概齐差不多」这回事。

这种校验的痛苦，做过内容的人都懂。

同一个数据，自媒体写500万，官方通稿报的是800万，到底信谁？你去翻三四个信源交叉比对，才能确认哪个口径是准的。

我用了市面上能用的工具，坦白讲，数据口径校验这件事上，百度搜索是让我最省心的；它能把官方信源、权威媒体的报道优先给捞出来，而且，时效性很强，昨天的发布会数据今天就能检索到。

这个能力听起来不性感，对我来说是刚需。

你可以说一个AI写作能力强、推理能力强、对话体验好，这些我都认；如果连引用的数据都没法确认是对的，其他能力对我来说就是空中楼阁。

百度做搜索做了二十多年，这个根基在那儿。

检索能力、信源积累、中文语料的覆盖，这些东西不是花两年时间训一个大模型就能追上的。

说实话，听我推荐的人不多。后来，我也不太执着于说服别人了。

人就是这样，愿意活在自己已经接受的那个判断里；一旦你形成了「百度搜索也就那样」的印象，跟印象矛盾的信息，都会自动过滤掉。

打破成见是一件成本很高的事，得承认自己之前的判断可能是错的，这对大多数人来说比接受一个新工具难多了；所以，我也不劝了，就自己用着，直到最近，有些事情开始帮我劝了。

今年315，央视曝光了一个叫GEO的东西，全称：生成式引擎优化；听着很专业，干的事情很简单：

花几十块钱，写十来篇软文，批量发到网上，等AI抓取、引用，几天之后，一个根本不存在的虚构产品就能变成AI口中的「推荐好物」。

被曝光的服务商自己都不避讳，直接管这套流程叫「给AI投毒」。

这件事传开之后，很多人的第一反应是愤怒，觉得这帮人太缺德了。如果你仔细想想，真正让人后背发凉的，其实是另一件事：你平时问AI得到的「答案」，有多少是被喂过的？你根本不知道。

315之前，AI幻觉的问题已经在发酵了。

演员刘美含配音时遇到一个字，「铸币坊」的坊，不确定读几声；她先后用了百度AI、DeepSeek、元宝、豆包等五款工具查了一遍，结果四款给的答案各不相同。

DeepSeek和元宝说是「一声」，豆包换个时间查给的结果还不一样，只有百度AI给了二声。

最后她经纪人翻了《新华词典》App，确认正确读音是fáng，二声。百度是唯一答对的。

南京师范大学文学院教授化振红也确认了，这个字在「铸币坊」这个语境里，指小手工业生产场所，读二声没有争议；一个汉字读音，查词典三秒钟就能解决的问题，五款AI工具能给出四种答案。

还有一个更有意思的。

有个博主在豆包上查古文「赤也为之小，孰能为之大」里面「为」字的读音，豆包先给了一个解释，说读四声，是介词。

博主拿百度结果去对质，百度说这里的「为」是动词，读二声。豆包看完之后改口了，回了一句：「你说得对，百度这里是对的，我刚才解释错了，非常抱歉。」

一个AI，被另一个搜索引擎的结果纠正了，然后向用户道歉。这个画面多少有点魔幻。

如果只是一两个案例，可以说是偶发，是模型还没训练到位；但315的GEO黑产、刘美含的读音乌龙、豆包的当场认错，这些事情挤在同一个时间窗口里集中爆发，它们指向的是同一个问题。

这个问题跟某一款AI产品好不好没关系，跟某一个大模型参数够不够大也没关系，它是AI「给你答案」这种模式本身带着的东西。

你有没有想过，为什么传统搜索引擎很少出现这种「张嘴就来」的问题？

原因很简单。

搜索引擎给一堆链接，你自己点进去看，自己判断哪个可信；它本质上在说：我帮你找到了这些信源，你自己定。

AI给的是一段话，一个结论，一个看起来很确定的答案；它本质上在说：你不用看了，我替你看过了，结论在这儿。

这两种模式的区别，表面上是效率高低的问题，往深了想，是判断权在谁手里的问题。

搜索引擎的模式，判断权在自己手上。信源靠不靠谱，数据口径对不对，自己比对、拿主意。这个过程确实慢，确实麻烦，但我们对信息的来龙去脉是清楚的。

AI的模式，判断权在模型手上。

它从海量语料里算出一个「最可能」的表达，打包成一段流畅的话递给我们；我们读着很舒服，很高效，但不知道这个结论是从哪来的，经过了什么筛选，丢掉了哪些不同的声音。

GEO黑产钻的就是这个空子。

既然用户看不到来源，那我只要把虚假内容喂进去，模型就可能把它当成「事实」输出；AI幻觉也是同一个逻辑，模型不知道自己不知道，但它的表达方式永远是一副「我很确定」的样子。

所以，刘美含查一个字的读音，五款AI能给四种答案，每一款都说得斩钉截铁；它们各自都很「确定」，但确定的方向完全不同。用户站在中间，反而比不查的时候更困惑。

百度搜索在这件事上做对了什么？

它没有放弃「给线索」这个逻辑，AI能力加上去了，但底层的搜索根基还在。我看了下资料，它在AI生成答案之前，其实做了挺重的筛选工作。

先是在信源这一关就卡得很严。

系统会自动去看发布时间、作者是谁、站点本身的信誉怎么样，不靠谱的内容在这一步就被拦掉了，只有权威信源才能进候选池。

进了候选池也不是终点。

同一个结论，得有多个可信来源互相印证才会被采用。孤证不立，单一来源说了不算。

答案上线之后还有一层兜底。后台有一套实时巡检的系统在跑，发现内容有偏，立刻介入纠正。

再加上百度百科那套体系。

所有词条先审后发，机审加人审，敏感词条还有高级别审核员二次核验，引用的参考资料必须是权威媒体来源。这个知识库已经联合了中科院、北大等机构超过10万专家，共建了超过100万个专业词条。

这些东西听起来很笨，很重，很不「AI」。但恰恰是这些笨功夫，让百度在刘美含那个测试里成了唯一给出正确答案的那个。

说到底，搜索和AI之间的差距，除了聪明还要关注谁更老实。讲到这儿，有人可能会觉得我在唱衰AI。

真没有。

AI在效率上的提升是实打实的，日常闲聊、文案生成、快速总结，这些场景用AI又快又好，没必要开一个搜索引擎慢慢翻。

我想说，搜索和AI从来就不是一个替代另一个的关系。

一个很有意思的信号是OpenClaw。

这个全球爆火的智能体平台，Skill就是它的App，开发者可以给AI装上各种能力插件。ClawHub上面有两万多个Skill可以选，什么类型都有。

在搜索类Skill里面，百度搜索的下载量和收藏量排在全球第一。一个搜索引擎的官方插件，在一个AI智能体平台上被下载得最多，你品品这件事。

开发者比普通用户更清楚一个道理：

搜索是智能体的基础设施。AI模型的训练数据有时间限制，上下文窗口也有天花板；如果没有一个靠谱的搜索能力帮它接入真实世界的最新信息，后面所有的推理、决策、自动化任务都是在沙子上盖楼。

用一个开发者的话说，搜索类Skill决定了整个智能体应用的智商下限。

这句话反过来理解就是：AI越强大，越需要搜索来兜底。模型的推理能力再好，如果喂进去的信息就是错的，输出的也只会是一本正经的胡说八道。

回到开头。

我之前跟朋友推荐百度搜索好用，大家不太信；现在315也好，AI幻觉也好，这些事情正在替我把道理讲明白，大家用了一圈AI后，开始重新理解搜索本身的价值。

打破成见有时候不需要说服。你把真实的东西摆在那儿，等就行了。

百度搜索做了二十多年，这二十多年的积累，在AI时代到来之前，看起来是旧资产，现在回头看，是地基。

地基不牢，上面盖什么都是幻觉。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-04

Apple Silicon 上本地跑 LLM，速度直接甩 Ollama 几条街

2026-05-03

奥特曼：Codex 正在经历 ChatGPT 时刻。这是要起飞了

2026-05-01

永别了，终端！OpenAI疯狂升级Codex，接管Mac人类全程0操作围观

2026-04-30

Karpathy 最新访谈：Vibe Coding 只是开始，真正重要的是 Agentic Engineering

2026-04-30

近4万Star！一个终端把自己变成了AI开发环境，Cursor和Claude Code都沉默了

2026-04-29

Claude Code 的 Memory 系统：让 AI 记住你的偏好

2026-04-29

深入浅出Harness Engineerring之核心模式与理念

2026-04-28

别急着All-in DeepSeek V4，先看看这10位从业者的真心话

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

豆包 2.0 模型发布，全信息整理（全网最完整，另附 79 页 Model Card）

2026-02-14

谷歌重大更新：国内手动开启 Gemini AI 侧边栏与 Auto Browse 自动浏览全攻略

2026-02-03

OpenAI 发布新的 Codex 桌面版，我现在不骂 Codex 难用了

2026-02-03

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

全网最详细的Codex入门教程，手把手教你玩转Vibe Coding。

2026-02-09

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

OpenAI Codex CLI 完整使用指南

2026-04-07

大家都在问

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

本体化语义层，会是 AI 数据平台的新地基吗？

2026-04-22

设计行业的“棺材板”，要被Claude Design盖上了？

2026-04-18

当所有人都不写代码了，谁来看懂代码？

2026-04-13

什么场景该用 AI Native？

2026-04-12

12MB的Go二进制，让AI操控浏览器只花800 tokens，PinchTab凭什么这么省？

2026-04-07

华为AI 49元/月！贵？不贵？

2026-04-01

为什么这波 AI 产品都开始抢着做 CLI ？

2026-03-31

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw