我要投稿

说说Kimi探索版的深度搜索和o1

发布日期：2025-02-15 04:22:11 浏览次数： 2775

作者：ADaM应用数据挖掘和机器学习

微信搜一搜，关注“ADaM应用数据挖掘和机器学习”

这两天媒体带节奏，把Kimi探索版比作中国的o1。我感觉Kimi探索版主要还是用了手动写逻辑和提示词的“所谓”agent解决方案。有标准的查询拓展、总结等步骤，遵循的是目前AI搜索在后台常见的工作流。但根据推断时间看，Kimi探索版可能对搜索工作流的流程做了一些调整，比如增加网页召回数、加入反思、重搜索等步骤。

虽然有些人认为o1也结合了提示工程，但我更倾向于相信o1的规划推理等都是模型内部自动完成的，输出的回复是单次模型调用的结果。这里指的是主推理模型，最终展示给用户的结果还经过了思考过程摘要、安全对齐等处理。接下来的讨论都基于这一假设。

事实上，人家Kimi探索版是个搜索系统，而o1模型重在逻辑推理，两者没有必要直接比较。但值得思考的是，如果把类o1这种更高级的推理模型应用于搜索，会有什么效果？毕竟，搜索本身是一个涉及多步骤的复杂任务，很适合作为测试模型推理能力的场景。

把o1用于搜索的直接变化是，模型可以自动完成任务分解、选择查询拓展、反思和总结等步骤，替代了手动写逻辑和提示词，可以根据不同情况灵活应对搜索需求。但因为搜索设计多轮反馈，需要结合搜索结果展开后续步骤。搜索过程需要系统层面的多次模型调用和反馈整合。从这一点来看，OpenAI如果想展现自家模型的领先性，坚持只通过模型层解决问题，虽然o1正式版会包含多模态能力，完整的工具调用能力应该不会很快上线。

OpenAI将AGI的发展分成了chatbot、reasoner、agent、innovator和organization五个阶段。o1正处于reasoner第二阶段。按照OpenAI的技术品味，第三阶段应该不是目前依赖手动提示工程的“所谓”agent方式，而是将任务规划和工具调用能力内化到模型中，这意味着模型在调用工具后能够自主处理外部反馈，并基于反馈进行下一步决策。这有点像全双工语音模型，能够同时处理输入和生成：模型在调用工具后会等待外部世界的反馈，然后结合反馈继续下一步的行为。这或许才是理想中的智能代理：不需要预设执行步骤，只需一次调用，模型便可以自主分析、动态规划，并异步执行复杂任务。