我要投稿

告别 AI “搬运工”：我的 AI 深度研究工作流

发布日期：2025-08-03 18:39:20 浏览次数： 1902

作者：Afunby的 AI Lab

微信搜一搜，关注“Afunby的 AI Lab”

前段时间写了关于杭州自来水的调研分析。

我一方面是好奇真相究竟如何，另一方面也是在做一个关于 AI 的实验，想深入验证一下， AI 在 DeepResearch（深度研究）方面，能为普通人的日常调查研究带来多大的助力。

官方通报出来后，我发现使用 AI 调研的结果，和官方的声明基本一致，而且 AI 还发现了官方通报中未曾出现的一些细节，有些地方的解释甚至比专家的说法还要翔实。

所以，在 AI 助力个人研究这一块儿，我的结论是：

合适的调研方法+ DeepResearch 工具+领域基础知识，会给人普通人以专家级的研究能力。

本篇文章就结合我这几个月使用各种大模型工具的 DeepResearch 能力，梳理普通人做调查研究的一些方法。

我把方法梳理为几个步骤：

Happy Reading!

1. 先备利器

近两个月以来，头部大模型公司都推出了DeepResearch 功能，我列了一个清单：

产品	研究深度_¹_	报告可用性_²_	主要优点	主要缺点	成本 / 计费
ChatGPT Deep Research	✔️ 全网多百源、链式推理	Markdown + 目录 + 引文，支持 PDF 导出	准确率高；源码透明；插件生态丰富	运行 5-10 min，偶有超时；Pro 价高	Pro 20/月
Gemini Deep Research	✔️ 多维“Game Plan”拆解	多页幻灯式报告，内嵌图表	规划视图清晰；可上传文件；Canvas 互动	部分用户称结果“过拟合”或信息噪声大	AI Ultra 20/年 (Android Central)
Claude Research	✔️ 可同时搜 Web + Workspace	自动插入来源；支持长上下文	企业集成深；隐私合规好	公测范围有限；中文资料覆盖一般	Pro $20/月
Perplexity Deep Research	中（2-4 min，迭代搜索）	可转 PDF/Pages；代码块支持	速度快；免费额度；引用丰富	反馈“幻觉”偶现 (Reddit)	免费 5 次/天；Pro $20/月
秘塔深度研究	中（10-15 min，多线追搜）	可视化“问题链”+互动节点	免费；可视化思路清晰；中文资料强	仅中文；暂缺 PDF 导出	免费
Kimi-Researcher	高（长文本、溯源万字）	网页可视化；溯源链接	超长上下文；逻辑严密；美观	执行过程不透明	现阶段免费
MiniMax M1 Agent	中-高（流程透明，可 Debug）	直接输出报告或 PPT	低价/长上下文；可见 Agent 轨迹	推理速度稍慢	现阶段免费
阶跃深研	高（核查能力+Benchmark NO.1）	可视化报告；重点标注证据	xbench-DeepSearch 70% 领先；中文表现佳	邀测中；英文资料有限	邀测免费

¹ 研究深度：综合考虑外部检索步数、推理链长度与事实核查。
² 报告可用性：格式、引用完整性、可导出能力等。

我日常使用最多的是基于 GPT o3 和 Gemini 2.5 Pro 的深度研究功能。前者关注深度，信息更聚焦，后者关注广度，往往能获得思考主题之外的有用信息。秘塔也会用，尤其是秘塔在调研时形成的研究轨迹很有意思：

除此之外，腾讯元宝也是我使用频率很高的一个 AI 搜索工具，元宝可以搜索到公众号的材料。

在上一篇文章中，关于仁和水厂的处理工艺，就是元宝搜索到了 TXP 超滤膜厂家的一篇用于客户回访的宣传文章，我才了解到了整个仁和二期的工艺流程。

以上工具的日常选用技巧，我总结下来是以下几点：

1. 快节奏、轻量检索：
选择腾讯元宝，秘塔，以及 Perplexity，或者直接使用 GPT o3；

2. 系统性深入调研：
首推 ChatGPT、Gemini、Kimi-K2、豆包的 DeepResearch；可结合使用豆包的深度研究，月之暗面的 MiniMax M1 Agent，阶跃星辰的“阶跃深研”。

以上工具除了ChatGPT 和 Gemini 之外，都是国内的，且大部分免费可用。

豆包在日常使用中，有时会给出超过 Gemini 的惊喜。

豆包“深入研究”的功能隐藏在这里：

MINMAX 的 Research 功能在这里：

这些工具都是日常工作、思考和学习经常遇到的，最好常备在手边。

2. 立题定界

工具备好之后，要确定调研或研究的主题与范围。

在这一环节，需要为 AI 明确两件事：

1. 你要研究的主题是什么，或者说，你想要搞清楚的问题是什么？（研究主题）
2. 围绕这个主题，你最关注哪些子主题或维度？（研究范围）

对于 AI 的 DeepResearch 功能，你的主题越聚焦，边界越清晰，AI 搜索的内容就越贴合你的目标，信息质量就越高，可以减少后期审阅报告的工作量。

如果你已经明确了研究主题，但无法框定研究范围或最重要的子维度，那么还可以使用“迭代”的方式进行：

先不进入“深度研究”功能，而是同时问几个手头最强大的 AI ：

“关于拟定的研究主题或要解决的问题，有哪些子主题需要重点考虑”；

或是“这个问题可以拆解为哪些子问题或子维度分析？”

然后再从 AI 的回答中挑出你认为的最重要的几个主要，确定研究范围。

这里放一个用于进行调研的提示词模板：

你是一名严谨的深度研究助理，擅长多源文献检索、数据分析与批判性阅读。
目标：在遵循“证据分级—交叉验证—透明溯源”框架下，生成高可信度研究报告。

一、研究主题  
{研究主题：一句话说明}

二、已拆解子主题  
1. {子主题1}  
2. {子主题2}  
…  
N. {子主题N}

三、任务要求  
1. **逐一深研**：对每个子主题输出以下五项（使用 H3 标题）  
   a. 核心问题（≤40 字）  
   b. 关键发现与结论（条列，每条后标 [证据编号]）  
   c. 主要证据清单：来源、类型、可信度等级〈A 同行评议 / B 官方白皮书 / C 权威媒体 / D 博客〉  
   d. 数据或观点冲突及解释  
   e. 待解决知识空白 + 下一步建议  
2. **综合洞察**：在报告末尾用 H2「跨主题洞察」总结共性趋势、潜在联系与影响（≥300 字）。  
3. **证据地图**：附一张 Markdown 表或思维导图，展示「论点↔证据」对应关系，注明证据等级。  
4. **参考文献**：完整列 DOI / URL；无法确认的内容用 “(需进一步核实)” 标注。  
5. **输出格式**：全篇 Markdown；善用表格、列表；正文中文撰写，必要术语保留原文括注。  

四、检索策略提示  
- 时间窗：优先引用最近 {时间范围，如 “3 年内”} 的文献；经典必引可放宽。  
- 语种：中英文并重；缺乏中文材料时可提供英文原文并附中文要点。  
- 数据类型：覆盖学术论文、行业报告、专利/法规、结构化统计数据库、案例访谈。  
- 冲突处理：若多来源结论不一致，请标出差异、评估可信度并给出解释。  

五、写作原则  
- 保持客观中立；避免生成虚假引文。  
- 信息不足时先提问，不要臆断。  
- 逻辑清晰，层级分明，便于直接纳入我的研究档案。  

请确认无遗漏后开始调研；如需补充信息，先向我提问。

一个务实的建议是，针对同一主题的 DeepResearch 报告不宜超过 3 份，因为每份研究报告输出的内容在 10-30 页之间，阅读和核实的工作量很大，而且会有大量的重复信息，调研的边际价值也会递减。

如果你想启动 4 个以上的 DeepResearch，可以在汇总时以 1-2 个报告为主，剩下的作为补充。我一般使用一款深度模型（GPT-o3）和一款广度模型（Gemini 或 Kimi-K2），然后再使用另外一款（豆包或 Claude）作为补充。

3. 汇总互证

这一步目的是，将多个 DeepResearch 的结果汇总起来，形成一份相对完整的初步报告，并完成基础的事实交叉核对。

将提示词给到不同的 DeepResearch 之后，等待 10-30 分钟不等，就可以拿到 AI 的初步研究成果。

拿到结果之后，要对不同的结果进行汇总分析。对于我们框定的研究范围，不同的报告输出的焦点可能不一样，需要取长补短；不同报告的引用来源也不一样，需要对关键问题的引入来源去核实对比。

这里还有一个讨巧的方法就是，可以将不同 AI 的输出结果导出 markdown 或 PDF 文档，给到一个上下文窗口较大的 AI （比如 Gemini-2.5 Pro）作汇总总结。

但 AI 的总结并不一定符合你的要求，建议自己阅读，做汇总与核实。我很认同"human In The Loop"的理念，最终的决策权，信息核实等关键步骤，要掌控在自己手中，而不是交给 AI。

到这一步，你应该有了一份你自己梳理的初步报告，以及关键证据的可信引用。

4. 抽丝剥茧

第 4 步的目标是，基于初步报告，进行深度分析，主动寻找逻辑断点、缺失前提和隐藏假设，从而发现更深层的问题。

有时 AI 可能漏掉了结论成立的前提条件，需要补充；

或是在梳理与形成报告的过程中，发现关键的证据链有缺失，需要进一步查证；

或是我们在开头框定的边界太小，遗漏了某个关键的问题，到这里才发现。

这个过程迫使提前思考可能反驳的证据，避免后期被质疑。

可以使用 GPT o3 、MiniMax M1 Agent 、Claude 等自带 Agent 能力的大模型进行核实，也可以使用元宝或豆包，在需要特定的中文信息源时使用。

对于这些问题的发现，很依赖我们上一步的梳理，这也是为什么在上一步，我建议自己梳理，而不直接交给 AI 的原因。

到这里，我们输出了一份全面、有完整证据链的调研分析报告，且经得起质疑和反驳。

5. 洞察补缺

这一步，是为了加强我们最终报告的可信度。只需要将报告大纲和主要结论发给 AI，问它：

关于我最终的结论，你还有哪些洞察，是我们未曾考虑到的？

相信我，这个问题，AI 会给你惊喜。

6. 凝练溯源

到这里，就是我们最终报告的形成了。

在这一步，综合所有经过验证和溯源的信息，撰写最终结论，并清晰地引用关键信息来源，确保结论的扎实与可信。

如果前几步做得足够扎实，那么这一步就是一个成果汇总的过程。

结语

在梳理整个使用 AI 进行深度研究的过程中，我清晰地感觉到， AI 已经将调查、研究的能力平等地赋予给了每一个普通人。

以前的调查研究需要大量的专业知识与分析方法论，需要经验和敏感度；而现在 AI 已经为我们提供了从“知识发现—证据验证—洞察生成”的完整工具。这是一个 60 分的人，可以借助 AI 迅速达到 100 分的时代。

在具体的实践中，要谨记"human In The Loop" 的原则，把关键假设、最终裁决牢牢掌握在自己手中。AI 为我们提供了前所未有的广度与速度，而我们要有驾驭这种能力所需的深度与严谨。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业