支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


告别 AI “搬运工”:我的 AI 深度研究工作流

发布日期:2025-08-03 18:39:20 浏览次数: 1510
作者:Afunby的 AI Lab

微信搜一搜,关注“Afunby的 AI Lab”

推荐语

AI如何让普通人也能进行专家级深度研究?揭秘高效调研的实战方法论。

核心内容:
1. 主流AI研究工具横向测评与使用心得
2. 构建专家级研究能力的三大关键要素
3. 从自来水事件看AI深度研究的实际应用效果

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

前段时间写了关于杭州自来水的调研分析

我一方面是好奇真相究竟如何,另一方面也是在做一个关于 AI 的实验,想深入验证一下, AI 在 DeepResearch(深度研究) 方面,能为普通人的日常调查研究带来多大的助力。

官方通报出来后,我发现使用 AI 调研的结果,和官方的声明基本一致,而且 AI 还发现了官方通报中未曾出现的一些细节,有些地方的解释甚至比专家的说法还要翔实。

所以,在 AI 助力个人研究这一块儿,我的结论是:

合适的调研方法+ DeepResearch 工具+领域基础知识会给人普通人以专家级的研究能力。

本篇文章就结合我这几个月使用各种大模型工具的 DeepResearch 能力,梳理普通人做调查研究的一些方法。


我把方法梳理为几个步骤:

Happy Reading!


1. 先备利器

近两个月以来,头部大模型公司都推出了DeepResearch 功能,我列了一个清单:

产品
研究深度_¹_
报告可用性_²_
主要优点
主要缺点
成本 / 计费
ChatGPT Deep Research
✔️ 全网多百源、链式推理
Markdown + 目录 + 引文,支持 PDF 导出
准确率高;源码透明;插件生态丰富
运行 5-10 min,偶有超时;Pro 价高
Pro 20/月
Gemini Deep Research
✔️ 多维“Game Plan”拆解
多页幻灯式报告,内嵌图表
规划视图清晰;可上传文件;Canvas 互动
部分用户称结果“过拟合”或信息噪声大
AI Ultra 20/年 (Android Central)
Claude Research
✔️ 可同时搜 Web + Workspace
自动插入来源;支持长上下文
企业集成深;隐私合规好
公测范围有限;中文资料覆盖一般
Pro $20/月
Perplexity Deep Research
中(2-4 min,迭代搜索)
可转 PDF/Pages;代码块支持
速度快;免费额度;引用丰富
反馈“幻觉”偶现 (Reddit)
免费 5 次/天;Pro $20/月
秘塔深度研究
中(10-15 min,多线追搜)
可视化“问题链”+互动节点
免费;可视化思路清晰;中文资料强
仅中文;暂缺 PDF 导出
免费
Kimi-Researcher
高(长文本、溯源万字)
网页可视化;溯源链接
超长上下文;逻辑严密;美观
执行过程不透明
现阶段免费
MiniMax M1 Agent
中-高(流程透明,可 Debug)
直接输出报告或 PPT
低价/长上下文;可见 Agent 轨迹
推理速度稍慢
现阶段免费
阶跃深研
高(核查能力+Benchmark NO.1)
可视化报告;重点标注证据
xbench-DeepSearch 70% 领先;中文表现佳
邀测中;英文资料有限
邀测免费
¹ 研究深度:综合考虑外部检索步数、推理链长度与事实核查。
² 报告可用性:格式、引用完整性、可导出能力等。

我日常使用最多的是基于 GPT o3 和 Gemini 2.5 Pro 的深度研究功能。前者关注深度,信息更聚焦,后者关注广度,往往能获得思考主题之外的有用信息。秘塔也会用,尤其是秘塔在调研时形成的研究轨迹很有意思:

image.png

除此之外,腾讯元宝也是我使用频率很高的一个 AI 搜索工具,元宝可以搜索到公众号的材料。

在上一篇文章中,关于仁和水厂的处理工艺,就是元宝搜索到了 TXP 超滤膜厂家的一篇用于客户回访的宣传文章,我才了解到了整个仁和二期的工艺流程。

以上工具的日常选用技巧,我总结下来是以下几点:

1. 快节奏、轻量检索:
选择腾讯元宝,秘塔,以及 Perplexity,或者直接使用 GPT o3;

2. 系统性深入调研:
首推 ChatGPT、Gemini、Kimi-K2、豆包的 DeepResearch;可结合使用豆包的深度研究,月之暗面的 MiniMax M1 Agent,阶跃星辰的“阶跃深研”。

以上工具除了ChatGPT 和 Gemini 之外,都是国内的,且大部分免费可用。

豆包在日常使用中,有时会给出超过 Gemini 的惊喜。

豆包“深入研究”的功能隐藏在这里:

image.png

MINMAX 的 Research 功能在这里:

image.png

这些工具都是日常工作、思考和学习经常遇到的,最好常备在手边。


2. 立题定界

工具备好之后,要确定调研或研究的主题与范围。

在这一环节,需要为 AI 明确两件事:

  1. 1. 你要研究的主题是什么,或者说,你想要搞清楚的问题是什么?(研究主题)
  2. 2. 围绕这个主题,你最关注哪些子主题或维度?(研究范围)

对于 AI 的 DeepResearch 功能,你的主题越聚焦,边界越清晰,AI 搜索的内容就越贴合你的目标,信息质量就越高,可以减少后期审阅报告的工作量。

如果你已经明确了研究主题,但无法框定研究范围或最重要的子维度,那么还可以使用“迭代”的方式进行:

先不进入“深度研究”功能,而是同时问几个手头最强大的 AI :

“关于拟定的研究主题或要解决的问题,有哪些子主题需要重点考虑”;

或是“这个问题可以拆解为哪些子问题或子维度分析?

然后再从 AI 的回答中挑出你认为的最重要的几个主要,确定研究范围。

这里放一个用于进行调研的提示词模板:

你是一名严谨的深度研究助理,擅长多源文献检索、数据分析与批判性阅读。
目标:在遵循“证据分级—交叉验证—透明溯源”框架下,生成高可信度研究报告。

一、研究主题  
{研究主题:一句话说明}

二、已拆解子主题  
1. {子主题1}  
2. {子主题2}  
…  
N. {子主题N}

三、任务要求  
1. **逐一深研**:对每个子主题输出以下五项(使用 H3 标题)  
   a. 核心问题(≤40 字)  
   b. 关键发现与结论(条列,每条后标 [证据编号])  
   c. 主要证据清单:来源、类型、可信度等级〈A 同行评议 / B 官方白皮书 / C 权威媒体 / D 博客〉  
   d. 数据或观点冲突及解释  
   e. 待解决知识空白 + 下一步建议  
2. **综合洞察**:在报告末尾用 H2「跨主题洞察」总结共性趋势、潜在联系与影响(≥300 字)。  
3. **证据地图**:附一张 Markdown 表或思维导图,展示「论点↔证据」对应关系,注明证据等级。  
4. **参考文献**:完整列 DOI / URL;无法确认的内容用 “(需进一步核实)” 标注。  
5. **输出格式**:全篇 Markdown;善用表格、列表;正文中文撰写,必要术语保留原文括注。  

四、检索策略提示  
- 时间窗:优先引用最近 {时间范围,如 “3 年内”} 的文献;经典必引可放宽。  
- 语种:中英文并重;缺乏中文材料时可提供英文原文并附中文要点。  
- 数据类型:覆盖学术论文、行业报告、专利/法规、结构化统计数据库、案例访谈。  
- 冲突处理:若多来源结论不一致,请标出差异、评估可信度并给出解释。  

五、写作原则  
- 保持客观中立;避免生成虚假引文。  
- 信息不足时先提问,不要臆断。  
- 逻辑清晰,层级分明,便于直接纳入我的研究档案。  

请确认无遗漏后开始调研;如需补充信息,先向我提问。

一个务实的建议是,针对同一主题的 DeepResearch 报告不宜超过 3 份,因为每份研究报告输出的内容在 10-30 页之间,阅读和核实的工作量很大,而且会有大量的重复信息,调研的边际价值也会递减。

如果你想启动 4 个以上的 DeepResearch,可以在汇总时以 1-2 个报告为主,剩下的作为补充。我一般使用一款深度模型(GPT-o3)和一款广度模型(Gemini 或 Kimi-K2),然后再使用另外一款(豆包或 Claude)作为补充。


3. 汇总互证

这一步目的是,将多个 DeepResearch 的结果汇总起来,形成一份相对完整的初步报告,并完成基础的事实交叉核对。

将提示词给到不同的 DeepResearch 之后,等待 10-30 分钟不等,就可以拿到 AI 的初步研究成果。

拿到结果之后,要对不同的结果进行汇总分析。对于我们框定的研究范围,不同的报告输出的焦点可能不一样,需要取长补短;不同报告的引用来源也不一样,需要对关键问题的引入来源去核实对比。

这里还有一个讨巧的方法就是,可以将不同 AI 的输出结果导出 markdown 或 PDF 文档,给到一个上下文窗口较大的 AI (比如 Gemini-2.5 Pro)作汇总总结。

但 AI 的总结并不一定符合你的要求,建议自己阅读,做汇总与核实。我很认同"human In The Loop"的理念,最终的决策权,信息核实等关键步骤,要掌控在自己手中,而不是交给 AI

到这一步,你应该有了一份你自己梳理的初步报告,以及关键证据的可信引用。


4. 抽丝剥茧

第 4 步的目标是,基于初步报告,进行深度分析,主动寻找逻辑断点、缺失前提和隐藏假设,从而发现更深层的问题。

有时 AI 可能漏掉了结论成立的前提条件,需要补充;

或是在梳理与形成报告的过程中,发现关键的证据链有缺失,需要进一步查证;

或是我们在开头框定的边界太小,遗漏了某个关键的问题,到这里才发现。

这个过程迫使提前思考可能反驳的证据,避免后期被质疑。

可以使用 GPT o3 、MiniMax M1 Agent 、Claude 等自带 Agent 能力的大模型进行核实,也可以使用元宝或豆包,在需要特定的中文信息源时使用。

对于这些问题的发现,很依赖我们上一步的梳理,这也是为什么在上一步,我建议自己梳理,而不直接交给 AI 的原因。

到这里,我们输出了一份全面、有完整证据链的调研分析报告,且经得起质疑和反驳。


5. 洞察补缺

这一步,是为了加强我们最终报告的可信度。只需要将报告大纲和主要结论发给 AI,问它:

关于我最终的结论,你还有哪些洞察,是我们未曾考虑到的?

相信我,这个问题,AI 会给你惊喜。



6. 凝练溯源

到这里,就是我们最终报告的形成了。

在这一步,综合所有经过验证和溯源的信息,撰写最终结论,并清晰地引用关键信息来源,确保结论的扎实与可信。

如果前几步做得足够扎实,那么这一步就是一个成果汇总的过程。


结语

在梳理整个使用 AI 进行深度研究的过程中,我清晰地感觉到, AI 已经将调查、研究的能力平等地赋予给了每一个普通人。

以前的调查研究需要大量的专业知识与分析方法论,需要经验和敏感度;而现在 AI 已经为我们提供了从“知识发现—证据验证—洞察生成”的完整工具。这是一个 60 分的人,可以借助 AI 迅速达到 100 分的时代

在具体的实践中,要谨记"human In The Loop" 的原则,把关键假设、最终裁决牢牢掌握在自己手中。AI 为我们提供了前所未有的广度与速度,而我们要有驾驭这种能力所需的深度与严谨

 


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询