支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


哇塞!Chrome MCP + OpenAI Whisper = 播客秒变学习笔记

发布日期:2025-08-06 08:17:17 浏览次数: 1526
作者:AI 产品自由

微信搜一搜,关注“AI 产品自由”

推荐语

用Chrome MCP+Whisper打造零成本AI学习神器,播客转笔记从此全自动!

核心内容:
1. 超低成本解决方案:整合Chrome MCP与开源Whisper实现音频转文字
2. 全自动工作流演示:从音频下载到文本生成的完整操作链条
3. 实战案例解析:以热门播客为例展示AI处理效果与效率提升

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

哈喽呀!我是成峰!


上次我分享了那个 Chrome MCP 的小技巧之后

推荐!5分钟上手Chrome MCP,替代5个付费AI


后台有不少朋友问我同一个问题:“AI 怎么转译音频呢?”


Image


今天,我就把我的压箱底的个人工作流,完完整整地给大家跑一遍!


💡 🤔 所以…我为啥要折腾这个?


我的目的超级简单:用最少的钱(最好是不花钱!),搞一套完全属于我自己的、全自动的AI学习小宝库!


而核心秘方,就是这个公式:


Cursor(Claude Code、gemini) + Chrome MCP + 开源工具 = 爽到飞起的本地知识库


这套组合拳的优势:

✅ 成本最低:无需为多个平台付费

✅ 无限制:文件大小不受限

✅ 学习成本低:一站式处理,从下载到分析

✅ 用最强的模型:Claude/Gemini的文本理解和分析能力超强


🔄 工作流对比


想想以前,我们是怎么干活的:

吭哧吭哧找链接 → 打开下载器 → 上传到某个死贵的平台 → 等啊等…… → 下载稿子 → 最后还要自己手动整理到眼花……我的天!


再看看现在,我怎么“偷懒”的:

丢一句话给AI → 喝口水,然后拿到一篇完美的逐字稿!


是的,就这么简单。


🤯 等等!这听起来是不是超级复杂?


NO!NO!NO!


恰恰相反!这简直是我用过最“傻瓜”的流程了!


整个过程几乎都是AI自己在那儿忙活

我们呢?像个大老板一样,偶尔指挥一下就行了。


说真的,只要你会用Cursor,你就已经100%能上手了!



🚀 Talk is cheap, show me the code!


光说不练假把式!我们直接来个现场教学!


昨天我看到“42章经”有一期非常顶级的播客:《关于AI Infra的一切 | 对谈阶跃星辰联创朱亦博》,内容很干,我们今天就拿它演示。


第一步:一句话,启动一切


我打开我的AI工具,敲了下面这行字


用chrome mcp,@博客链接  找到这个页面的音频源,并下载


Image


然后……然后就没我啥事了!真的!AI自己就开始表演了!


1.找到音频源


AI 操控 Chrome MCP 插件,在网页的源代码里精准地找到了那个隐藏的音频文件地址。

Image


2. 自动下载

找到地址后,AI 自动匹配了最合适的下载命令,直接在后台开始下载。

Image


3.下载完成!

就一眨眼的功夫,一个56.4MB的高清音频文件,就乖乖地躺在我文件夹里了!

Image


第二步:召唤 Whisper !


音频有了,下一步就是见证 AI 神奇的时刻!


这里,我们请出我们的超级英雄:OpenAI 的 Whisper


你可以直接把它当成是“不要钱、随便用的通义听悟”!


它有啥优点?

免费!免费!还是免费! 重要的事情说三遍!

中文超溜! 识别率高到让你想给它磕一个!

超级贴心! 连标点符号都给你整得明明白白的!


Image


我们还是一样,当个甩手掌柜,给AI下个命令:

安装openai Whisper,并转录 @播客文件.mp4

(如果你是第一次用,AI会先帮你把环境装好,一次安装,终身使用)


然后你就能看到AI开始吭哧吭哧地干活啦,下载模型、解决问题……


Image


看着屏幕上滚动的代码,AI正在一个字一个字地把声音变成文字!

Image



第三步:还没完!让AI给咱划重点!


三万多字的稿子到手了!但是……谁有空看啊!


别急!我们的目标是“知识”,不是“文字”!所以,最后一步,当然是让AI帮我们“读书”啦!


我把稿子往AI面前一扔,问:

@转译文本  这个音频讲了什么
Image


AI“刷”的一下就读完了全文,然后把核心观点、关键信息、有趣细节,全都整理得漂漂亮亮地交给了我!

Image


这效率,简直了!


以上的一切,还有更进阶的玩法,做一个 文字版工作流 + 内容提示词。

如果你需要,可以在评论区告诉我!


🎉 看看我们的最终战利品!


走完这一套流程,我几乎没费什么力气,就收获了以下成果:


1. 一份高清原始音频 (想听随时听!)

2. 一份三万多字的完整逐字稿 (细节狂魔的福音!)

3. 一份AI划好的重点笔记 (节省了我至少2个小时!)

4. 一个可以随时搜索的知识卡片 (这才是无价之宝!)


而且哦,这套玩法不光能搞播客,像什么会议录音、上课视频、采访记录……统统都能搞定!



✨ 最后的最后,聊几句心里话


说实话,这套 Chrome MCP + Whisper + Claude 的“神仙组合”,可能不是那种点一下就行的“傻瓜”方案


但它绝对是目前我心中,性价比、自由度和专业性都拉到最满的顶级方案!


它意味着:


零成本:跟大多数付费订阅彻底说拜拜!

高效率:让AI去干重复的活,我们只负责创意和思考!

超安全:所有东西都在你自己的电脑里,再也不用担心隐私泄露!

无限可能:你甚至可以自己动手,DIY出更强大的自动化流程!


希望今天这个小小的(但超级强大的!)工作流,能让你的AI之旅变得更有趣一点点!



好啦,今天的分享就到这里啦!


如果你觉得有用的话,别忘了给我点赞、收藏、加关注!我们下期再见!


Chrome MCP 讨论组


讨论加群:


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询