支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我用扣子空间做出超拟人播客Agent,有意思比有意义更有意义

发布日期:2025-05-28 20:21:17 浏览次数: 1550 作者:卡尔的AI沃茨
推荐语

探索AI播客新境界,体验超拟人播客Agent的魅力!

核心内容:
1. AI播客Agent扣子空间与NotebookLM生成播客的比较
2. 播客内容与声线对听众的吸引力分析
3. 扣子空间播客生成功能的实际应用与效果展示

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家


上面两篇播客是只基于我写的 claude4 文章,运行几分钟后生成的AI播客,猜猜哪个是NotebookLM,哪个是扣子空间

作为一个(曾经的)播客爱好者,毕竟现在一个月只听十几小时了,大大小小订阅了50多个优秀的播客,但今天收到四月回顾的时候,发现我主动收藏的播客几乎不会听了。。。

因为长期追踪一线的AI消息,很多时候播客里的信息对我来说是已经重复了。我的日常行为提醒我,我最近更愿意花时间看文字,也愿意花几个小时看人文相关的记录片(@食贫道太好看啦),

四月份几乎没有科技类播客出现在我的月记

所以我决定重新来挑挑什么样的内容能吸引我!

我一开始是想讲我听的播客类型按照时长分成10分钟、1小时内、1小时以上的,但仔细想想,现在很多播客都有show notes,听起来不太需要做笔记,也不要求一次听完全部。这样的分类有点不太合理。

所以我将喜欢的播客很极端的分开两类:内容 & 声线.

没错,

内容足够干可以让我无视其他条件,哪怕我耳机就剩1%的电,我都要先听听是怎么个事。声线这是我解释成为主持们对话的状态和自然的情感流露,哪怕一些我已经知道的知识,我也愿意再听一遍。

我收藏起来但还没听的部分播客

所以,AI播客们能满足这两个条件吗?

来听听看!

在内容上,扣子空间跟 NoteBookLM 的做法不太相同,NoteBookLM 整体页面切分为三块:

左侧收集信息,中间处理信息、右侧生成信息

扣子空间相当于作为一个带 MCP Server 的 Agent 前提下,新添加了生成播客的功能,更加通用。开头听到的,效果更好的第二个播客就是扣子空间生成的

读取(?链接)网页内容并生成播客
左侧是执行过程,右侧给出了网页形式的音频、字幕

顺带提一句:扣子空间(? space.coze.Cn)现在应该已经全量了,除了播客生成,还可以拿一些Manus的例子,像是报告生成、网页生成、代码生成等试试看。

好评的是,因为 MCP Serves, 扣子空间可以访问到的网页更多:

访问失败可以用截图方式浏览

而且输出的形式是带音频本体和字幕的网页,让分享变得更方便了。

? space.coze.Cn/s/N1wWxn_Dmr4/

我一开始听到扣子空间这个男声输出就感觉到强烈的熟悉感,大家可以去听听阎鹤祥老师摩托环游世界的播客,

这声音太像了,太地道了!

除了链接外,我还可以直接提个需求,给扣子空间自己去找:

我没看小米发布会,你帮我做个播客吧!

把 PDF 丢给扣子空间生成,

用 NoteBookLM 的话来说,

在AI的辅助下,通过对话的方式完成学习。

还可以将视频转成播客,比方说我这里就将一个时长是12分钟、教大家改简历的经验视频转成了播客:

我后续还尝试了十次左右,视频方面的信息主要是来源于字幕,而且可能因为上下文长度限制,生成的播客长度都在1-3分钟内。

虽然核心信息点被省略的不多,但是我可能会更希望,音频压缩的信息少一些,干货多一些。

至于生成时长,

目前 NotebookLM 通过提示语辅助可以接近1个小时,扣子空间应该是限制在了10分钟以内。

NotebookLM 本身的提示语和超长音频(可以到1小时)的提示语我整理好了,为了方便阅读,公众号发我播客就可以拿到了。

内容部分说完后,来到声线部分

目前来说,扣子空间是默认男女两个音色,默认设置下,生成的内容语气、语速、情感部分都会比 NoteBookLM 好不少。

有点缺点的是过于拟人了,

聊到一些高光点的时候,主持们会抢话,主持A没有完全聊完的时候,主持B就插话了。

还有一个我期待在后续更新能看到的功能是可以主动限制主持人的回答长度,目前来说单次聊的句子稍微比较短。乐趣是足够了,深度我想再加点。

最后,我尝试用@宝玉老师反推出来的 NotebookLM 提示语,在扣子空间复现一下,

提升的效果还是有点惊喜的,相当于给扣子空间多加了一种播客风格,

信息源相同的前提下,生成时长更长,主持人观点输出更加清晰,同时语速也会稍微慢一点。我很喜欢。


 写在最后 

最后的最后,我让扣子空间做了一版播客的发展历史,同样做成了播客,

冷知识,播客这个词“podcasting”是由2004年流行的苹果“iPod”和“broadcasting”组合而成。

设想一下,AI播客再过几年就可以达到现在AI写作的高度,

逼真的声音和情绪表达,

可能我们都分不清楚ai还是真人,

所以下一步是用AI来判断声音是不是AI吗?像AI论文查重那样?

我觉得是也不是。

作为一个播客听众,我也会问自己,

愿不愿意花时间去听一个AI播客?

我的想法是,不排斥,但至少让我知道我听的是AI。

毕竟,我知道自己听的是AI聊天就很酷,

但如果在我以为是真人的情况下被别人告知这是AI,

就会让我有点不安。

毕竟听播客嘛,就是想从声音和聊天中感知情绪和观点,感受到聊天时带来的随机性,

如果所有曾经专属于人的情感和表达都区分不出来了,

那我们和AI的区别

究竟是什么?

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询