推荐语
扣子空间播客效果让人难以分辨真假,AI播客技术的新突破。
核心内容:
1. 扣子空间播客能力升级后的实际效果展示
2. 从公众号文章到播客的实操过程
3. 扣子空间播客功能的优点和不足分析
杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
昨天晚上,扣子官方学习交流群晒出了扣子空间播客能力全新升级的帖子,今天不妨来真实测试下效果怎么样。题外话说一句,AICX只说大实话,不当水军。最近看到不少文章,把一些新发布的通用智能体工具、新模型吹上天,我们实际使用后,效果真的不敢恭维。先看疗效,客观来说,扣子空间这个播客功能的实际效果还很惊艳的。第一次听,还真是很难区分出是AI生成的还是真人。以下是扣子空间生成的播客链接,可复制到浏览器中看到播客音频和逐字稿。https://space.coze.cn/s/xM9JWlQ16wA/
扣子空间是字节最近推出的一款通用智能体工具,和Manus功能类似。扣子是字节推出的可编排智能体开发平台,面向的是智能体开发人员。扣子空间是字节推出的一款通用智能体工具,可以理解是比传统大模型工具对话更高级的对话工具,扣子空间是面向终端用户,没有任何技术门槛。扣子的页面如下图所示:用来开发定制化的智能体,面向开发者,一般人用不到。扣子空间如下图所示,是通用智能体对话工具,面向终端用户,输入提示词就可以让他执行复杂任务。我们打开扣子空间后,不需要输入复杂的提示词,如下图所示,只需要把文章链接发给扣子空间,或者本地文档作为附件上传给扣子空间。然后在提示词中输入关键词:生成播客,扣子空间就可以自动化的识别内容,进行男生和女生播客逐字稿生成,然后生成声音逼真的播客音频,和配套的文字内容。本次案例我们使用的是AICX公众号发布的一篇文章:DeepSeek(一)" data-itemshowtype="0" linktype="text" data-linktype="2">AI简史:从图灵测试到Deepseek(一)我们仔细来观察下上面这张图片展示的扣子空间的执行过程。首先他经过思考后,打算用使用网页读取工具获取网页内容,但是提示失败了,于是他尝试使用浏览器工具获取网页的文本内容。使用网页读取工具获取网页内容失败,错误信息为网页访问失败,请稍后重试,接下来尝试使用浏览器工具获取网页的文本内容。最终扣子空间完成了网页内容的读取,并提取了文本。然后他使用了一个名为gen_podcast的工具来生成播客。已成功获取网页文本内容,接下来使用gen_podcast工具根据网页文本内容生成播客。我们看到,扣子空间先是生成了播客音频,然后生成了播客页面,最终完成任务交付。
而上文看到的播客音频和页面,就是扣子空间自动化生成的结果。第一,声音十分逼真,如果不仔细分辨,很难区分出是真人还是AI。第二,对话式的播客,AI自动进行问答拆分,并设计对话场景。第一,生成的内容不够全面,播客时间较短,内容并没有覆盖文章的全部关键信息。第二,对话文字的提取上,虽然声音的AI味很淡了,但是播放的内容听起来感觉深度不够。但综合来说,这个AI音频效果,已经是非常不错了,具备很好的应用场景。最近,AICX团队正在研究通用智能体,最大感触就是:通用智能体,真的可以帮人类干活了,从给建议,到直接给出端到端的高质量解决方案。通用智能体具备自主规划、工具调用、任务自动执行、一体化的成果输出等能力。今天分享的扣子空间的播客生成,就是一个很典型的案例。首先他自动选择了连接读取的工具,在第一种工具读取失败的情况下,自主切换到浏览器工具。链接内容获取成功后,他进行了文字提取,然后调用了播客生成工具,自主生成了音频内容,然后生成了文本内容,并设计了还不错的表现形式,最终给我们交付了一份完整的播客文档。这种工作模式,相比过去我们和大模型对话需要多轮提示词,多个AI工具切换相比,其效率和效果都有更加突出的表现。