免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

NotebookLM: 不就做个PPT,有什么难的

发布日期:2025-12-15 12:02:14 浏览次数: 1533
作者:小李老师的读书笔记

微信搜一搜,关注“小李老师的读书笔记”

推荐语

AI生成PPT的终极进化?Google NotebookLM或将颠覆传统办公方式。

核心内容:
1. 当前主流AI生成PPT工具的局限性分析
2. Google NotebookLM的技术突破与功能亮点
3. 智能办公软件对传统职场技能的冲击预测

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
AI生成PPT这项技能,在今年年初曾一度炙手可热,成为许多技术博主、培训师集中科普炫技的重点。不过,如果你尝试过用常见的AI工具,例如Kimi、WPS或者是豆包等等,来尝试制作一份用于严肃场合的PPT的话,就会发现它们的能力还远不如人们所期待的那样成熟。
这些工具生成PPT的过程基本上是这样的:用户可以提供一段简单的描述,但最好能给出一份文档,或者是大纲之类的文本材料,随后选择一套模板,AI就会接手后续的工作。它会生成完整的文本内容,再从网络上搜集一些图片,或者是自主生成一些图片,填充到模板里,交付给用户。最终形成的效果,基本上是一个“实习生”水准的作品。乍看起来中规中矩,但是细究起来存在大量的问题,比如文本基本上是单纯的罗列,缺乏条理和逻辑,图形也很少有和内容相契合的,整体风格机械套用模板,缺乏合理的优化。
Gemini 3 Pro问鼎Artificial Analysis Intelligence Index第一名宝座
不过,今年下半年,已经从中文互联网上消失15年的、一度被认为在AI产品的竞争中已经被OpenAI干趴的Google,连续输出了多个杀手级产品,先是文生图模型Nano Banana,凭借真实图片转换3D模型的应用在TikTok上实现了一波病毒性传播,随后是Gemini 3.0,一经推出直接干翻GPT5.1,问鼎最强自然语言模型的宝座;就在今年快要结束的时候,Google的AI笔记应用NotebookLM也迎来了更新,集成了Nano Banana和Gemini3.0的强大能力,终于开始显现出真正的「智能化」办公辅助软件的潜力。而生成PPT,作为它的一个附属能力,在先进模型的加持下,也正在接近甚至超越专业设计师的能力。照此看来,接下来职场中的「PPT高手」以及教授PPT制作的讲师们,怕是要遭受到字面意义上的「降维打击」了。
那么这个NotebookLM是何方神圣呢,顾名思义,这是一个笔记软件,Google对它的介绍是:NotebookLM is an AI-powered research assistant designed to help you refine and organize your ideas. 即一个AI驱动的用于帮助用户组织和完善思路的研究助手。
NotebookLM的主界面
听起来云山雾罩,不过当我们打开NotebookLM的界面时,就能一目了然地看出它的功能。我们可以在NotebookLM中创建一个个的Notebook,也就是「笔记」,而在进入某个Notebook之后,就会看到一个被划分了左、中、右三个区域的主界面。
界面的左侧叫做Sources,即「资源区」,在这里我们可以上传各种资料,包括文本、表格、音频、图片、等等,还可以引用外部的网页资源,以及Youtube上的视频资源。所有这些资源会形成一个「资源池」,或者更直观的理解,是一个专用的学习资料库。就像是我们平时在学习某方面的知识时,我们会搜集大量的各种形式的资料一样。只不过这一次,后续的学习将能够得到AI的助力。
NotebookLM能够引用多种形式的资源,至多可引用300份
界面的中间叫做Chat,即「交互区」,在这里我们可以发送指令,就像平时我们和AI对话时一样,只不过在这里,AI会在回答的时候严格参照用户构建的「资源池」。我们可以让AI对所有的资源进行一次梳理和总结,也可以向它提出问题,这些问题会用到资源池中的内容进行解答。如果在资源池中找不到答案,它会诚实的告知,而不是编造答案。
NotebookLM会严格依照给定材料生成答案,但会对文字表述进行优化
由于其依靠的Gemini 3 Pro模型拥有堪称恐怖的上下文窗口体量,每个Notebook至多能够引用300项资料,单个资料字数可高达50万字,也就说最多可以处理1.5亿字的资料,相当于138套哈利波特全集,或是200本红楼梦。
基于这样的能力,不单是个人用户,即便是小型的企业用户,或是专业的研究机构,也不需要再自主尝试构建一个基于本地模型的知识库、或是调试复杂的在线智能体了,而是可以直接运用大模型的强大算力,帮助自己快速构建一个更为高效、更易交流的专业助手。
这也是NotebookLM的核心能力,它能够「代替」用户完成对某一领域知识的学习,把自己变成一个该领域的「专家」,随时替用户解答问题。当然,也可以通过和用户的交互,让用户更快的学习到这一领域的核心知识,而不是在海量的文献中耗费时间。
界面的右侧叫做Studio,即「创作区」,这是NotebookLM的扩展功能,它提供了一组跨媒介的创作工具,用户可以在资料库的基础上,创作音频、视频、思维导图、研究报告、闪卡、问答、数据图表,以及社畜最爱的——PPT。
事实上,在NotebookLM强大的知识检索和数据挖掘能力的光芒之下,PPT生成这样的功能只能说是一个边缘功能。但是,在Nano Banana模型的助力之下,它所生成的PPT,仍几乎超越了当下所有的主流工具。唯一的遗憾是,在目前版本的NotebookLM中,生成的实际上是一组幻灯片形式的图片,并非可直接编辑的PPT文件。
NotebookLM生成的PPT封面,使用了一个有些失真的图片作为背景
虽说从封面图上看,这套PPT仍然有着些许的「AI味」,但是在正文页面中,我们能够真实感受到模型的强大能力。它不仅能够基于资料库精准地找到适合加入PPT的内容,还能够将其转换为适合PPT展示的关键词+短句的形式,并且生成适切的配图,几乎完全与文字内容相符合。至于版面排布涉字体设计等等,虽然缺少些创意,也在相当程度上符合平面设计的规范。
NotebookLM基于PPT的内容生成了许多贴切的配图
更令人惊讶的是,NotebookLM还能够基于资料中的相关数据,自主生成适当的数据图表,并且放置在PPT的合适位置。图表类型选择和绘图准确性在相当程度上符合我们的预期。
NotebookLM基于资料中的数据生成了数据图表
不仅如此,NotebookLM还能够实现以往只能够由人类创作者完成的工作,就是将文字内容以适当的图形化展示方式呈现出来。例如在介绍AI领域的初创公司数量和最终能够成功商业化的产品数量的惊人差距时,单纯用文字描述很难体现出这种差距的夸张程度,NotebookLM就“想到了”使用一个漏斗图的形式来传达这样的信息。
NotebookLM基于文字内容创作出的图形,已经接近人工设计的水平
目前NotebookLM能够支持包括中文在内的30种语言。不论是我们使用何种语言的原始资料来构建资料库,都可以使用中文来与之对话,获得中文结果。当然,也能够用中文创作PPT。只不过,在生成汉字时,仍然会有较小的概率出现一些字体问题。
NotebookLM生成的中文页面,图片表现仍然优秀,但中文字体有些许错误

回到本文的开头,在今年的年初,还有着许多的企业,正在尝试着去借助DeepSeek等开源大模型的东风,尽快构建属于自己的AI模型,实现从概念到生产力的转化;也有着许多的初创团队,将某一细分领域的专用AI模型构建,当做奋斗目标,试图在这一火热的市场中切分一块自己的份额。
但是站在当下这个时间点回头看,尝试着自主构建模型的企业,不论他们仍在努力的过程中,还是已经取得阶段性的成果,在通用大模型快速进化的背景下,似乎都不得不承认,他们已经无法从性能上接近任何一个通用大模型。甚至于需要接受,通用大模型在专业领域的能力表现上,也对专用模型形成了碾压之势。二者之间拉开差距的速度,甚至仍在增加。并且,相比于训练专用大模型所需的以千万计的资金投入,使用NotebookLM,就只需要2900日元的月费而已
类似于NotebookLM这样的工具,在可预期的未来,还会继续发生进化,还会出现竞争者,提供更优的表现。或许这预示着,新一次的工业革命真的正在发生的过程中。在前两次工业革命中,机器极大地拓展了人的体力劳动能力,同时也将仅凭借体力劳动生存的劳动者们压到了社会底层。在这一次工业革命中,机器将极大地拓展人的智慧劳动能力,相应的,也将挤占仅凭非创造性智慧技能生存的劳动者们,不论是“码农”,还是“PPT民工”,的生存空间。即便这样的挑战,还没有到来,但它离我们已经不再遥远了。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询