支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI视频讲解类产品走红

发布日期:2025-07-04 19:27:35 浏览次数: 1529
作者:多知

微信搜一搜,关注“多知”

推荐语

AI视频正在重塑学习方式,让知识传递更生动直观,来看看这些创新产品如何改变教育场景。

核心内容:
1. AI视频在教育领域的应用现状与代表产品
2. Mootion等平台的技术实现与用户增长案例
3. 行业未来发展方向与工程优化需求

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

“AI视频在学习领域的应用才刚刚开始。”


来源|多知

作者|王上


只需点击一下按钮,AI就能将文字或者图片转化为视频,这已经在学习场景落地,且成为一个重要的创业方向。


如AI视频生成平台Mootion、斯坦福大学生们创办的VideoTutor、谷歌旗下的Sparkify、佛罗里达大学的初创公司Knowlify、法国专注于儿童和家庭娱乐的AI媒体公司Animaj以及中国初创公司北京波波熊科技旗下TalkingSpark……都切入了学习场景。


在“AI视频”产品的帮助下,知识以更直观、更个性化的视频形式呈现,更加生动、有趣。


A视频可以讲解知识、讲解题目、输出故事、输出概念等,不过,各家在切入点、定位上、功能上及底层技术上有一些差别。


多知获悉,Mootion最近获得了源码资本、创新工场等新一轮投资,其已经有200万注册用户,年化收入达到了100万美元。当前,Mootion主要用于社交媒体博主视频创作和教育工作者授课。阿联酋、沙特、阿曼等海湾国家的教育工作者会用Mootion生成教学视频,比如生成双语对话视频。


可以看到,在通用视频大模型快速狂飙之外,一部分AI视频产品进入到垂直场景,试图解决普通人在视频创作和学习方面的难题。


多个从业者告诉多知,AI视频在学习领域的应用才刚刚开始,基础性技术障碍已基本攻克,当前需要关注特定场景的适配性,更多需要的是工程上的优化与打磨。


(多知制图)

01

AI视频落地教育场景


聚焦AI视频的产品愈发多了起来,且受到了教育用户的关注。


最近,Mootion以口碑传播的方式在阿拉伯世界火了,在阿曼,有近3万名老师用来制作视频,从而更好地教英语、历史和科学。


王咏刚为Mootion创始人、CEO,他曾是创新工场AI工程院执行院长,也是人工智能与软件工程领域专家,曾担任谷歌主任工程师和高级技术经理,他于2022年底启动了Mootion项目;童超为Mootion联合创始人兼首席产品官,曾任360人工智能研究院产品及对外合作负责人。


在Mootion,户只要输入一句话,AI就会自动以导演的角色构思,编剧的角色制作脚本,动画师的角色制作分镜,然后剪辑师的身份进行剪辑,最后给到用户一个故事、画面、声音都完整的视频作品。


Mootion创始人王咏刚告诉多知:“我们一开始预设的是Social media博主做Faceless讲解或故事视频这个场景,后来推广时,自然而然进入了教育领域。目前,Mootion用户以social media博主为主,教育用户约20%。”


Mootion最初全球几个区域进行了推广,其中,在阿拉伯语的国家以口碑传播的方式广为人知。后来,Mootion调研得知,教师授课使用Mootion生成对话视频,是因为当地老师教英语时除了教材之外,其他资料匮乏。


大洋彼岸,最近,来自美国的AI视频讲解产品Knowlify获得了创业加速器Y Combinator 的支持,今年夏天,该公司将从美国东南部佛罗里达州迁往美国北部的旧金山。


Knowlify 是由佛罗里达大学的学生Ritvik Varada 、Ritam Rana、Arjun Talati和Jonathan Maynard共同创立的。该产品正将AI与故事讲述相结合,能在几秒钟内将任何材料、笔记或 PDF 文件转化为类似可汗学院风格的视频。这可以用于学习平台、大学和入职培训团队,旨在让学习变得更直观、更吸引人、更易获取。


Knowlify既可以to C——学生可以直接用来学习,获得个性化的学习;也可以to B———学校、教育培训或者企业培训可以使用。


不过,多知发现,目前Knowlify还不能直接使用,需要加入等候名单。


此前,多知报道过斯坦福大学生们创办的VideoTutor,由是留学生kai与斯坦福大学校友Nick和Jovan(毛靖文)等人创办,这是专门针对K12阶段开发的教育AI工具,一句话即可生成个人专属教学/讲解视频。


VideoTutor的愿景是让每个人都拥有自己专属的AI导师,改变学习方式。同样,VideoTutor既面向学生、家长、老师等C端用户,也面向学校、教育机构等企业级用户。


VideoTutor是从数学、物理等理科科目切入,其所生成的视频还原了线下老师讲课的场景,有动态的图形图表,还有清晰地语音讲解,还有文字板书,语言中文、英文等可以任意选择。



目前,VideoTutor已经开放使用,其正式上线一周即产生了近2万的讲解视频,其可视化的方式对于理科学习很有帮助。


从VideoTutor来看,其背后有AI编程工具、大模型、数学动画引擎,创始人Kai曾告诉多知,其最大的突破是解决了元素重叠和复杂动画渲染的问题,其视频流畅,讲解自然。


此前,多知还曾介绍过同样由斯坦福团队研发的AI教育工具Gatekeep,也可以一句话生成教学视频,不过,该产品已暂停更新。


多知还发现,谷歌也推出了可以生成教育视频的实验性产品Sparkify,它可以生成用户想要的科普视频,这种轻松有趣的方式比较适合低幼的小朋友们学习一些常识或者通用的知识以及百科等,满足他们的好奇心。


不过,Sparkify现在只有视频demo,用户使用需要加入等候名单,其产品定位和功能暂未可知。


最近,总部在伦敦和巴黎的Animaj公司融资8500万美元,该公司借助AI将部分动画制作流程自动化了,并通过AI生产与平台原生内容开发相结合的混合模式,将儿童IP转变为全球性、多格式特许经营权。


Animaj收购了多个数字IP,其中,2023年6月,Animaj接手西班牙经典动画《小P优优》 (Pocoyo ),该剧以其由斯蒂芬·弗莱配音的蓝衣小男孩而闻名。该动画片是寓教于乐的形式,结合“欢笑幽默”与“探索学习”,通过日常游戏引导儿童认知颜色、形状、数学等基础知识,并融入英语词汇教学。


多知还了解到,波波熊科技公司也正在研发AI视频产品TalkingSpark,此前其波波熊学伴AI工具是图文的方式生成百科类的只是文章,而今,TalkingSpark希望为视频领域或者学习领域带来视频解决方案。波波熊创始人刘宇龙告诉多知:“我们通过将复杂的制作流程交由 AI 处理,它将创作者从繁琐的技术束缚中解放出来,使创作者能够专注于创意的核心。”


针对教育场景,TalkingSpark希望可以帮助教师将复杂的历史事件(如古罗马的衰落)或抽象的科学概念(如人工智能的工作原理)转化为生动的影像教材。


可以看到,目前已经有一个非常明显的趋势,AI视频开始在教育领域有所应用。


自Sora出现之时,教育行业普遍认为,未来AI视频的成熟应用将对教育行业起到重大变革作用。刚刚一年半的时间,AI视频技术突飞猛进,垂直细分场景也有了更多可能性。


一个大背景是,这几年,视频逐渐成为了媒介的主流,同时,大模型到来后,视频生产端也在革新。


2025年,国内外厂商如OpenAI(Sora)、谷歌(Veo 3)、快手(可灵AI)、阿里(通义万相)等视频大模型竞相推出高性能模型,在视频时长、真实感、多模态融合(如音频同步)等方面取得突破,给应用层带来了巨大的机会。


另一方面如爱诗科技旗下的拍我AI(PixVerse)切入到细分场景,用户上传一张照片即可一键生成短视频,可用于娱乐、营销、电商、私域运营内容等场景。而Mootion、VideoTutor、Sparkify、Knowlify等产品可以应用于学习场景。


值得注意的是,在垂类场景,比如在严肃学习方面,有很强的Know-how,通用视频大模型还不足以完全解决问题,这也是垂类场景AI视频的价值所在。


当下,这些新兴的AI视频工具均可以生成学习类的视频或者讲解视频,降低制作成本和时间,并增强学习的趣味性。未来,还有望加入虚拟老师的讲解和个性化的互动。


02

工程优化还需持续改进


各家在底层逻辑和技术上有一些区别。


从切入点来看,Mootion、Animaj以及TalkingSpark并非是从教育场景切入的,而VideoTutor、Knowlify明确是针对K12群体,Sparkfiy也提到是面向教育场景。


从功能上来看,Mootion将电影制作流程自动化了,还提供了各个场景的模版,用户只要给出一句话即可快速生成一段两分钟以内的视频。


用Mootion生成视频大致可分为三步:第一,输⼊提示词,生成“故事板”;第二,系统对每个场景进⾏具体调整,如可选择字幕、⾳乐、配音或特效等;第三,视频自动合成并输出完整视频。


这背后涉及从构思到脚本到分镜到运镜到剪辑全流程,最终给到用户一个完整的音画同步的视频片段。


而VideoTutor和Knowlify也是一句话生成视频,但更偏向于用图文并茂的视频方式来讲解一个知识点或讲解一道题,跟秘塔的“今天学点啥”有类似之处,像PPT的视频化,目前几乎不涉及分镜头和运镜。


Sparkify目前看不到具体功能,看起来有分镜头和运镜,所涉及的教育场景看起来多元化,但更偏向科普。


总体而言,VideoTutor和Knowlify看起来比较偏理科问题的讲解,优势在于可视化且动态的图表,而Mootion、Animaj、Sparkify、TalkingSpark以及则倾向于文科类或者创意类的视频输出,比较考验打磨底层专业级的视频工作流。


值得注意的是,这些AI视频产品生成的产品都可以公开发表在平台上,用户可以直接拿来学习,有点像“知识版的抖音”。


Animaj则有更大的差异化:


在技术层面,Animaj开发了专有的GenAI制作工具,并利用数据驱动的洞察力,通过AI实现动画流程的自动化。该流程可加快制作速度、降低成本,并使用基于人工智能的“草图到姿势”预测和“中间运动”层来帮助保持动画的艺术品质。同时,保留每个角色独特的风格和基调。


在业务层面,Animaj的目标是希望收购国际IP并将其转化为全球特许经营权,扩大儿童IP的延展性。Animaj 的首席商务官 Gregory Dray 介绍,“独立工作室和创作者开发了大量儿童 IP,但这些 IP 的潜力尚未充分发挥。我们希望采用现代化、平台原生的方式,在不损害其创意 DNA 的情况下,在全球范围内推广这些品牌。”


不论是哪种形式的产品,在针对教育场景都需要更强的准确性和严谨性。目前来看,大部分AI视频产品在一致性和细节方面仍有待提高。


有用户提到,VideoTutor生成的视频对于数学问题理解起来确实直观,但是,在复杂问题上依然会有bug,或者生成的视频有线条锯齿。


有从业者发现,Sparkify视频定位暂未可知,看起来很多是给孩子科普用的,但脚本中有不少术语,这对于孩子来说理解起来困难。


刘宇龙告诉多知:“目前AI视频中会有一些和现实不符的错误,这是整个行业面临的问题。”


Mootion已经深入到教育场景之中,达到了可交付的水平,但在多知体验的过程中发现,目前Mootion暂时以插画短视频为主,也有些微bug,比如会出现角色形象不一致的情况。


王咏刚亦坦言Mootion还没有及格,但他对未来有信心,他在接受硅星人Pro访谈时提到,“如果我们不相信AI能从今天的50分,最终进化到80分甚至100分,今天99%的AI创业公司也都不要做了。”


值得一提的是,多知发现,Mootion对教育场景进行了细化,比如有双语故事、双语对话、历史启蒙、儿童科普、睡前故事、60秒传记、名人名言等模版。


从产品延展性来看,VideoTutor和Knowlify也会向文科方向演化,但最终目标或是AI老师,Mootion这类产品的场景则会更加多元,有望应用于广告营销、电影、动画等领域。


总而言之,视频输出更稳定、更流畅,甚至更准确,这是AI视频产品共同努力的方向。


值得注意的是,投资方的要求在提高,他们在严格筛选产品,更倾向于有高技术壁垒或者产品打磨得更完美的产品。


有投资人告诉多知:“80分的产品的溢价能力正逐步减弱,创业者需要把产品打磨到95分,很多产品背后有许多细节需要打磨。”


这意味着垂类的AI视频产品一方面在工程优化方面更为突出;一方面,需要在差异化路径上更具备独特性,找到真正的用户需求。


相关阅读:

独家对话斯坦福00后创业者:VideoTutor如何用生成式视频重构学习

谷歌放大招!教育科技有了自己的“抖音”?

儿童和家庭娱乐AI公司Animaj融资8500万美元,将AI用于动画制作流程

一本书、一篇文章直接变视频课程!秘塔科技推出“今天学点啥”


END

作者:王上

一本书洞察教育行业全貌,《教育科技这一年:教育+AI新纪元》火热销售中🔥🔥从业者必入,点击小程序购买

图片
扫码加入多知新书交流群,共同探讨教育+AI的未来

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询