支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


纳米AI一句话成片功能实测:从文字到视频只需等待

发布日期:2025-07-07 21:15:30 浏览次数: 1542
作者:歸藏的AI工具箱

微信搜一搜,关注“歸藏的AI工具箱”

推荐语

一句话生成完整视频不再是梦!纳米AI的一句话成片功能让视频创作变得前所未有的简单高效。

核心内容:
1. 纳米AI一句话成片功能的实际测试效果展示
2. 从恐怖小说到吐槽视频的多样化生成案例
3. 视频生成流程的智能化与自动优化机制

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

大家好,我是歸藏(guizang),今天带来纳米 AI 超级搜索一句话成片功能的测试。


之前我测试纳米 AI 的 MCP 能力的时候看到有视频生成的 MCP 就提到过,要是可以直接自动生成完整的视频就好了。

最近他们终于开始好好搞这个流程,做了一个一句话成片的功能。

现在真的可以一句话生成完整视频了,而且成功率高的离谱,用来生成新闻介绍、科普视频、小说情节等都非常好用,发了提示词等一段时间回来收菜就行。


刚开始我没写提示词,直接找了一个恐怖小说的前两章让他基于这个生成视频,没想到生成的效果还挺好。

他自己基于小说生成的视频提示词也挺厉害,比如手表在虚空中的特效,非常详细的展示了作者拿到他金手指的效果,而且视频最后他还自己加上了诱导你看下一部分的钩子“让你猜主角能否改变自己的命运”。

这里看生成过程:https://bot.n.cn/share/mcp?id=mu4t17&from=pc&src=360_llq

帮我基于这个小说的情节生成一个三分钟的剧情视频:
第1章 、完美人生模拟器,窗外淅淅沥沥下着小雨。苏午望着窗外的雨线,默默地叹了口气,他的心情就像外面的天色一样沉郁。。。。


然后找了一个最近刷到的比较火爆的峨眉山猴子第一人称视角的视频,用 Gemini 分析视频发散创意后让纳米 AI 生成了一个类似的吐槽视频,先看结果:https://bot.n.cn/share/mcp?id=huljqj&from=pc&src=360_llq

首先把视频在 AI Studio 里面扔给 Gemini 2.5 Pro,然后让他对这个视频进行详细的分析。

帮我详细分析这个视频的内容,分析他爆火的原因,然后维持他的主角和说话方式帮我生成另外符合情景的视频创意

其实我可以让他直接根据视频输出新的创意,但他有可能偷懒,所以让他分析视频内容,就是在被动的让他整理视频方案的思维链。

可以看到他给了非常详细的每个场景的分析和总结,然后基于内容分析了爆火的原因,第三部分给出了多个相关的视频创意。

Image

这里我们直接把视频发给纳米 AI,开启深度研究后跟他说提示词就行:

Image

在收到提示词后他就开始分析你的提示词并且开始生成对应的分镜规划。

Image


然后就开始常规的视频生成流程:

  1. 1. 先是基于分镜里面的图片生成提示词生成图片
  2. 2. 然后生成口播音频,这时候他会找符合需求的音色
  3. 3. 再基于图片生成视频的提示词并且生成视频,
  4. 4. 增加字幕和寻找对应的音乐
  5. 5. 最后把所有的素材整合成一个完整的视频


这里面让我惊讶的点是两个:

  • 一个是他会检查输出结果进行反思,同时重新生成有问题的素材。
  • 第二个是这个视频是带包装的,比如有字幕,另外生成的图片还有一些文字的包装。

这两个操作让生成视频的成功率和视频的表现力都高了不少。

Image


然后我就按照上面的思路发散方式尝试让他复刻另一个最近比较火的 AI 视频,就是基于西游记背景的 Vlog 视角视频,而且师徒四人还不时说一些讽刺现代职场的话。

这里是结果:https://bot.n.cn/share/mcp?id=fopou6&from=pc&src=360_llq

这里因为目前还没有加多角色的语音匹配,所以统一是一个女声在说他们第一人称的话,但也还好不影响理解。

而且我发现他做这种 3D 画风的图片和视频风格是真的不错,跟整个视频戏谑、诙谐的风格很像。

而且上面说的他会在图片上生成类似视频包装的文案在这里也出现了,比如在介绍 Plan B 方案的时候直接在图片上加了这个文字,甚至直接会在视频上面生成“以诚待人”这种中文,很有意思。


说了这么多如何用纳米 AI 生成视频呢。

你可以在纳米 AI 超级搜索PC 版(bot.n.cn)上点击输入框的“深度搜索”开关,然后输入的提示词中带有“宣传片/纪录片/创意片/广告片/视频”这些词就行,AI 会自动判断意图调用对应的 Agent 工作流程。

或者在纳米 AI APP (https://www.n.cn/app输入问题之后,勾选“超级搜索”也行。


我在今年年初就跟朋友们说过,今年的主线一定是代码生成和多模态生成,多模态生成的最后一步就是完整视频的自动生成。

没想到这才七月,随着 LLM 工具调用能力的提高以及视频、音频模型的质量提升、成本下降,完整的视频生成 Agent 已经可以做到这个地步。

现在由于 Veo3 这种模型在国内还不能用,所以音效和语音还得占用 Agent 很长的上下文进行处理,等到国内的类似模型出来,视频 Agent 一定会直接爆发,但现在纳米 AI 毫无疑问已经准备好了。


如果觉得内容还行的话,可以给一个点赞👍喜欢🩷和转发✈️,谢谢各位了

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询