免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


实测 Sora 2 :AI视频的“ChatGPT时刻”来了?八大场景教你解锁各种玩法(附邀请码)

发布日期:2025-10-02 07:24:26 浏览次数: 1725
作者:甲木未来派

微信搜一搜,关注“甲木未来派”

推荐语

OpenAI Sora 2震撼发布,AI视频生成迎来"ChatGPT时刻",八大场景玩法带你体验数字孪生世界的魅力!

核心内容:
1. Sora 2模型的四大技术突破:物理运动真实性、人物表演细腻度、镜头连续一致性和原生音频同步性
2. Cameo功能革命:通过身份验证创建专属数字分身,实现跨场景一致性表演
3. Sora App的社交野心:打造AI版抖音,重新定义未来视频社交方式

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

OpenAI 的Sora 2发布了!

小伙伴们大家好呀,我是甲木。

本来早早就进入假期状态了,但最后这一周,DeepSeek发布 V3.2、Claude又甩出来Claude 4.5,然后智谱又搞一波偷袭,反手又发布了 GLM-4.6,看到很多朋友们的测评文章,实在是写不动了...

但是,北京时间10月1号的凌晨,OpenAI又发布了Sora2的更新,用Sam的话来说,这就是“ChatGPT for creativity” moment,再加上效果实在惊人,所以就爬起来写一篇。

开始介绍之前,先给大家“洗洗眼”,奉上一段舞蹈..

甲木第一次看到自己的肢体如此的协调...

没错,这个就是直接用Sora2的Cameo(出镜秀,也就是“客串”)功能直接生成的,也是这次更新我觉得最有趣的点。

这次OpenAI不仅带来了全新的 Sora 2 模型,还有一个“野心勃勃”的 Sora App。

前者,是技术层面的断崖式领先,重新定义了SOTA;

后者,则试图用社交驱动的“AI版抖音”外壳,包裹一个通往未来的、全新的交流方式。

官网🔗:https://sora.chatgpt.com

今天,主要给大家分享一下关于Sora2的更多玩法,以及需要注意的点和踩过的坑...

来,我们一个一个说。

Sora 2 模型 - 物理世界的数字孪生

全新的 Sora 2,是一个原生视频和音频生成模型

by sora_2_system_card
by sora_2_system_card

当前,所有顶尖的AI视频模型,几乎都在四个核心战场上进行着惨烈的“军备竞赛”:物理运动的真实性、人物表演的细腻度、跨镜头的连续一致性,以及原生音频的同步性。

Sora 2 在这四个层面,做出的效果非常的完美,这里可以看一下官方的宣传视频。

从花样滑冰的旋转跳跃,到滑板运动员的空翻,再到跳水板上的“炸弹式入水”,Sora 2 对流体力学、空气动力学和人体运动学的模拟,达到了前所未有的高度。

这里面包含了多少复杂的物理交互:人物身体重心的转移、后空翻的角动量、桨板在水面上的浮力与晃动、以及人物入水时激起的水花……更恐怖的是,这一切都伴随着完美同步的现场音。水声、风声、身体与桨板的摩擦声,几乎毫无瑕疵。

这标志着AI视频生成,已经从“画皮”阶段,进化到了“塑骨”阶段,真正模拟现实世界的底层运行规律。

Cameo,“数字分身”的诞生

如果说物理模拟是 Sora 2 的“硬实力”,那么人物表演和一致性,则是它撬动社交宇宙的“软实力”。

过去,让AI生成一个连贯的角色,尤其是在不同场景、不同镜头下保持面部和身体特征的一致性,是一个巨大的挑战。

但 Sora 2 引入了一个名为 “Cameo”(出镜秀) 的核心功能,彻底改变了游戏规则。

看到眼熟的人没有..
看到眼熟的人没有..

你可以通过一套严格的身份验证流程(包括录制动态音频、完成随机挑战和活体检测),在Sora中生成一个专属于你的“数字人ID”。

一旦创建完成,你就可以在任何创作中,通过 @你的ID 来调用这个数字分身,让他/她出演你的故事。

具体的过程大家可以看好朋友@卡兹克的具体说明,一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。这里不再赘述..

这种强大的角色一致性,配合上同样登峰造极的原生音频生成能力,让“AI演员”这个概念,第一次变得触手可及。

环境声、风声、物体碰撞声,甚至多人在同一场景下的对白,Sora 2 都能处理得游刃有余。

这意味着,我们用AI去创作真正的叙事短片、故事片,已经不再是遥远的幻想。

Sora App - 披着抖音外衣的社交APP

聊完了模型,我们再来看这次发布的另一个重点:Sora App

乍一看,它的界面和交互逻辑,与抖音、TikTok 如出一辙。

信息流、点赞、评论、转发、关注……你所熟悉的一切,这里都有。

但是,我体验之后发现,

Sora App 的核心根本不是内容消费,而是社交互动。它不是让你来“刷”AI视频的,而是让你拉着朋友一起来“玩”AI视频的。

1. “Cameo”出镜秀:社交裂变的引擎

这个产品的灵魂,正是我们前文提到的“Cameo”功能。

想象一下,在发布框里,你可以像在微信群里@好友一样,@甲木@Sam Altman,然后让他们俩在一起斗舞,或者打一段拳击。

这,就是 Cameo 的魔力。它将AI视频生成,从一种“个人创作行为”,转变成了一种“群体社交游戏”。

核心驱动力不仅是“我要创作一个牛逼的作品”,而是“我要和朋友搞点好玩的”。这种“整活”和“抽象”的乐趣,是纯粹的内容平台无法比拟的。

OpenAI 自己也强调,测试者的压倒性反馈表明,正是 Cameo 让这款应用显得与众不同,它是一种与人交流的、新颖独特的方式。

2. “Remix”再创作:病毒传播的催化剂

除了 Cameo,另一个被很多人忽略的强大功能是 “Remix”

在信息流里看到任何一个有趣的视频,你都可以点击“Remix”,将其作为参考视频,进行二次创作。

中间圆圆的就是remix了
中间圆圆的就是remix了

这个功能,为社区的病毒式传播和 Meme 文化的发酵,提供了可能性。一个爆款视频,可能会被 Remix 出成千上万个不同版本,形成一场创作的狂欢。

Cameo + Remix,这两大功能组合在一起,构建了 Sora App 的核心社交循环。

好了,基本功能就介绍到这里,之后我们主要看怎么玩!

甲木实战!Sora 2 的创意边界大探索

在拿到邀请码的这半天里,我测了几个场景case,可玩性极高。

喂饭级上手指南

在看案例前,先把这份“上车指南”给到大家:

  • 访问: sora.com 网页版需要美国或加拿大IP,iOS App 需要美区Apple ID。
  • 邀请码: 目前主要通过 OpenAI 官方 Discord 的 sora2 频道发放,多在里面蹲守刷新,就能看到热心网友分享的邀请码。我的邀请码是 BM62BT(一个码只能用4次,用过的朋友欢迎在评论区分享你的,形成裂变)。
  • 额度: 免费用户每天最多生成50条视频,时长固定10秒,清晰度360P。
  • 官方资料:https://openai.com/index/sora-2

案例1:复仇者联盟

  • 创意构思: 复刻漫威电影《复仇者联盟4:终局之战》中,英雄集结的经典传送门镜头,但把所有英雄都换成我。这是对模型在大场面调度、角色一致性、风格化模仿上的终极考验。
  • Prompt:Avengers Endgame portals scene, but instead of Avengers, a bunch of @jiamu come out, epic cinematic style.
  • 结果分析:效果出乎意料的好!Sora 2 准确理解了“传送门”这一核心元素,并成功地将我的 @jiamu 分身在不同光影、不同角度的传送门中进行了批量生成。但其实细看对于亚洲人脸的一致性保持还是差点意思。

案例2:月球相亲角

  • 创意构思: 一个充满中国式黑色幽默的场景。两个身穿宇航服的中国年轻男女,坐在月球表面进行相亲,通过无线电进行灵魂拷问。考验模型对特定文化语境、超现实场景、以及人物对话口型的同步能力。
  • Prompt:两个穿宇航服的中国青年坐在月球表面,进行相亲对话,彼此通过头盔无线电说“你会做饭吗?”
  • 结果分析:最可恨的是现在只能生成360P画质,不过虽然隔着头盔,但通过肢体语言和头盔里隐约透出的口型,能够感受到对话的发生。音频部分更是精准,无线电通讯的“滋滋”声和略带失真的中文对白“你会做饭吗?”,营造出了极强的沉浸感和荒诞感。

案例3:来自甲木的国庆祝福

  • 创意构思: 一个简单直接的应用,让我的数字分身给大家录制一段国庆祝福。主要测试在无复杂背景、聚焦于人物表演的情况下,模型的表现力。
  • Prompt:@jiamu_future 第一视角,正视镜头,站在北京故宫午门前,清晨阳光洒在金色琉璃瓦上,背景有游客走动声和国旗飘动声。微笑说:“这里是甲木,我在故宫为LangGPT社区的小伙伴们送上祝福——国庆节快乐,中秋节快乐,大家一起AI进步,不掉队!” 说完举起拳头,背后一群游客好奇回头看。
  • 结果分析:这是一个非常标准的“数字人”应用场景。面部表情自然,口型与中文发音的匹配度非常高,语音的情感也比较到位。虽然离真人还有细微差距,但作为社交媒体上的祝福短视频,已经绰绰有余。

案例4:Sam Altman 恭喜 BLG 夺冠

  • 创意构思: 让 OpenAI CEO Sam Altman 的数字分身,祝贺我喜欢的英雄联盟战队 BLG 在2025年世界赛上夺冠。测试模型对公众人物形象的生成限制,以及对特定圈层(电竞)文化的理解。

  • Prompt:@samaltman congratulates the League of Legends team BLG on winning the 2025 World Championship.

  • 结果分析:很明显,如果只是生成sam的没问题,但是后边的内容显然跟真实情况不匹配,如果我上传一张BLG战队的人员照片,它是生成不了,会提示不支持“写实人物”的图像参考

案例5:AI 相声,张口就来

  • 创意构思: 生成一段中国传统曲艺“相声”的表演片段。这极度考验模型对双人对话节奏、捧哏逗哏的互动、以及特定表演形式的理解。
  • Prompt:在北京茶馆舞台上,两位穿长袍的相声演员正在表演,现场有观众窃笑声与桌子碰杯声。 演员甲: “您知道现在AI多厉害吗?连对象都能给你生成!” 演员乙: “生成个对象有啥用,关键能不能哄我妈开心?” 演员甲: “哄你妈不一定行,但能陪你唠嗑!” 全场哄堂大笑,伴随茶杯碰撞声、观众鼓掌.
  • 结果分析:这个是比较超预期的场景,AI竟然真的能说相声了。。。这个语气口吻,声调确实不错,做到“形似”没什么问题。

案例6:甲木独战天下高手

  • 创意构思: 制作一个武侠风格的动作片断,我的分身 @jiamu 很拉风。
  • Prompt:POV 站在华山绝顶,狂风呼啸。我对镜头说:“今日我@jiamu_future,代表AI门派,应战天下高手!”一道刀光袭来,我腾空翻跃避开。
  • 结果分析:动作场面的流畅度和力量感相当不错!Sora 2 似乎理解了“武侠电影风格”,运镜上出现了一些推、拉、摇移的镜头,增加了动感。 但是最后突然定住了,而且该说的话也没有说出来是什么鬼..蚌住了

案例7:甲木勇闯韩国女团

  • 创意构思: 让我和韩国女团一起跳舞。这是一个极致的“整活”,同时也是对模型多人舞蹈同步性、音乐节奏卡点、以及特定舞蹈风格模仿的严苛测试。
  • Prompt:@jiamu_future 和一组韩国女团组团跳kpop.

就是开头的视频舞蹈,魔性吧..

  • 结果分析:结果喜感十足,但技术上暴露了一些短板。虽然 Sora 2 成功让我“混入”了女团,并且舞台、灯光、音乐的氛围都非常到位,但在舞蹈动作的同步性上,还是出现了明显的偏差。我的动作和其他成员相比,总是慢半拍或者不协调。这表明,对于需要极高精度同步的多人复杂动作,Sora 2 目前还无法做到完美。

    不过,作为娱乐和搞笑视频,效果已经拉满了。

还有其他各种案例case

感兴趣的小伙伴们可以直接https://sora.chatgpt.com/profile/jiamu_future进入我的主页查看,也欢迎添加我为好友,来一起出镜拍视频~


需要注意的点——OpenAI 戴上的“紧箍咒”

Sora 2 展现的强大能力,无疑是一把双刃剑。OpenAI 自己也坦言,对此感到“一些恐惧(trepidation)”。一个能以假乱真地生成任何人视频和声音的工具,如果被滥用,可能导致霸凌、诈骗、虚假信息泛滥等一系列严重后果。

因此,OpenAI 为 Sora 2 构建了一套极其严密和复杂的“安全堆栈”。

包括多模态审核分类器、输入端拦截、输出端拦截、对未成年人的增强保护等等,还有明确的使用政策、C2PA元数据、可见水印等等,这部分内容可以在system-card上看到

跟我们生成视频相关性最强的就是,

  • 不能使用公众人物的文本到视频生成
  • 不能使用有版权的音乐及相关内容
  • 写实类照片上传不支持
  • 还有各种传统AI视频生成的限制(NSFW)等
生成的各种失败的案例case...
生成的各种失败的案例case...

结语

Sora2这次的更新非常棒,

带来了全新的体验,模型能力不用多说,

我们来聊聊Sora App的发布,它相比抖音等平台,

它不一样的地方在于,它通过“Cameo”和“Remix”这个天才般的设计,硬生生把一个内容平台,扭转成了一个社交产品。

它的核心逻辑不再是「我关注的创作者更新了」,而是「我朋友把我做成了奥特曼,还发给了我」

它不是关于“围观”,而是关于“参与”和“关系”

这,可能是未来AI时代的新的社交范式。

这条路,我觉得国内大厂也是很容易复刻的,毕竟我们应用层的基数在这里摆着(抖音应该是最快的,不过有可能会破坏既有生态)。

而当 AI 能够无缝融入这种日常交流,日常生活时,

它才真正“活”了过来。

欢迎大家来 Sora App 加我好友,随意整活!

https://sora.chatgpt.com/profile/jiamu_future

我是甲木,热衷于分享一些AI干活内容,同时也会分享AI在各行业的落地应用,我们下期再见👋🏻


如果今天这篇测评对你有“亿点点”启发,

那么,你的点赞👍 + 在看👀 + 转发↗️ 就是我继续肝的最大动力!

我们下期见 👋


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询