微信扫码
添加专属顾问
我要投稿
分享嘉宾|宁鲲鹏 元空AI技术联合创始人
Web Agent自动化解决方案
02
北大Open Sora生成能力增强
目前非常火的项目视频生成( open Sora )。Open AI很早发布了Sora,虽然没有对外开放,但效果非常炸裂惊艳。我们团队希望用开源的力量复现出Sora,成为视觉版LLaMA。因为算力有限,希望以开源的方式让更多的算力进来,让Sora能力越来越强,这是团队的初衷。
比较标准的方案具体有三部分,第一部分是视频的压缩和解压,形象点来说在电脑上把所有视频压缩成zip 包,然后再进行解压。中间部分可以理解成 zip 包,只不过由编码方式来进编码,VAE是经典的模型,把原始视频输进去,能达到一分钟 720P 的重建Demo,压缩率目前可达到 256 倍,个人也认为,只要把信息压缩得足够多,生成效果会越好。这并不是用文本生成视频,这是重构,意味着把原视频输进去,通过压缩再解压,是否能还原。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-18
AIOps探索:基于Coze和Jumpserver做运维智能体
2025-09-18
别再叫“聊天机器人”了:一个词,正悄悄拖慢你对 AI 的判断
2025-09-18
LLM 基础 Function Call 能力强化:从数据构建到 RLHF 的优化闭环
2025-09-18
当AI接管键盘,程序员的价值是什么?
2025-09-18
AI 引领的企业级智能分析架构演进与行业实践
2025-09-18
OpenAI 内部揭秘:我们如何使用 Codex
2025-09-18
Shopify分享了他们做Agent的万字踩坑经验
2025-09-18
不只是写代码:Qwen Code 如何规划、执行并验证软件工程任务
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-09-14
2025-09-14
2025-09-18
2025-09-18
2025-09-17
2025-09-17
2025-09-16
2025-09-14
2025-09-12
2025-09-11