微信扫码
添加专属顾问
我要投稿
分享嘉宾|宁鲲鹏 元空AI技术联合创始人
Web Agent自动化解决方案
02
北大Open Sora生成能力增强
目前非常火的项目视频生成( open Sora )。Open AI很早发布了Sora,虽然没有对外开放,但效果非常炸裂惊艳。我们团队希望用开源的力量复现出Sora,成为视觉版LLaMA。因为算力有限,希望以开源的方式让更多的算力进来,让Sora能力越来越强,这是团队的初衷。
比较标准的方案具体有三部分,第一部分是视频的压缩和解压,形象点来说在电脑上把所有视频压缩成zip 包,然后再进行解压。中间部分可以理解成 zip 包,只不过由编码方式来进编码,VAE是经典的模型,把原始视频输进去,能达到一分钟 720P 的重建Demo,压缩率目前可达到 256 倍,个人也认为,只要把信息压缩得足够多,生成效果会越好。这并不是用文本生成视频,这是重构,意味着把原视频输进去,通过压缩再解压,是否能还原。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-18
Amp 上下文管理完全指南:掌控对话,精准输出
2025-11-18
你以为在训练AI,其实是暴露你对自己业务的无知
2025-11-18
AI认知 | 99%的AI Agent项目会死于“伪需求”,用OSCAR模型,成为那幸存的1%。
2025-11-18
AI、游戏双驱动,腾讯「赚麻了」
2025-11-18
小米发布 MiMo-Audio:用 1 亿小时音频预训练打造“通用语音大模型”
2025-11-18
为什么 LLM 搞不定复杂任务?ReAct 与 Reflexion 技术综述
2025-11-18
LLM还不是世界操作系统:语言大模型的七个致命缺陷
2025-11-18
EI Search:生成式AI时代的知识探索新范式?
2025-08-21
2025-08-21
2025-10-02
2025-09-16
2025-09-19
2025-09-08
2025-09-17
2025-09-29
2025-10-26
2025-09-14
2025-11-18
2025-11-18
2025-11-17
2025-11-15
2025-11-14
2025-11-12
2025-11-10
2025-11-09