微信扫码
添加专属顾问
我要投稿
Google AI Studio 带来视频和图片生成新体验,中文支持待提升。 核心内容: 1. AI Studio 新增多媒体生成功能:Veo2 和 Imagen 3.0 2. 支持多种生成方式:文字生成图片、视频等 3. 官方提供示例和提示词,优化中文体验
Google AI Studio 最近悄然新增了多媒体生成功能的支持,包括 Veo 2 用于生成视频,以及 Imagen 3.0 用于生成图片。这些功能涵盖了多种生成方式,如文字生成图片、文字生成视频,以及通过参考图片生成视频。
体验入口已经开放,用户可以通过以下链接尝试:https://aistudio.google.com/gen-media
官方还贴心地提供了多种风格的示例,供用户参考和使用
更多提示词:https://qianniucity.feishu.cn/wiki/JUMBwXdIiiZD8ck8LhxcwOz3n7d?from=from_copylink
用户可以输入提示词来生成所需的图片。例如:
The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone
{
"task": "Generate Product Description and Image Spec",
"product_name": "Handmade Ceramic Mug",
"key_selling_points": ["Unique Glaze Finish", "Ergonomic Handle", "Microwave Safe"],
"target_customer": "Artisan craft lovers",
"text_description_spec": {
"length": "Approx. 150 words",
"tone": "Warm and Craftsmanship-focused",
"structure": ["Highlight uniqueness", "Mention practicality", "Suggest usage scenarios"]
},
"image_spec": {
"number_of_images": 2,
"image_1": {
"subject": "The mug from the side, showing the glaze texture",
"style": "Natural lighting, focus on detail, soft background"
},
"image_2": {
"subject": "The mug being held, showing scale and handle feel",
"style": "Lifestyle shot, warm atmosphere"
}
}
}
视频生成支持文字生成视频,以及通过参考图片生成视频。用的是最新的 Veo 2 的模型,支持 16:9 的横屏和竖屏比例, 它最长支持 8 秒的视频生成。
Create a video with an image: a cute creature with snow leopard-like fur is walking in a winter forest.
⚠️需要注意的是,目前文生图对中文的支持还不够理想,常见的处理方式是将中文提示词转换成英文。
比如相同的提示词
英文:The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone
中文:图片风格为美食拍摄,一堆蓝莓掉入水中,慢慢沉入水中,水果周围都是水泡,带一片叶子,让人开胃的色调
此外,对于 Veo 2 的视频生成功能,用户在 AI Studio 中可以享受有限的免费测试配额。如果需要生成超出免费限额的视频,或将 Veo 2 集成到自己的项目中,可以通过 Gemini API 实现。(Imagen 3.0 的文生成图也一样)
Google 最近推出的一系列新功能,无论是编程还是多媒体生成,对创作者或者开发者来说,都充满了吸引力。赶紧用起来吧!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-16
万字长文:OCR/多模态大模型评测体系全景
2025-05-16
ollama 大版本0.7 发布,新引擎支持多模态模型
2025-05-15
退订即梦、可灵、Vidu、Mj,只因我有了Lovart
2025-05-15
全球首款设计Agent,Lovart在海外大火,马斯克亲自点赞
2025-05-14
破解RL训练崩溃难题,快手联合中科院、清华、南大提出多模态奖励模型R1-Reward!
2025-05-14
深度体验 Lovart:这才是AI Design Agent!设计领域终于迎来了它们的「神」
2025-05-13
看见设计的未来:Lovart 全球首个设计 Agent 体验
2025-05-13
什么是基于知识图谱的多模态推理?
2024-09-12
2024-06-14
2024-06-17
2024-08-06
2024-08-30
2024-05-30
2024-11-28
2024-10-07
2024-10-16
2024-04-21