微信扫码
添加专属顾问
我要投稿
Google AI Studio 带来视频和图片生成新体验,中文支持待提升。 核心内容: 1. AI Studio 新增多媒体生成功能:Veo2 和 Imagen 3.0 2. 支持多种生成方式:文字生成图片、视频等 3. 官方提供示例和提示词,优化中文体验
Google AI Studio 最近悄然新增了多媒体生成功能的支持,包括 Veo 2 用于生成视频,以及 Imagen 3.0 用于生成图片。这些功能涵盖了多种生成方式,如文字生成图片、文字生成视频,以及通过参考图片生成视频。
体验入口已经开放,用户可以通过以下链接尝试:https://aistudio.google.com/gen-media
官方还贴心地提供了多种风格的示例,供用户参考和使用
更多提示词:https://qianniucity.feishu.cn/wiki/JUMBwXdIiiZD8ck8LhxcwOz3n7d?from=from_copylink
用户可以输入提示词来生成所需的图片。例如:
The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone
{
"task": "Generate Product Description and Image Spec",
"product_name": "Handmade Ceramic Mug",
"key_selling_points": ["Unique Glaze Finish", "Ergonomic Handle", "Microwave Safe"],
"target_customer": "Artisan craft lovers",
"text_description_spec": {
"length": "Approx. 150 words",
"tone": "Warm and Craftsmanship-focused",
"structure": ["Highlight uniqueness", "Mention practicality", "Suggest usage scenarios"]
},
"image_spec": {
"number_of_images": 2,
"image_1": {
"subject": "The mug from the side, showing the glaze texture",
"style": "Natural lighting, focus on detail, soft background"
},
"image_2": {
"subject": "The mug being held, showing scale and handle feel",
"style": "Lifestyle shot, warm atmosphere"
}
}
}
视频生成支持文字生成视频,以及通过参考图片生成视频。用的是最新的 Veo 2 的模型,支持 16:9 的横屏和竖屏比例, 它最长支持 8 秒的视频生成。
Create a video with an image: a cute creature with snow leopard-like fur is walking in a winter forest.
⚠️需要注意的是,目前文生图对中文的支持还不够理想,常见的处理方式是将中文提示词转换成英文。
比如相同的提示词
英文:The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone
中文:图片风格为美食拍摄,一堆蓝莓掉入水中,慢慢沉入水中,水果周围都是水泡,带一片叶子,让人开胃的色调
此外,对于 Veo 2 的视频生成功能,用户在 AI Studio 中可以享受有限的免费测试配额。如果需要生成超出免费限额的视频,或将 Veo 2 集成到自己的项目中,可以通过 Gemini API 实现。(Imagen 3.0 的文生成图也一样)
Google 最近推出的一系列新功能,无论是编程还是多媒体生成,对创作者或者开发者来说,都充满了吸引力。赶紧用起来吧!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-11
AI提效99.5%!英国政府联手 Gemini,破解城市规划审批困局
2025-06-10
多模态 RAG VS 传统文本 RAG ,到底效果如何,从应用视角来测试下
2025-06-10
实战复盘 | 基于视觉模型的多模态 RAG 系统,我们踩过的坑与收获 (项目已开源)
2025-06-05
多模态模型在RagFlow中的应用
2025-06-04
清华首创多模态+知识图谱+RAG,问答精准度超 94%
2025-05-30
Deepseek 多模态来解析图片,结合上下文分析pdf文档
2025-05-28
Lovart再次证明:AI不是卖工具而是卖成果
2025-05-27
Dolphin-API:字节Dolphin多模态文档解析模型API化全攻略
2025-05-14
2025-03-26
2025-03-21
2025-04-27
2025-05-16
2025-04-28
2025-04-05
2025-05-08
2025-05-13
2025-05-15