支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI Studio 新增 Veo2 和 Imagen3.0 生成功能,中文支持有待优化

发布日期:2025-05-18 01:17:04 浏览次数: 1521 作者:二师兄说AI
推荐语

Google AI Studio 带来视频和图片生成新体验,中文支持待提升。

核心内容:
1. AI Studio 新增多媒体生成功能:Veo2 和 Imagen 3.0
2. 支持多种生成方式:文字生成图片、视频等
3. 官方提供示例和提示词,优化中文体验

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

 

Google AI Studio 最近悄然新增了多媒体生成功能的支持,包括 Veo 2 用于生成视频,以及 Imagen 3.0 用于生成图片。这些功能涵盖了多种生成方式,如文字生成图片、文字生成视频,以及通过参考图片生成视频。

官网截图

体验入口已经开放,用户可以通过以下链接尝试:https://aistudio.google.com/gen-media

官方还贴心地提供了多种风格的示例,供用户参考和使用

更多提示词https://qianniucity.feishu.cn/wiki/JUMBwXdIiiZD8ck8LhxcwOz3n7d?from=from_copylink

官网截图

用户可以输入提示词来生成所需的图片。例如:

The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone

{
  "task": "Generate Product Description and Image Spec",
  "product_name": "Handmade Ceramic Mug",
  "key_selling_points": ["Unique Glaze Finish", "Ergonomic Handle", "Microwave Safe"],
  "target_customer": "Artisan craft lovers",
  "text_description_spec": {
    "length": "Approx. 150 words",
    "tone": "Warm and Craftsmanship-focused",
    "structure": ["Highlight uniqueness", "Mention practicality", "Suggest usage scenarios"]
  },
  "image_spec": {
    "number_of_images": 2,
    "image_1": {
      "subject": "The mug from the side, showing the glaze texture",
      "style": "Natural lighting, focus on detail, soft background"
    },
    "image_2": {
      "subject": "The mug being held, showing scale and handle feel",
      "style": "Lifestyle shot, warm atmosphere"
    }
  }
}
cup

视频生成支持文字生成视频,以及通过参考图片生成视频。用的是最新的 Veo 2 的模型,支持 16:9 的横屏和竖屏比例, 它最长支持 8 秒的视频生成

官网截图

Create a video with an image: a cute creature with snow leopard-like fur is walking in a winter forest.

⚠️需要注意的是,目前文生图对中文的支持还不够理想,常见的处理方式是将中文提示词转换成英文。
比如相同的提示词

英文:The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone

中文:图片风格为美食拍摄,一堆蓝莓掉入水中,慢慢沉入水中,水果周围都是水泡,带一片叶子,让人开胃的色调 
中文提示词效果
英文提示词效果

此外,对于 Veo 2 的视频生成功能,用户在 AI Studio 中可以享受有限的免费测试配额。如果需要生成超出免费限额的视频,或将 Veo 2 集成到自己的项目中,可以通过 Gemini API 实现。(Imagen 3.0 的文生成图也一样)

官网截图

Google 最近推出的一系列新功能,无论是编程还是多媒体生成,对创作者或者开发者来说,都充满了吸引力。赶紧用起来吧!

 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询