微信扫码
添加专属顾问
我要投稿
探索设计领域的革命性突破,Lovart引领设计Agent新时代。核心内容:1. Lovart:全球首个专业设计Agent的内测体验2. 全链路设计和执行:一句话完成创意到成品的转变3. 图像、视频、音乐自由调度:集成前沿AI模型的一体化设计工具
最近一直在内测一款令人惊艳的 Agent 产品,今天总算官宣了。
它叫 Lovart,是世界上第一个专业设计 Agent。
在 GPT 4o 生图功能上线之后,文生图领域便进入了新的时代。
文生图模型的重大进步,也为设计工具的 Agent 化提供了全新的可能。
那设计 Agent 到底是什么?
让我们来看一段官方视频,感受一下:
以前的文生图工具,它们所提供的任务是“生成图片”这一环。
而设计 Agent,则像一位“设计执行官”,覆盖从创意拆解到专业交付的整个视觉流程。
从意图拆解 → 任务链 → 最后成品,一句话全搞定。
单次可以执行上百步,最多可以一次产出40张设计成品图。
比如,我可以让它根据我家猫的照片做一套银渐层表情包,它会自己设计表情,挨个生图,还可以全部编辑,一键做出所有表情包的黑底渐变色版本。
Prompt:
Use the cat in this picture as a template to design a set of 12 silver gradient emoji packs. Style 3D cartoon, to express the most popular and trendy emoji this year.
再比如,为宣传智能家居扬声器的 30 秒视频广告创建一个 6 帧故事板。
它会先根据需求,写出故事,然后开始进行角色设计。
完成之后,会进行关键场景的设计。
在最后把场景填充到故事板里,为每个画面配上光线、摄影机移动等信息。
Prompt:
Create a 6-frame storyboard for a 30-second video ad promoting a smart home speaker.
Scene progression:
Modern living room, family interacting
Voice command to the speaker
Music starts playing
Speaker answers a question
Lighting adjusts automatically
Close-up of product and brand tagline
Style: clean, semi-realistic illustration, soft light.
只有具备了充足的工具箱,Agent 才能更全面地完成任务。
Lovart 集成了一系列前沿的 AI 模型,比如 GPT image-1, Flux pro, OpenAI-o3, Gemini Imagen 3, Kling AI, Tripo AI, Suno AI等。
设计师可以在一个统一的界面内完成设计、编辑与生成,再也不必在多个软件和模型之间来回切换。
我让它设计一个 "VIVIDPIX "的新生活科技品牌,并创建跨媒体发布活动。
它不仅设计了logo、海报、周边,还用可灵制作了3D版本的logo动画,用suno制作了bgm。
由于所有的模型都拥有相同的 Context 上下文,配合起来丝滑无缝。
Prompt:
Prompt:
Create a cross-media launch campaign for a new lifestyle tech brand called “VIVIDPIX”.
Visuals: Design two main brand posters in different styles (futuristic minimalism and playful retro), including editable text layers and logo integration.
Video/3D: Generate a dynamic 10-second video loop of the brand logo morphing in 3D space, with smooth, modern animation, suitable for website and social sharing. Leverage Kling or equivalent video/animation AI tools.
Music: Compose an original 15-second catchy theme music that matches the brand’s energetic and optimistic tone. Use Suno or other advanced AI music models.
Packaging: Output a box and product mockup, harmonizing visuals across all touchpoints.
Canvas: Bring all assets together onto a single editable Lovart canvas, allowing for integrated fine-tuning and end-to-end brand asset delivery.
All elements—visuals, video, music, packaging—should have a cohesive color palette and brand personality, and be ready to use for a multi-platform product launch.
在海报的生成中,最大的痛点是文字后期的编辑,Lovart 很好地解决了这一痛点。
举例来说,我这里要为一种新的植物蛋白饮料设计一张宣传海报。
一分钟后,它就生成了左侧的标准海报,同时在右侧附上了图文分离的版本。
现在我可以自由修改文字的内容、大小、颜色,真的太方便了。
Prompt:
Design a promotional poster for a new plant-based protein drink.
Style: vibrant and energetic, modern editorial layout.
Color palette: green, cream, and orange.
Text: “Fuel Your Day, Naturally”.
Aspect ratio: 3:4, for Instagram feed.
Include editable text layers.
在使用 Lovart 的过程中也发现了一些小心得,在这里分享给大家:
Lovart 的出现,代表 AI 在设计领域的角色,正在从单纯的“图像生成器”向更深层次的“设计执行官”转变。
它试图解决的,不仅仅是“画出一张图”,更是“完成一个设计任务”的问题。
有人曾问我,4o 生图的出现是否会干掉图像的工作流。
当 AI Agent 开始尝试理解并执行更复杂的设计流程时,
我们与 AI ,也将迎来全新的协作方式。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-13
什么是基于知识图谱的多模态推理?
2025-05-12
让Dify知识库“看懂”图片!一款MinerU 工作流解决方案
2025-05-09
Gemini API 集成 Imagen 3,带来更强大的图像生成功能
2025-05-08
Veo 2正式登陆Google AI Studio了——实在太疯狂了!
2025-05-07
Adobe首发多Agent、跨模态框架MDocAgent:复杂文档理解性能爆炸12%,错误率直降21%
2025-05-07
多模态文档检索开源方案-三大竞赛获奖方案技术链路
2025-05-07
多模态 GraphRAG 初探:文档智能+知识图谱+大模型结合范式
2025-05-05
推翻传统RAG,腾讯用生成式检索打开多模态新局面
2024-09-12
2024-06-14
2024-06-17
2024-08-06
2024-08-30
2024-05-30
2024-11-28
2024-10-07
2024-10-16
2024-04-21