微信扫码
添加专属顾问
我要投稿
探索设计领域的革命性突破,Lovart引领设计Agent新时代。 核心内容: 1. Lovart:全球首个专业设计Agent的内测体验 2. 全链路设计和执行:一句话完成创意到成品的转变 3. 图像、视频、音乐自由调度:集成前沿AI模型的一体化设计工具
最近一直在内测一款令人惊艳的 Agent 产品,今天总算官宣了。
它叫 Lovart,是世界上第一个专业设计 Agent。
在 GPT 4o 生图功能上线之后,文生图领域便进入了新的时代。
文生图模型的重大进步,也为设计工具的 Agent 化提供了全新的可能。
那设计 Agent 到底是什么?
让我们来看一段官方视频,感受一下:
以前的文生图工具,它们所提供的任务是“生成图片”这一环。
而设计 Agent,则像一位“设计执行官”,覆盖从创意拆解到专业交付的整个视觉流程。
从意图拆解 → 任务链 → 最后成品,一句话全搞定。
单次可以执行上百步,最多可以一次产出40张设计成品图。
比如,我可以让它根据我家猫的照片做一套银渐层表情包,它会自己设计表情,挨个生图,还可以全部编辑,一键做出所有表情包的黑底渐变色版本。
Prompt:
Use the cat in this picture as a template to design a set of 12 silver gradient emoji packs. Style 3D cartoon, to express the most popular and trendy emoji this year.
再比如,为宣传智能家居扬声器的 30 秒视频广告创建一个 6 帧故事板。
它会先根据需求,写出故事,然后开始进行角色设计。
完成之后,会进行关键场景的设计。
在最后把场景填充到故事板里,为每个画面配上光线、摄影机移动等信息。
Prompt:
Create a 6-frame storyboard for a 30-second video ad promoting a smart home speaker.
Scene progression:
Modern living room, family interacting
Voice command to the speaker
Music starts playing
Speaker answers a question
Lighting adjusts automatically
Close-up of product and brand tagline
Style: clean, semi-realistic illustration, soft light.
只有具备了充足的工具箱,Agent 才能更全面地完成任务。
Lovart 集成了一系列前沿的 AI 模型,比如 GPT image-1, Flux pro, OpenAI-o3, Gemini Imagen 3, Kling AI, Tripo AI, Suno AI等。
设计师可以在一个统一的界面内完成设计、编辑与生成,再也不必在多个软件和模型之间来回切换。
我让它设计一个 "VIVIDPIX "的新生活科技品牌,并创建跨媒体发布活动。
它不仅设计了logo、海报、周边,还用可灵制作了3D版本的logo动画,用suno制作了bgm。
由于所有的模型都拥有相同的 Context 上下文,配合起来丝滑无缝。
Prompt:
Prompt:
Create a cross-media launch campaign for a new lifestyle tech brand called “VIVIDPIX”.
Visuals: Design two main brand posters in different styles (futuristic minimalism and playful retro), including editable text layers and logo integration.
Video/3D: Generate a dynamic 10-second video loop of the brand logo morphing in 3D space, with smooth, modern animation, suitable for website and social sharing. Leverage Kling or equivalent video/animation AI tools.
Music: Compose an original 15-second catchy theme music that matches the brand’s energetic and optimistic tone. Use Suno or other advanced AI music models.
Packaging: Output a box and product mockup, harmonizing visuals across all touchpoints.
Canvas: Bring all assets together onto a single editable Lovart canvas, allowing for integrated fine-tuning and end-to-end brand asset delivery.
All elements—visuals, video, music, packaging—should have a cohesive color palette and brand personality, and be ready to use for a multi-platform product launch.
在海报的生成中,最大的痛点是文字后期的编辑,Lovart 很好地解决了这一痛点。
举例来说,我这里要为一种新的植物蛋白饮料设计一张宣传海报。
一分钟后,它就生成了左侧的标准海报,同时在右侧附上了图文分离的版本。
现在我可以自由修改文字的内容、大小、颜色,真的太方便了。
Prompt:
Design a promotional poster for a new plant-based protein drink.
Style: vibrant and energetic, modern editorial layout.
Color palette: green, cream, and orange.
Text: “Fuel Your Day, Naturally”.
Aspect ratio: 3:4, for Instagram feed.
Include editable text layers.
在使用 Lovart 的过程中也发现了一些小心得,在这里分享给大家:
Lovart 的出现,代表 AI 在设计领域的角色,正在从单纯的“图像生成器”向更深层次的“设计执行官”转变。
它试图解决的,不仅仅是“画出一张图”,更是“完成一个设计任务”的问题。
有人曾问我,4o 生图的出现是否会干掉图像的工作流。
当 AI Agent 开始尝试理解并执行更复杂的设计流程时,
我们与 AI ,也将迎来全新的协作方式。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-23
Dify v1.4.0中的Multi-Modal LLM Output:基本操作和原理
2025-06-19
搜索 ≠ 简单匹配!0代码实现语义级图文互搜
2025-06-11
AI提效99.5%!英国政府联手 Gemini,破解城市规划审批困局
2025-06-10
多模态 RAG VS 传统文本 RAG ,到底效果如何,从应用视角来测试下
2025-06-10
实战复盘 | 基于视觉模型的多模态 RAG 系统,我们踩过的坑与收获 (项目已开源)
2025-06-05
多模态模型在RagFlow中的应用
2025-06-04
清华首创多模态+知识图谱+RAG,问答精准度超 94%
2025-05-30
Deepseek 多模态来解析图片,结合上下文分析pdf文档
2025-05-14
2025-04-27
2025-04-28
2025-05-16
2025-04-05
2025-05-08
2025-05-16
2025-05-13
2025-05-15
2025-05-25