我要投稿

提示词生成comfyui工作流来了! (英伟达整花活, 把comfyui的门槛打下来!

发布日期：2024-10-22 06:16:43 浏览次数： 3353

作者：WayToAGI Agent探索

微信搜一搜，关注“WayToAGI Agent探索”

在多次社区的Comfyui共学中发现, comfyui工作流的门槛确实过高. 让很多人理解“潜空间”, “Vae”, “LoRA”, “controlnet”等一系列概念非常困难, 更别说基于理解做一个工作流了.

这次英伟达整了个花活, 让大家看到了打破这个门槛的可能性: 通过画图提示词, 自动生成匹配的comfyUI工作流!

英伟达将其命名为ComfyGen (comfy生成器)! 当然目前仅支持文生图模型.

在英伟达发布的内容中, 他们称: “ComfyGen可以生成高质量的图并泛化到其他领域 (如下图). ”

并且他们很自豪的宣称:“下图这么优秀的图, 完全是comfyGen基于SDXL规模的模型画的, 还没有用flux呢!”

当然, 作为学术性研究论文, 肯定不会很草率的下结论.

英伟达团队做了对比测试:

下图中分别为

1) SDXL原生

2) 两个微调模型 (用过的同学会很熟悉

3) 两个人搭的工作流

4) 两个不同的comfyGen制作的图 (后文原理部分中会说明这两者的区别)

可以看到效果基本一致, 甚至确实更符合人类对提示词的判断和理解.

同时他们还做了和C站上人类写的提示词作对比:

很显然, ComfyGen的效果略胜一筹.

不过由于项目未开源, 无法体验实际效果. 但是如果真的效果如英伟达发布所说, 那是相当惊艳了.

原理

ComfyGen 基于大型语言模型（LLM)，为用户输入的特定提示词自动定制和优化生成Comfyui工作流。

工作流中会组合多个专门的组件，如改进的输入处理、精细的解码器和超分辨率模块，显著提高生成图像的质量和细节。

ComfyGen 的核心在于其能够根据用户的具体需求，选择最适合的工作流组件，从而实现更高质量和更精确对齐的图像输出。

ComfyGen-IC对比ComfyGen-FT

这里英伟达制作了一个表格, 表格里记录了工作流画图的分类, 并基于美学和人类偏好的预测给他们的结果打分. 让他们让LLM选择最能匹配新提示词并且得分最高的工作流.
训练时, 同样把表格中的得分, 提示词和工作流作为训练内容. 推理时, 依旧让LLM通过提示词和高得分来预测一个最合适的工作流.

这份研究为很多agent的开发带来了新的思路, 不仅局限于comfyui, 同时对LLM本身的工作流的自动生成也将产生深远的影响.

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-17

用 Claude AI 学会任何东西的 6 个万能提示词

2026-06-17

怎么写一份 Claude 真正能看懂的 DESIGN.md 文件？

2026-06-15

提示词工程已死，Loop Engineering来了！

2026-06-12

教你用 Codex 从 0 到 1 写一个 SKILL

2026-06-12

用Claude Code写PRD，我总结了这几条有用的经验！

2026-06-11

Anthropic 工程师：我不再写 Prompt 了，我写 Loop

2026-06-11

把提示词封装成skill！零成本雇佣一位Excel高手

2026-06-10

Harness 刚搞懂，Loop Engineering又要火了

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

GPT Image 2 提示词图库开源站点来了

2026-04-21

不再触发Claude使用限制，大幅降低Token的10个有效习惯！

2026-04-07

Claude Code终极指令速查表

2026-03-26

7 个 Karpathy 式提示词，让 Claude 变成你的研究员、工程师和思考搭档

2026-03-26

我逆向了 329 条 GPT-Image2 提示词模板，全部开源！

2026-04-25

Karpathy 的 CLAUDE.md，到底解决了什么问题

2026-04-14

Codex 从入门到精通

2026-05-02

Claude Design的提示词被扒出来了，我在里面发现了Anthropic最真实的设计哲学

2026-04-19

50个 Claude Code 日常使用技巧与最佳实践

2026-04-20

AI 工程化实战：如何像设计函数参数一样设计 System Prompt？

2026-04-14

大家都在问

怎么写一份 Claude 真正能看懂的 DESIGN.md 文件？

2026-06-17

Search Agent 要如何构造复杂有效的Query？

2026-05-23

写给产品经理的"AI工程"指南：提示词工程、上下文工程、Harness 工程到底是啥？

2026-05-16

AI 工程化实战：如何像设计函数参数一样设计 System Prompt？

2026-04-14

Google说只有5%的人真正会用AI，他们做对了什么？

2026-02-28

Prompt caching 技术是如何实现 1 折的推理成本优化的？

2026-02-12

几句话就能复刻一个付费Skill，Skills商店还能卖什么？

2026-02-12

从 Prompt 到 Skills：如何把业务流程切开，塞进AI的“技能槽”里？

2026-02-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw