
ComfyUI 不想只做极客玩具了:App Mode + ComfyHub + R1 推理模型,AI 绘画工具的“平民化”拐点
ComfyUI 发了三个东西,单独看每个都只是一个小更新,但连起来看就是个完整的战略转身。
先说 App Mode。你以前用 ComfyUI,打开就是一堆节点、连线、参数,跟看电路图似的。现在一键切到 App Mode,节点图消失,只剩你需要的输入框和生成按钮。设计师想改个提示词出图?不需要理解什么是 KSampler、CFG、scheduler,直接在干净的界面里操作就行。
关键是 App Builder。工作流作者可以精确控制哪些参数暴露给用户,哪些锁死在后台。一个文生图工作流可能有二三十个可调参数(采样器、步数、CFG、LoRA 权重、分辨率……),但你只需要给用户看三个:提示词、风格选择、出图数量。其余的保持原配置不变。这种“创作者控制后台,用户控制前台”的思路,跟软件工程里的封装逻辑一模一样。
然后是可分享链接。你搭好的 App 直接生成一个 URL,别人打开就能跑,不用装 ComfyUI、不用懂节点图。这意味着什么?意味着 ComfyUI 工作流第一次可以像分享网页一样传播。以前你要用别人的工作流,得导出 JSON、装依赖、排报错,门槛劝退 99% 的人。现在一个链接搞定。
最后是 ComfyHub,一个专门分享 App 和工作流的社区平台。ComfyUI 已经有 Comfy Node Registry(给开发者发节点用的),ComfyHub 则是面向创作者,用来发布成品 App,建作品集,吸引用户。目前是 Preview 阶段,作者需要申请才能发布。
三件事串起来看,ComfyUI 的战略显而易见:从“极客的工作流编辑器”转型成“AI 绘画的 App 平台”。底层还是那个节点图引擎,但表面从专业工具变成了消费级产品。这是所有专业工具走向大众的必经之路,Photoshop 走过,Figma 走过,现在轮到 ComfyUI。
另外有一篇论文跟这事凑巧撞上了:ComfyUI-R1。哈工大深圳和阿里国际数字商业联合做的,用 7B 参数的推理模型自动生成 ComfyUI 工作流。思路是给模型一段自然语言描述,它通过长链推理(Chain-of-Thought)拆解用户意图,选出合适的节点,规划连接关系,最后输出可执行的工作流代码。
核心结果就是,7B 模型格式有效率达到 97%,节点级和图级 F1 分数显著超过 GPT-4o 和 Claude。为什么?因为大模型直接生成 JSON 格式的工作流容易出错,而 ComfyUI-R1 把工作流转成代码表示,用强化学习做格式校验和结构校验,相当于先想清楚了再写,不是直接输出。
这跟 App Mode 是互补的。App Mode 解决的是“我有了工作流,怎么让别人用”的问题;ComfyUI-R1 解决的是“我连工作流都不会搭,能不能帮我生成一个”的问题。一个是分发端,一个是生产端。两条路一起走,ComfyUI 的生态闭环就完整了。R1 帮你生成工作流,App Mode 帮你封装成 App,ComfyHub 帮你分发出去。
对普通用户而言,以前想用 AI 绘画,要么学 Midjourney(简单但自由度低),要么学 ComfyUI(自由度高但门槛吓人)。现在门槛被从两端同时压下来了,生成端有 R1,使用端有 App Mode。ComfyUI 的自由度优势还在,但入门成本快要追平 Midjourney 了。
当然,目前还有几个现实限制:ComfyHub 还在 Preview,能发布的创作者有限;App Mode 本地部署需要消费级 GPU(官方优化了 RTX 5090 和 RX 9070 XT)。ComfyUI-R1 还在论文阶段,集成进 ComfyUI-Copilot 但覆盖的工作流类型有限。但方向已经很清楚了。
我认为,ComfyUI 这波转型的意义,比任何单个模型的发布都大。因为模型在快速同质化,SDXL、Flux、HiDream、Krea 你追我赶,半年换一茬。但工作流生态的护城河是越挖越深的。12K 节点、400 万活跃用户、正在形成的 App 分发网络,这些是别的工具短期内抄不走的。