创造力即搜索:映射潜在空间

将创意过程视为在生成模型潜在空间中的搜索,新原型以图像节点与过渡视频构成图结构,支持非线性探索、变体生成与图生图等兼顾控制与偶然性的交互方式,配合开放工作空间和序列器,让AI真正成为创意探索的主动伙伴。

发布于2024年12月3日 15:32
编辑零重力瓦力
评论0
阅读41

创造力即搜索:映射潜在空间

作者:Bryan Loh(RUNWAY AI)
翻译:零重力瓦力
原文:https://runwayml.com/research/creativity-as-search-mapping-latent-space

创意探索可以被视为在可能性空间中的搜索过程。我们创造解决方案,评估它们,并不断改进直到达到令人满意的结果。生成式模型的潜在空间(Latent Space)为这一抽象概念提供了完美的软件映射。在这个空间里,每个点都对应着一种可能的创作成果,而这些成果都符合模型从数据中归纳出的创作规律。

传统上,创意软件主要用在创作的最终阶段,用于精炼和生成最终的输出结果。其中的一个原因在于语言:我们必须将用户的创意意图翻译成繁琐的、机器可读的基础参数序列,例如像素坐标和十六进制颜色代码。而生成模型改变了这一点。现在,我们不再需要操作这些基础参数,而是可以通过自然的方式表达意图,跨越多种形式,例如:

  • "这张图片在傍晚时分会是什么样子?"
  • "让这个视频匹配这些图片的风格。"

这种转变让软件从生产工具发展成为一种创意探索的工具。

然而,如何在如此庞大的潜在空间中导航,为界面设计带来了新的挑战:

  • “我们怎么才能更好地展示这些复杂的高维空间,帮助用户找到有趣的区域进行探索?”
  • “我们如何在让用户既能精确控制,同时也保留一些意外收获的可能性?”
  • “我们如何保证用户创作和探索时的灵活性,既能发散思路,又能集中想法?”

我们最近分享了关于新媒体时代的界面设计理念。今天,我们很高兴展示一个通过视频关键帧探索这些问题的原型。

图结构:潜在空间的窗口

一个由图像节点和孤独视频组成的图。图中的连续路径代表了一个连续的视频序列。
一个由图像节点和过渡视频组成的图。图中的连续路径代表了一个连续的视频序列。

图结构是该原型的基础。图像被表示为节点,作为模型潜在空间中的路标。这些节点可以连接到其他节点以创建过渡视频。视频则是通过潜在空间和时间从第一帧过渡到最后一帧的过程。

平衡控制与偶然性

精确的控制有助于限制潜在空间中的可能性。不过,变化和不可预测性有时也能带来“意外之喜”。精确控制下可能会丧失一些意外的可能性。为了平衡这种情况,我们为用户提供了两种以“关系性”的方式操作图像的功能,从而在一致的维度中允许有一定的不可预测性。

通过“图像变体”(Image Variations)生成图像的不同构图版本。

用户可以使用“图生图”(Image to Image)功能,通过文本提示改变图像风格,同时保留图像的原始构图。

结合文本提示和“图生图”功能重新设计图像的风格。

支持非线性探索

从视频的中点分支,创建一条独立的实验路径。

具有创造性的探索很少是线性的。图结构支持各种非线性的探索,允许用户在各个节点分支,创建新的创意分支。随着探索的增加,空间中的图(节点)会自然增长,并跟踪各种实验路径。

选择图结构中的一条连续路径进行预览。

这使用户能够构建非线性时间线。我们提供了一个序列器,允许用户将其非线性时间线导出为具有线性时间线的视频,类似于“自己选择冒险”式的体验。

开放的工作空间

除了图结构,我们没有对工作空间施加任何组织限制。用户可以自由地组织节点和过渡视频,将相关探索聚集在一起,或者根据他们的创作需求分开成独立的实验。

在开放的工作空间中,将实验聚类,展示不同的探索。
进一步探索
我们的原型展示了在生成式媒体时代创意界面的演变。图结构提供了一种在潜在空间中进行导航的方法,将图像视为路标,将转换视为实现特定创意的路径。
通过持续实验和对新界面模式的探索,我们可以实现生成模型的全部潜力,让它们不仅仅是生产工具,还可以成为创意过程中更为主动的合作伙伴,扩展我们发现和探索创意的能力。

相关文章

Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
Hermes 超越 OpenClaw,背后是两种哲学的正面交锋
AI 产品工具
2026年5月16日
0 条评论
零重力瓦力

Hermes 超越 OpenClaw,背后是两种哲学的正面交锋

Hermes Agent 以单日 2240 亿 token 的处理量超越 OpenClaw,登顶开源 AI 智能体榜首。两者代表不同发展哲学:OpenClaw 侧重“连接一切”,拥有庞大生态但近期遭遇严重安全危机;Hermes 主打“自我进化”,通过自动反思生成技能并自主优化库,实现效率提升。尽管 OpenClaw 在广度上仍具优势,但 Hermes 凭借自学习机制和安全改进迅速崛起。未来趋势或指向两种哲学的融合,即兼具广泛连接与自主进化能力的智能体。

#Hermes Agent#OpenClaw#智能体框架
阅读全文
2026 国产大模型中文文案能力深度对比分析
AI 产品工具
2026年5月13日
0 条评论
零重力瓦力

2026 国产大模型中文文案能力深度对比分析

2026 年国产大模型中文文案能力迎来新标杆。评测显示,Kimi K2.6 以最低 "AI味” 和最高创意评分领跑,最接近人类写作风格。DeepSeek V4 Pro 凭借极低重复率和超长上下文,成为长文与 SEO 内容首选。GLM 5.1 则在指令遵循上表现最强,适合严格格式约束场景。文章详细对比了六款主流模型的规格、基准数据及适用场景,为品牌营销、内容创作团队提供选型参考。

#AI 模型#开源模型
阅读全文
互动讨论

评论区

围绕《创造力即搜索:映射潜在空间》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。