如今,模型大战已有偃旗息鼓之势。战斗的方向开始朝着一站式创作平台发展。作为 AI 音频模型老大的 ElevenLabs 也推出了自己的一站式创作平台 Flows。
说白了,Flows 就是一个基于画布的视频编辑器,把图像、视频、语音、音效、音乐这几个模态全塞进了同一个地方。以前做一支广告,得在各个标签页之间来回跳,先生成语音,再去弄视频,再拖时间轴,流程碎得让人抓狂。Flows 解决的就是这个问题,让整个创作过程更像是在一张画布上随意组合,而不是流水线上拧螺丝。
最重要的是它的模型覆盖面。视频端接入了 Google 的 Veo、可灵和 Seedance,图像端有 Google 的 Nano Banana,语音端除了自家的 V2 和 V3,还有一个声音市场,背后是真人配音演员上传的声音,ElevenLabs 说已经给这些配音演员付出了超过 1100 万美元的分成。音乐部分则是他们自己的商业授权模型 Eleven Music,也就是说你在平台上生成的音乐,版权层面至少在商业使用上是清晰的。
他们展示了一个香水广告的 demo,从创意到成片,号称一天内搞定,还能一键生成 70 多种语言。这个能力对出海团队来说非常重要,省去了反复找配音和重新剪辑的成本。当然,Flows 目前还是首次预览阶段,距离真正好用可能还有一段路。但这个产品思路本身在说一件事,光有好模型已经不够了,谁能把工作流串起来,谁才有机会留住用户。

评论(0)