70 人 AI 图像创业公司挑战硅谷巨头

Black Forest Labs 是德国一家仅 70 人的 AI 初创公司,凭借“潜扩散”技术以远少于竞争对手的资源,开发出性能仅次于 OpenAI 和 Google 的图像生成模型。公司估值已达 32.5 亿美元,与 Adobe 、 Meta 、微软等巨头达成合作。公司联合创始人表示,视觉智能远超内容创作,计划今年推出搭载 AI 模型的机器人,并涉足智能眼镜领域,将业务从图像生成扩展至物理智能。

发布于2026年4月10日 18:00
编辑小创
评论0
阅读20

Black Forest Labs : 70 人团队挑战硅谷巨头的 AI 图像生成新秀

Black Forest Labs 在 AI 图像生成领域一直是不可小觑的力量。这家仅有 70 名员工的初创公司,下一步计划是为物理智能提供技术支撑。

17 January 2025 Bavaria Munich Andreas Blattmann Black Forest Labs will be speaking on stage at the Digital Life Design ...

旧金山莫斯克尼中心的 HumanX 大会现场,人潮涌动,仿佛置身于 AI 宇宙的中心。科技领袖们穿梭其间, OpenAI 和 Anthropic 的总部就在不远处。然而,就在 5000 英里外德国黑森林地区——那片以火腿闻名的地方——一家规模不大的初创公司已经成长为与硅谷顶尖实验室抗衡的强劲对手。去年 12 月, Black Forest Labs 完成最新一轮融资,估值达到 32.5 亿美元。此前该公司已与 Adobe 和图形设计平台 Canva 达成合作协议,为其 AI 图像生成功能提供技术支持。微软、 Meta 和 xAI 等大型 AI 实验室也都签署了类似协议。成立将近两年, Black Forest Labs 已经有了挑选合作伙伴的底气。 2024 年,埃隆·马斯克的 xAI 选择 Black Forest Labs 为 Grok 提供首个图像生成器技术支持。这笔合作为公司打开了知名度,却也因为聊天机器人在安全防护方面的局限性引发了不少争议。几个月后, xAI 自主研发了 AI 图像模型,双方合作就此终止。

据知情人士透露,近来 xAI 再次接触 Black Forest Labs ,希望重新授权其技术。但这一次, Black Forest Labs 选择了拒绝。知情人士表示,合作告吹的主要原因是 xAI 以混乱著称的工作环境带来过高的运营风险。 xAI 未就此事回复知名科技媒体 WIRED 的置评请求。

去年 9 月, Black Forest Labs 与 Meta 签署了一份价值 1.4 亿美元、为期多年的合作协议。

这些 AI 实验室之所以青睐 Black Forest Labs ,是因为其图像生成器性能位居世界前列。根据第三方评测机构 Artificial Analysis 的基准测试,其表现仅次于 OpenAI 和 Google 的产品。该公司的文本生成图像模型也是 Hugging Face 平台上下载量最高的几款之一,这意味着市面上不少 AI 图像工具很可能采用的是 Black Forest Labs 技术的免费版本。

考虑到公司历史上获得的资源一直远少于竞争对手,这一成绩尤为亮眼。资源有限促使团队走上了一条更高效的研究路径——潜扩散( latent diffusion )。简而言之,这种方法让 AI 模型先勾勒出图像的大致轮廓,再逐步填充细节。

联合创始人安德烈亚斯·布拉特曼在 HumanX 大会现场接受 WIRED 采访时表示,潜扩散技术“让我们能够以远少于竞争对手的资源量,推出性能强大的模型”。

尽管已取得显著成绩, Black Forest Labs 认为图像生成只是一个起点。布拉特曼透露,公司计划在今年晚些时候发布一款搭载其 AI 模型的机器人(他未透露硬件合作方)。这番布局源于公司对 AI 在物理世界感知与行动能力的长期看好。

布拉特曼说:“视觉智能远比内容创作丰富,内容创作只是进入这项技术的入口。我个人非常期待的——也是本届大会反复出现的趋势——是物理智能。”

据知情人士透露, Black Forest Labs 目前还在与多家硬件厂商接洽,计划为智能眼镜、机器人等产品提供技术支持。

扎根 Black Forest

布拉特曼与另外两位联合创始人罗宾·隆巴赫和帕特里克·埃瑟,早在 2021 年就因在 AI 图像模型领域的开创性研究而小有名气。 2022 年,他们被 Stability AI 招致麾下,基于此前的研究成果发布了备受欢迎的开源 AI 图像生成器 Stable Diffusion 。两年后,三人宣布离职,创立了 Black Forest Labs 。

三人没有搬到旧金山,而是决定把总部留在德国弗莱堡附近的家乡。布拉特曼认为这个选择对公司成功至关重要。

他补充道:“身居别处有时候是一笔巨大的财富。每个创过业的人都知道,创业很大程度上取决于专注能力和聚焦关键事务的能力。我每次来旧金山都很喜欢待在这里,但这里诱惑太多,专注确实很难。”

近些年,不少美国 AI 实验室在专注力方面确实面临挑战。最典型的例子当属 OpenAI ,最近关停了 AI 视频生成应用 Sora ,将资源集中到核心业务上(几周后又收购了热门科技播客节目 TBPN )。 Black Forest Labs 一直是 AI 初创公司中专注度较高的代表,但随着向物理智能领域扩展,公司能否保持这种专注力将是接下来需要观察的重点。

相关文章

Linear + Claude Code:给 AI 装上项目大脑
AI 新闻资讯
2026年5月22日
0 条评论
小创

Linear + Claude Code:给 AI 装上项目大脑

AI 技术博主 Alex Finn 提出利用免费工具 Linear 将 Claude Code 转化为自主智能体的工作流。该方案要求先将项目拆解为带优先级和验收标准的任务(Issue)录入 Linear,随后 AI 可自动领取任务、编写代码、执行测试并更新状态,全程无需人工干预。此模式有效解决了传统氛围编程中指令中断或偏离的问题,通过 Linear 作为“第二大脑”提供结构化上下文,显著提升产出质量。此外,该流程支持跨设备多智能体协同及 Git 分支管理,配合 Slack 通知实现高效团队协作。

#Claude Code#智能体工程
阅读全文
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
AI 新闻资讯
2026年5月22日
0 条评论
小创

谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变

Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

#Gemini#视频编辑#视频生成
阅读全文
Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
互动讨论

评论区

围绕《70 人 AI 图像创业公司挑战硅谷巨头》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。