Stability AI 与 Arm 强强联手,让手机也跑得动 AI

Stability AI 与 Arm 合作,首次实现 Stable Audio Open 模型在手机端本地运行,仅靠 Arm CPU 即可秒级生成高质量音频,速度提升30倍。无需联网、不传数据,兼顾隐私、便携与实时创作,为视频、音乐、播客等创作者提供口袋里的音频工作室。

发布于2025年3月4日 15:14
编辑零重力瓦力
评论0
阅读27

Stability AI 与 Arm 强强联手,让手机也跑得动 AI

想象一下,你正在制作一段短视频,突然需要一段雨声作为背景音效。以往,你可能需要上网搜索,或者冒雨外出录制。但很快,你只需拿起手机,输入"轻柔的雨声配合远处的雷鸣",几秒钟后,你的设备就直接为你生成了一段完美的音效,而且不需要联网。

这不是幻想,而是 Stability AI 与 Arm 最新合作的成果。2025 年 3 月,这两家科技公司宣布了一项突破性的技术合作,将生成式音频技术直接带入我们的口袋。

让"不可能"成为可能

Arm 的技术几乎存在于全球 99% 的智能手机中,而 Stability AI 则以其创新的生成式 AI 模型闻名。两家公司的合作使得 Stability AI 的 Stable Audio Open 模型首次能够完全在 Arm CPU 上运行,不再依赖云端服务器或网络连接。

这听起来可能不算什么,但对于了解 AI 技术的人来说,这简直是个小奇迹。传统上,生成式 AI 模型需要强大的硬件和大量计算资源,通常需要在云端服务器上运行。将这样的复杂计算带到手机等本地设备上,就像是把一头大象塞进了冰箱。

最初,在 Arm CPU 上生成一段音频需要长达 4 分钟的时间。这在即时创作的世界里简直是一个世纪。但通过模型精简和 Arm 的 KleidiAI 技术,他们将 11 秒音频片段的生成时间压缩到了不到 8 秒,速度整整提升了30 倍。

私人音频工作室在你的口袋里

这项技术的实际意义远超技术数据。对于创作者来说,它意味着一个随身携带的音频工作室。视频制作人可以立即生成定制音效。音乐人可以在灵感闪现时快速捕捉音乐片段。播客制作者可以即时创建过渡音效或背景音乐。

而无需网络连接这一点更是尤为重要。对于野外拍摄的记者、在偏远地区工作的创作者,或者只是在地铁隧道中突然有了创意灵感的普通用户来说,这项技术提供了前所未有的创作自由。

更值得注意的是隐私方面的好处。当所有处理都在本地完成时,你的创意和数据都不会离开你的设备,让越来越注重隐私的用户倍感安心。

音频只是开始

Stability AI 表示,音频技术只是他们计划的开始。公司的目标是将所有前沿模型,从图像到视频再到 3D,都带到边缘设备上。这描绘了一个未来图景:普通人可以用口袋里的设备创造出过去需要专业工作室和昂贵设备才能实现的内容。

这一趋势反映了 AI 技术的普及化,计算能力从集中的数据中心向分散的终端设备转移。随着边缘 AI 技术的不断成熟,我们可能会在我们的日常设备上看到更多惊人的创新。

思考与展望

这项技术不仅仅是对创作者的福音,它可能预示着更广泛的技术变革。当 AI 能够在没有云计算支持的情况下在设备上运行时,许多新应用场景变得可能。即时语言翻译、实时环境声音增强或过滤、个性化音频内容生成等。

随着这些技术的成熟,我们可能会看到声音和音频在数字体验中扮演更重要的角色。在过去,视觉一直是数字媒体的主角,而音频常常被视为配角。但随着生成式音频技术的普及,这种平衡可能会发生变化。未来的社交媒体不仅分享图片和视频,还会分享 AI 生成的个性化声音景观。游戏可以即时生成与玩家行为相匹配的音效和音乐。甚至我们的日常通知和提醒也可能变成根据当前情境即时生成的独特声音。

这项技术将于 2025 年 3 月在巴塞罗那世界移动通信大会上展示,届时我们将看到这项魔法般的技术如何在现实世界中运作。无论如何,一场声音革命已经悄然启动,而它的舞台,就在我们的口袋里。

相关文章

Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
Anthropic 两千亿估值一夜作废,是 AI 泡沫破了吗?
AI 新闻资讯
2026年5月15日
0 条评论
小创

Anthropic 两千亿估值一夜作废,是 AI 泡沫破了吗?

Anthropic 宣布作废未经董事会批准的二级市场员工股转让,导致其估值短期内大幅缩水,引发关于 AI 泡沫破裂的讨论。由于公司未上市,员工套现依赖私募渠道,中间商通过 SPV 层层转卖并收取高额手续费,造成交易混乱且投资者权益缺乏保障。Anthropic 明确不认可此类灰色渠道交易,使大量散户面临资金损失风险。此外,AI 巨头如 OpenAI、xAI 和 Anthropic 的股权高度集中,少数早期员工巨额套现加剧了财富分配不均。尽管行业技术飞速发展,但普通民众难以参与核心利益分配。

#Anthropic
阅读全文
Grok 4.3 被低估的隐藏工作流全解析
AI 新闻资讯
2026年5月13日
0 条评论
小创

Grok 4.3 被低估的隐藏工作流全解析

Grok 4.3 近期更新后,多数用户仍停留在简单问答模式。AI Master 的实操演示显示,这款工具的真正价值在于工作流整合:Fast/Auto/Expert 三档模式分工明确,Expert 模式下追加"什么条件变化会让你改变答案"可逼出明确结论而非模棱两可的套话。深度嵌入的搜索支持一键生成带引用的舆情分析,"反向观点扫描"能在信息茧房中找出盲区。任务功能可设定周期性指令自动运行,相当于零成本的专职信息助理;结构化输出配合内置 Python 执行,上传 CSV 直接出图表,省去本地配置环境的

#Grok#智能体工程
阅读全文
互动讨论

评论区

围绕《Stability AI 与 Arm 强强联手,让手机也跑得动 AI》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。