第三天： Sora 正式发布及幕后的故事

OpenAI正式发布文生视频模型Sora，支持图生视频、视频编辑、故事板、循环生成与场景混合等能力。奥特曼强调其三大价值：赋能创作者、突破文本交互局限、推动AGI发展。目前向ChatGPT Plus/Pro用户开放，按订阅等级提供差异化生成额度。

发布于2024年12月10日 13:23

编辑零重力瓦力

评论0 条

阅读35

#OpenAI #视频生成

第三天 OpenAI 正式发布了 Sora。在过去的短短 2 天里，已经有大量的创作者发布了自己用 Sora 创作的作品。有感到惊艳的，也有感到失望，觉得和可灵、Runway 差别不大的。不妨看看 Sora 开发团队对这款现象级产品的介绍，以及幕后的故事。

萨姆·奥特曼对于认为 Sora 这款产品带来了3项重要的意义

为创作者提供了强大的工具，开创 AI 与人类协作的新模式
突破纯文本交互的局限，让 AI 能够理解和生成视频内容
对实现通用人工智能（AGI）具有关键意义，有助于 AI 系统学习理解现实世界

Sora 的核心功能

文生视频：通过文字描述生成视频
图生视频：将静态图片转化为动态视频
视频编辑：包括重混（Remix）、重剪（Recut）等功能
故事板：允许用户精确控制视频序列和场景转换
创作循环视频：实现无缝循环的视频效果
场景混合：将不同视频元素智能融合（blend）

使用门槛及价格

Sora 将向 ChatGPT Plus 和 Pro 用户开放：

Plus 用户每月可获得 50 次生成机会
Pro 用户可获得 500 次快速生成权限和无限慢速生成
所有用户都可以浏览作品流获取灵感

GPT-5.6 Sol 来了：三模型家族、750 tokens/s、政府审查准入，OpenAI 这次改了游戏规则

OpenAI 发布 GPT‑5.6 系列，含 Sol、Terra、Luna 三档模型，定价分层明确。Sol 旗舰版支持 ultra 子智能体协作模式，编码能力刷新纪录，7 月将在 Cerebras 上实现 750 tokens/s 推理速度。该模型网络安全防御能力强于攻击，但 METR 评估显示其作弊率创历史新高。此外，GPT‑5.6 成为首个经美国政府事前准入审查的前沿模型，初期仅向受信任合作伙伴开放，并引入激活分类器等安全机制。

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型，通过在扩散模型隐空间直接存储三维记忆，解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程，使生成速度提升最高 10.57 倍，显存占用降低 55 倍，且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案，虽暂不支持动态物体记忆，但已开源并适用于机器人仿真等静态场景任务。

Google 搜索变身全天候智能体：Information Agents 上线，你的数据终于开始替你干活了

Google 推出 Information Agents 功能，面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测，智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略，通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战，但凭借二十年数据积累，Google 正推动 AI 助手从对话工具向自主代理进化，重塑“信息找人”的交互范式。

#Google#智能体

阅读全文

互动讨论

评论区

围绕《第三天： Sora 正式发布及幕后的故事》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

第三天： Sora 正式发布及幕后的故事

萨姆·奥特曼对于认为 Sora 这款产品带来了3项重要的意义

Sora 的核心功能

使用门槛及价格

相关文章

GPT-5.6 Sol 来了：三模型家族、750 tokens/s、政府审查准入，OpenAI 这次改了游戏规则

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

Google 搜索变身全天候智能体：Information Agents 上线，你的数据终于开始替你干活了

评论区