当 Gemini 3 发布时,OpenAI 总部进入了 "红色警戒(Code Red)" 状态。但萨姆·奥特曼透露,这其实是他们的常规操作!早期的每一个行动都会比后期更有价值。DeepSeek 崛起时他们也这么干过。这种 "适度偏执" 的策略让 OpenAI 能在 6-8 周内快速响应任何威胁。奥特曼坦言:Gemini 3 并没有造成预期的冲击,但确实暴露了 OpenAI 产品的短板。奥特曼表示,他们的应对方式也很简单!疯狂发布新的功能,新图像模型、GPT-5.2、浏览器……这就是OpenAI保持领先的秘密武器。
相关文章
访谈案例
2026年5月13日
0 条评论
小创
AI 读取梦境,离我们还有多远?
MIT 本科生 Kelly Zhang 利用 fMRI 信号实现脑内画面实时视频生成。她基于视觉皮层与深度神经网络的结构相似性,结合 Vision Transformer 提取特征、Latent Diffusion Model 还原图像及 Stable Diffusion 生成视频,成功将大脑活动转化为可视内容。该技术虽处早期且细节有待提升,但在 PTSD 治疗、失语沟通及痴呆症辅助等领域具广阔前景。其突破关键在于跨学科知识融合,打破了传统科研的领域壁垒,为未来科研方法提供了新启示。
#Ted
阅读全文
AI 新闻资讯
2026年5月8日
0 条评论
小创
ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。
#OpenAI
阅读全文
AI 产品工具
2026年5月6日
0 条评论
零重力瓦力
Gemini File Search 支持图片了:多模态 RAG 从此不只是文本检索
5 月 5 日,Google Gemini API 的 File Search 新增多模态检索、元数据过滤及页码引用功能。核心在于引入原生多模态嵌入模型,支持直接对图片、图表进行语义搜索,无需依赖 OCR。该托管服务大幅降低自建 RAG 系统的开发门槛,适合需处理大量视觉资料的企业或开发者。不过需注意其暂不支持音视频格式,且一旦选定嵌入模型无法无缝升级。
#RAG#Gemini#Google
阅读全文
互动讨论
评论区
围绕《OpenAI 如何应对 Gemini 3 竞争威胁》展开交流,未登录用户可浏览评论,登录后可参与讨论。
评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
暂无评论,欢迎成为第一个参与讨论的人。