谷歌 DeepMind 推出 AI 天气预测模型:GenCast 准确率创新高
谷歌 DeepMind 推出全球首个高分辨率(0.25°)概率集成AI天气模型GenCast,基于扩散模型与40年ERA5数据训练,单TPU仅需8分钟即可完成15天预测,在97.2%任务上超越ECMWF的ENS系统,尤其擅长极端天气路径预测与风能预报,代码与权重已开源。
海螺 AI I2M-01-live 模型测试
海螺AI推出I2V-01-Live图生视频模型,直接以一年前Midjourney v5.2生成的3D卡通人物图为输入,未加任何提示词,即实现自然眨眼、口型同步、头发飘动与丰富肢体动作,展现出色的2D插画风格动态生成能力。
实现图像可控运动的 AI 视频生成框架: I2VControl
字节跳动推出I2VControl视频生成框架,支持精细化运动控制:可独立或协同调节镜头运动(如希区柯克变焦、环绕拍摄)与物体运动(拖拽、运动笔刷),轻松实现动态肖像、飘逸长发等特效,显著提升AI视频的可控性与表现力。
Luma 发布绘画引擎 Photon 性能超越 Midjourney
Luma推出全新图像生成引擎Photon及极速版Photon Flash,在双盲测试中质量、创造力与理解力全面超越Midjourney等主流模型;1080p图像生成成本低至0.4美分,速度提升超10倍,专为电影、设计与艺术创作优化。
Krea.ai 推出局部重绘和画面扩展
Krea.ai 新增局部重绘与画面扩展功能,用户可精准修改图像局部区域或向外延展画布。此举使其跻身Midjourney、Ideogram等主流AI绘画工具行列,也反映出图像编辑能力正加速成为行业标配。
Ideogram 推出图片去背景功能
Ideogram 新增图片去背景与背景替换功能,AI绘画工具正从“生成”迈向“编辑”阶段;与此同时,Photoshop、美图秀秀等传统软件也在快速集成AI能力,生成式与编辑型工具的界限日趋模糊。
海螺 AI 发布了最新 2D 插画风格视频模型 I2V-01-Live
海螺AI推出2D插画风格视频模型I2V-01-Live,显著提升动作流畅度、画面稳定性与角色表情表现力,支持多种艺术风格,现已全面开放使用。
创造力即搜索:映射潜在空间
将创意过程视为在生成模型潜在空间中的搜索,新原型以图像节点与过渡视频构成图结构,支持非线性探索、变体生成与图生图等兼顾控制与偶然性的交互方式,配合开放工作空间和序列器,让AI真正成为创意探索的主动伙伴。
Google Deepmind 推出新的 4D AI 模型 CAT4D
Google DeepMind 推出 CAT4D,一种能将普通视频实时重建为动态 3D 场景的 4D AI 模型;支持自由视角切换与画面冻结,显著提升观看的沉浸感与交互性,无需特殊拍摄设备。