Framer:可设置运动轨迹的视频插帧技术
Framer是一款交互式视频插帧工具,支持手动设置关键点运动轨迹,精准控制两帧间的局部形变与过渡;也提供“自动驾驶”模式自动估计关键点并优化轨迹。适用于图像变形、延时摄影、卡通插值等场景,兼顾创意控制与使用便捷性。
微软发布最新用户界面解析模型:OmniParser
微软推出OmniParser,可将UI截图精准解析为结构化元素,显著提升GPT-4V等视觉语言模型对界面组件、图标功能及可交互区域的理解能力;基于6.7万截图与7000图标描述对训练,在SeeClick等基准测试中超越GPT-4V基线,亦可作为插件增强Phi-3.5-V、Llama-3.2-V等模型的UI理解性能。
Runway Act-One 面部表情捕捉工具介绍
Runway推出Act-One面部表情捕捉工具,基于Gen-3 Alpha模型,仅需普通相机拍摄的单人表演视频,即可高保真还原视线、微表情与情感节奏,并驱动多角色动画生成。无需动捕设备或复杂绑定,支持跨角色复用表演、声音变换及多轮对话场景创作,现已面向资深用户开放。
Canva 可画的十项魔法(AI)新功能
Canva 可画上线十项AI新功能,涵盖文生图、智能扩图、主体抠图与局部编辑、一键格式转换与翻译、AI生成PPT/视频/社媒帖、图像变形及路径动画等,大幅降低设计门槛,让非专业用户也能高效产出高质量视觉内容。
Midjourney 推出全新图像编辑器
Midjourney上线全新图像编辑器,首次支持上传并编辑非AI生成的自有图片,提供扩展、裁剪、重着色、元素增删等操作;新增“纹理更换模式”,可智能重置光照、材质与表面纹理;所有编辑均通过文本提示+区域选择控制,兼容风格/角色参考;V2 AI监督系统正测试中。
Ideogram 推出画布功能,为 AI 绘画带来更多新的玩法
Ideogram 上线画布功能,集成魔法填充与图像扩展,可在已有图像上智能补全细节或向任意方向延展画面,让AI绘画从“生成一张图”升级为“自由构建画布”,大幅提升创作控制力与实用性。
Claude 开发电脑操控模型
Claude 3.5 Sonnet 已具备基础电脑操控能力,能通过屏幕截图识别界面、移动光标、点击和输入,模拟人类操作;在OSWorld评估中达14.9%,领先同类模型;目前处于公测阶段,安全等级为AI安全级别2,需警惕提示注入等风险。
Stability AI 正式发布 Stable Diffusion 3.5
Stability AI 正式发布 Stable Diffusion 3.5,含 Large(80亿参数,支持100万像素)、Large Turbo(4步出图)及即将上线的 Medium(25亿参数,适配消费级硬件)三款模型。支持多文化人物生成与3D、摄影、绘画等多种风格,免费开放商业与非商业使用(年收入超100万美元需企业许可)。
Claude 3.5 Sonnet New 智能贴心的小助手
Claude 3.5 Sonnet New 能跨应用操作浏览器、编程工具、地图、日历等桌面软件,自动完成查路线、订会议、写代码等任务,把多步手动操作变成一句话指令,真正成为懂你需求的智能生活助手。