ReconX 视频扩散模型:只需两三张照片就能构建完整的 3D 场景
清华与港科大联合推出ReconX视频扩散模型,仅凭2–3张照片即可重建高质量3D场景。它通过视频扩散模型“想象”补全缺失视角,再结合点云生成与多视角重建,显著提升泛化性与鲁棒性,对VR、自动驾驶等场景具有实用价值。
AI 口型同步工具 Hedra 重大更新,新增五大功能
Hedra AI口型同步工具迎来重大更新:新增语音隔离功能,秒除背景噪音;变声器支持上传、克隆与自定义声音;语音设计可依文本提示生成独特音色;AI创意助手辅助脚本生成、翻译与优化;单次输出最长12分钟视频。
AI 创意图像编辑工具:MagicQuill
MagicQuill 是一款免提示词的 AI 图像编辑工具,支持直接插入元素、擦除对象、修改颜色等直观操作;其智能模型能实时理解用户意图并自动生成提示词,显著降低 AI 创意编辑门槛,适合不熟悉提示词但追求高效表达的设计者与内容创作者。
ChatGPT MacOS 桌面版应用提供了操作其他应用的能力
ChatGPT macOS桌面版上线跨应用操作功能,Plus与Team用户可在测试版中直接读取Xcode代码并提交至终端,省去复制粘贴步骤,提升开发效率。
OpenAI 上架 Windows 版 ChatGPT 桌面应用
OpenAI正式发布Windows版ChatGPT桌面应用,支持o1-preview等最新模型,集成Alt+Space快捷唤起、语音对话、网页搜索、Canvas协作画布、截图提问、多文件分析、DALL·E绘图及专业文案生成等功能,办公与创作更高效。
Vidu 1.5 世界首个多模态视频生成模型
Vidu 1.5 全球首发多实体一致性视频生成能力,支持分别上传人物、物体、场景三图并保持高度统一;新增多主体参考、镜头语言理解、运动幅度调控及2D动漫风格,画质提升至1080p,显著增强语义理解与画面稳定性。
开源图像去背景 AI 模型:RMBG-2.0
RMBG-2.0 是一款新开源图像去背景模型,在逼真图像中准确率达 92%,复杂背景场景下成功率为 87%,性能比 Adobe Photoshop 高出 44%。适合设计师、开发者及需要批量处理透明背景图像的用户。
AI 视频绘画工作流工具:FLORA
FLORA 是一款模块化 AI 视频绘画工具,整合可灵、海螺AI、Runway 与 Luma,支持 Flux 和 SD 3.5 图像模型;通过类似 ComfyUI 的工作流,自由串联提示词优化、文生图、图生视频等环节;$16/月起,含 1000 张图或 50 段视频额度。
AI 电商神器 hautech.ai,轻松制作精美模特图片
hautech.ai 是一款免费 AI 工具,专为电商优化:上传服装平铺图,即可一键生成带真实感模特的穿搭图。支持自定义模特、背景及表情动作,不填则智能随机生成,三步完成,适合中小商家快速产出高质量商品图。