LTX 推出自动音效功能
LTX 新增自动音效(Auto SFX)功能,支持在图生视频及已有视频中智能匹配并生成贴合画面的音效,无需手动添加,显著提升 AI 视频制作效率与沉浸感。
Nvidia 推出文生图模型:Sana
Nvidia 推出轻量文生图模型 Sana,支持中文提示词,最高输出 4096×4096 图像;其 0.6B 小版本仅 Flux-12B 体积的 1/20,推理速度快超 100 倍,16GB GPU 上 1 秒即可生成 1024×1024 图像,适合本地高效部署。
开源社媒点赞评论智能体:Riona AI Agent
Riona AI Agent 是一款开源社媒互动智能体,支持自动登录 Instagram、X 和 GitHub,调用 Gemini 分析帖文并执行点赞、评论;可上传文字/音频/视频进行个性化训练,适用于跨境电商海外营销与客户服务。
全自动产品营销 AI 智能体:Astral
Astral 是一款内测中的全自动营销 AI 智能体,可模拟人类操作,在 Reddit 等平台自主识别用户、分析页面并发布自然无痕的推广内容,支持 24/7 运行。它为不擅营销的小企业提供新可能,也引发对信息质量与真实性的隐忧。
Stability.ai 推出新的单图生成 3D 的 SOTA 模型:SPAR3D
Stability.ai 发布单图生成3D新模型 SPAR3D,以点云为中间表示,支持生成高质量网格模型;内置 Gradio 点云编辑器,可拖拽、着色、缩放点云,编辑后一键生成新3D模型,适合快速迭代与创意探索。
可灵 1.6 推出灵感词库功能
可灵1.6上线灵感提示词库,覆盖镜头、景别、光影、画面、氛围五大类,新手可一键调用降低创作门槛;但真正提升生成质量与控制成本的关键,在于参考优质AI视频案例,持续积累个性化提示词词典。
NVIDIA Cosmos:加速物理 AI 的开源平台
NVIDIA Cosmos 是开源物理AI平台,提供基于2000万小时视频训练的世界基础模型(WFMs),支持文本/视频到视频生成,兼顾扩散与自回归架构。可高效生成符合物理规律的合成数据,加速机器人、自动驾驶等现实场景AI开发,并已集成Omniverse,支持微调与商用。
NVIDIA ACE:AI 驱动的自主游戏角色
NVIDIA在2025年CES推出ACE自主游戏角色,依托多模态小型语言模型,赋予NPC感知环境、理解意图、动态决策、语音交互与自我反思能力。已落地《PUBG》《MIR 5》等游戏,让伙伴更懂玩家,Boss更能学习对抗。
海螺 AI 推出 MiniMax API 2025 入门礼包
海螺AI上线MiniMax API 2025入门礼包,注册即赠3次视频/音乐生成、1次语音克隆、5000字符T2A及1万LLM Token;支持Stripe自动充值,视频API已集成ComfyUI,开发者可邮件申请最高100美元测试代金券。