Netflix 精准动作控制 AI 视频模型:Go-with-the-Flow AI
Netflix推出Go-with-the-Flow AI模型,仅通过替换高斯噪声为“变形噪声”微调基础视频模型,即实现动作迁移、镜头控制、“剪切拖拽”动画、转台运动引导及文本/图像驱动的3D一致视频生成,全程零计算增量,支持I2V与T2V双路径。
Suno “垫声”,让AI成为我们的艺术创作伙伴
Suno 推出“垫声”技术,用户只需哼唱或录入任意声音,AI 即可生成完整歌曲。类比绘画中的“垫图”,它让音乐创作从专业门槛走向人人可为,AI 不再是被动工具,而是能响应直觉、激发灵感的创作伙伴。
Perplexity 推出 Sonar API,以实时 AI 搜索挑战 Google 和 OpenAI
Perplexity 推出企业级 Sonar API,含基础版与 Sonar Pro 两版本;后者在 SimpleQA 基准测试中 F 值达 85.8,超越 GPT-4 和 Claude,支持实时网络搜索与可溯源引用,基础版仅每千次 5 美元,已集成至 Zoom AI Companion 2.0。
Vidu 推出 2.0,可错峰无限生成视频
Vidu 2.0上线,专注图生视频,最快10秒成片,画面稳定性与角色一致性明显提升;标准年费用户每月8美元,非高峰时段可无限生成,性价比突出,成为可灵、海螺AI之外值得考虑的国产新选择。
Krea.ai 图像 3D 化实时制作不同角度的运动鞋广告
Krea.ai 新增图像3D化功能,可将静态运动鞋图片实时生成多角度3D视图,无需建模或专业软件,广告团队能快速产出高质量、多视角的产品展示图,显著提升电商与营销素材制作效率。
Replicate:按需付费使用 AI 模型的方案
Replicate 提供按需付费的 AI 模型调用服务,支持 Flux、海螺 AI、Llama、mmaudio 等多种生成式模型,可按 GPU 类型(如 H100 或 T4)计费,最低 $0.81/小时,适合低频使用或模型测试,比固定月费更灵活经济。
可灵 1.6 推出 Elements,可进行多个主题的融合
可灵1.6上线Elements功能,支持在同一视频中自然融合真人实拍与卡通等多风格元素。示例中网红口播场景与动态卡通怪物无缝结合,显著提升AI视频的创意表达与叙事自由度。
Freepik 整合六大 AI 视频生成模型,具备高性价比
Freepik 新增整合 Runway、海螺 AI、Luma、可灵、Mochi 和混元六大 AI 视频生成模型,支持一站式切换调用;年度基础会员仅 5.75 美元/月,全年可生成 8.4 万张图与 560 段视频,中小创作者可低成本试用多模型效果。
能够融合声音的小型 TTS(文本转语音)模型:Kokoro
Kokoro 是仅 82M 参数的轻量级 TTS 模型,支持从十种预设声线中任选两种,按任意比例混合生成个性化语音——如男女声 60:40 融合。提供简洁 API,访问 kokorotts.com 即可快速调用。