字节推出新一代视频生成模型:Goku
字节推出视频生成模型Goku及广告专用版Goku+,视频质量媲美Sora与Veo 2;Goku+支持20秒以上生成,手部动作稳定、表情生动,可实现人货互动与产品图转视频,广告制作成本降低100倍。
Magic 1-For-1:一分钟生成高质量视频,速度快到超乎想象
Magic 1-For-1 是一款开源视频生成模型,采用“文本→图像→视频”两阶段策略,兼顾生成质量与效率;3秒可出5秒视频,1分钟内完成1分钟高清视频生成,依托多模态融合、对抗性蒸馏和参数稀疏化等优化,显著降低显存与计算开销。
Google 创意AI绘画工具 Whisk 全面开放了
Google创意AI绘画工具Whisk全面开放,无需文字提示,上传图片即可融合主题、场景与风格生成原创图像;基于Imagen 3模型,支持灵感激发、智能推荐与编辑,适合设计师、插画师及创意爱好者快速产出视觉内容。
Meta AI:能与你协作、共同生活的机器人管家要来了
Meta AI推出新型家用机器人AI,能自然理解指令、与人协作完成整理房间、收快递、辅助做饭等任务;基于10万条指令训练,在200+虚拟家庭场景中学会动态推理与实时调整,虚拟训练成果可直接迁移至实体机器人,结合AR头盔实现直观人机交互。
Krea.ai 通过自然聊天方式进行 AI 绘画创作
Krea.ai 推出对话式 AI 绘画功能,用户无需编写复杂提示词,只需用自然语言描述需求,如与画师聊天般交互,AI 即可生成或实时调整图像。平台融合自研模型及 Flux、Ideogram 等多引擎,提升创作自由度与实用性。
Topaz Labs 推出迄今最先进视频修复技术:Project Starlight
Topaz Labs 发布 Project Starlight——全球首个基于扩散模型的视频修复技术,参数超60亿,依托NVIDIA最新硬件,可全自动消除压缩伪影、模糊、噪声等损伤,在保持时间一致性的前提下提升分辨率与细节真实感,适用于家庭影像、专业视频及历史资料修复。
AI 何成为我们创意灵感的魔法助手?
美甲师Tapless Guy用ChatGPT理解艺术与色彩,将天马行空的创意快速收敛为可落地的设计方案。AI不再只是执行工具,而成为她与客户协作中激发灵感、筛选选项的创意伙伴。
Elevenlabs 让 DeepSek “开口说话”
ElevenLabs已接入DeepSeek 32B模型,为其赋予高质量语音合成能力。依托开源策略与扎实技术,DeepSeek在国内外快速构建生态,虽起步晚于OpenAI,但正通过持续迭代与技术突破加速追赶。
2025 年十大国外 AI 推理平台:LLM API 提供商对比
2025年十大国外AI推理平台出炉:Together AI以低成本高隐私见长,Fireworks AI主打多模态低延迟,OpenRouter支持300+模型统一调用,Groq依托LPU实现超低延迟,Hyperbolic提供80%成本降幅。覆盖性能、价格、合规与生态维度,助开发者精准匹配需求。