Viggle 推出了口型同步功能
Viggle上线口型同步功能,可在角色动态表演中自动匹配语音、歌曲或影视台词的口型,提升动画真实感。该功能目前仅限Viggle App内使用。
Adobe Firefly 视频生成模型将对公众开放
Adobe Firefly视频生成模型正式向公众开放,支持文生视频与图生视频,可快速制作2D/3D动画、风格一致的补充镜头及烟雾、光晕等特效元素。训练数据仅来自Adobe Stock与公共领域内容,确保商业安全。需加入等候名单获取权限。
带有文字的 AI 视频对比
AIGC达人Heather Cooper用同一张Midjourney生成的无文字原图,测试可灵、海螺AI、Runway与Luma四大工具的“带文字视频”生成能力。统一提示词强调低角度时尚广告场景及文案“Your style, your way”,重点比对文字自然度、运镜流畅性与画面质感。
手势同步开源模型:TANGO
TANGO是东京大学与CyberAgent AI联合推出的开源手势同步模型,可将人物视频中的手势动作与任意音频精准对齐,补足了现有口型同步技术在肢体协同上的空白,适合虚拟人、动画制作及交互式AI应用。
一款将静态教科书中的图示转化为互动物理模拟的创做神器
这款工具用Segment Anything和多模态大模型,自动识别物理教科书中的静态图示,生成可嵌入页面的互动物理模拟,覆盖光学、电路、运动学等场景;结合教师反馈优化出实验增强、动画图示、双向互动与参数可视化四类策略,提升教学趣味性与个性化。
可灵口型同步功能试用
可灵上线口型同步功能,支持33种音色与0.8–2倍语速调节,单次生成5秒视频并保留人物原有动作;口型匹配自然度较好,但面部表情略显僵硬,暂未加入眨眼等微表情细节。
超级好用的免费音视频字幕生成工具:Whisper Web
Whisper Web 是一款免费、本地运行的音视频字幕工具,基于 OpenAI Whisper Large v3 Turbo 模型,20秒即可为25分钟音频生成高精度字幕,全程离线、无需联网。支持 npm 快速启动,Firefox 用户需手动启用 Web Workers。
特斯拉人形机器人 Optimus 惊艳亮相 Cybercab 发布会
特斯拉在Cybercab发布会上展示人形机器人Optimus,融合自研电池、电机与AI推理系统,可胜任教学、照护、家务等多任务;量产版预计售价2–3万美元,马斯克称其将成大众可负担的日常伙伴,人机共存时代正加速落地。
海螺 AI 全面开放图生视频功能
海螺AI(Minimax)正式开放图生视频功能,支持上传≤20MB、≥300px、比例在2:5至5:2之间的图片;在无额外提示词条件下,生成视频中的人物表情自然度优于Runway Gen-3和可灵1.0,适合对角色表现力有要求的创作者快速试拍。