如何让 AI 制作的人物对话表现的自然

AI创作者MetaPuppet为提升可灵v1.5人物对话自然度,摸索出一套实用流程:先确保人脸稳定、光线充足;再将对话分段为5秒片段做口型同步;用Runway超慢动作(0.5倍速)插帧增帧率,最后在Pr中2倍速还原并精准对齐原音频,显著改善流畅度与真实感。

发布于2024年11月5日 05:30
编辑零重力瓦力
评论0
阅读57

AI 视频创作者 MetaPuppet 想要通过可灵 v1.5 为自己的影片《记忆碎片》制作人物对话的场景。经过实践,他发现可灵 v1.5 生成的视频虽然很逼真但仍旧不够自然。经过一番尝试,他总结了一个让人物对话表现得更加自然的视频制作流程。

详细步骤

在进行口型同步前,确保角色脸部一直在画面当中,且光线良好,否则口型同步可能会失败。将画面调整到令你满意后,点击视频下方的"口型同步"按钮。

可灵一次只能生成 5 秒的口型同步视频,因此需要事先将对话内容切割成5秒的视频片段。

可灵的口型同步使用非常简单,但生成的视频往往不够流畅,那是因为生成视频的帧速率低于原始视频。

这个时候,可以通过 Runway 解决这个问题。将可灵生成的视频上传至 Runway,然后点击 Super-Slow Motion(超慢动作)按钮,把速度设置成 0.5。新的视频将变成半速,此时 Runway 为原视频添加了更多的中间帧。

以最高分辨率导出视频,并包含音频。

把新的视频导入 Pr,把视频播放速度调整成2倍速,并通过音频波形图,将原音频与新的视频对齐。

完成对齐后,删除视频中被加速的音频。新的视频与原视频长度一致,但因为加入了新的中间帧,效果变得更加自然了。

相关文章

Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
如何解决 Hermes Agent 中 QQ Bot “灵魂不在线”
AI 教程知识
2026年5月8日
0 条评论
零重力瓦力

如何解决 Hermes Agent 中 QQ Bot “灵魂不在线”

Hermes QQ Bot 常因网络波动出现“灵魂不在线”的静默断连,根源在于 WebSocket 重连逻辑缺陷导致进程未正常退出。目前修复版本已解决重连耗尽问题,但深层异常捕获仍有待完善。建议用户升级至最新版,配置 systemd 或 Docker 自动重启策略,并优化代理超时设置,以保障 QQ Bot 稳定运行。

#Hermes Agent
阅读全文
一个 JSON 公式,让 AI 出图告别抽卡玄学
AI 教程知识
2026年5月8日
0 条评论
小创

一个 JSON 公式,让 AI 出图告别抽卡玄学

AI 技术博主 AI Master 提出用 JSON 结构化提示词替代自然语言,解决 AI 绘图修改局部时整体崩坏的问题。该方法将主体、灯光等元素独立分槽,配合 Gemini 提取参考图信息,可实现精准调整颜色或风格而不影响其他细节。此方案适用于角色一致性控制及摄影参数迁移,同样兼容 Veo 3.1 视频生成,让 AI 创作从随机抽卡转向可控的确定性系统。

#Veo#Nano Banana#提示词工程
阅读全文
互动讨论

评论区

围绕《如何让 AI 制作的人物对话表现的自然》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。