如何让 AI 制作的人物对话表现的自然

AI创作者MetaPuppet为提升可灵v1.5人物对话自然度，摸索出一套实用流程：先确保人脸稳定、光线充足；再将对话分段为5秒片段做口型同步；用Runway超慢动作（0.5倍速）插帧增帧率，最后在Pr中2倍速还原并精准对齐原音频，显著改善流畅度与真实感。

发布于2024年11月5日 05:30

编辑零重力瓦力

评论0 条

阅读92

#可灵 #Runway #视频编辑

AI 视频创作者 MetaPuppet 想要通过可灵 v1.5 为自己的影片《记忆碎片》制作人物对话的场景。经过实践，他发现可灵 v1.5 生成的视频虽然很逼真但仍旧不够自然。经过一番尝试，他总结了一个让人物对话表现得更加自然的视频制作流程。

详细步骤

在进行口型同步前，确保角色脸部一直在画面当中，且光线良好，否则口型同步可能会失败。将画面调整到令你满意后，点击视频下方的"口型同步"按钮。

可灵一次只能生成 5 秒的口型同步视频，因此需要事先将对话内容切割成5秒的视频片段。

可灵的口型同步使用非常简单，但生成的视频往往不够流畅，那是因为生成视频的帧速率低于原始视频。

这个时候，可以通过 Runway 解决这个问题。将可灵生成的视频上传至 Runway，然后点击 Super-Slow Motion（超慢动作）按钮，把速度设置成 0.5。新的视频将变成半速，此时 Runway 为原视频添加了更多的中间帧。

以最高分辨率导出视频，并包含音频。

把新的视频导入 Pr，把视频播放速度调整成2倍速，并通过音频波形图，将原音频与新的视频对齐。

完成对齐后，删除视频中被加速的音频。新的视频与原视频长度一致，但因为加入了新的中间帧，效果变得更加自然了。

可灵 3.0 原生 4K：AI 视频终于跨过了影视工业的最后一道门槛

可灵 AI 发布 Video 3.0 原生 4K 模式，支持 3840×2160 分辨率、60fps 及 16bit HDR，首次在多维度达到广播级交付标准。该模式区别于后期放大，细节真实度显著提升，并新增多镜头分镜与原生音频生成功能，大幅提高制作效率。尽管 4K 生成成本较高，但其在 ELO 测试中排名第一，标志着 AI 视频从娱乐工具迈向影视工业级生产设施，解决了商业交付难题。

Runway 学院：视频如何一键转绿幕

Runway Aleph 2.0 模型通过提示词实现视频一键生成绿幕素材或干净背景，替代传统手动抠像。用户在 Edit Studio 上传视频后，利用提示词即可分离主体与背景，支持运动引导及二次合成创作。该 AI 工作流简化了复杂后期流程，显著提升视频编辑效率，推动专业后期技术平民化，适用于换景、特效添加及动画二创等多种场景。

Runway AI 短片《50 Crowns》

由 Runway 制作的游戏 CG 级短片《50 Crowns》讲述了赛博格赏金猎人古堡探险的恐怖悬疑故事。该视频完成度极高，由创作者在不到一周内独立完成。相比以往需团队协作数月的复杂过场动画制作流程，AI 技术显著提升了包含复杂场景、角色对话及动作打斗内容的生产效率，展现了个人创作者实现高质量影视级内容的全新可能。

#Runway

阅读全文

互动讨论

评论区

围绕《如何让 AI 制作的人物对话表现的自然》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

如何让 AI 制作的人物对话表现的自然

详细步骤

相关文章

可灵 3.0 原生 4K：AI 视频终于跨过了影视工业的最后一道门槛

Runway 学院：视频如何一键转绿幕

Runway AI 短片《50 Crowns》

评论区