什么样的图片能生成最佳的 AI 视频效果

想让AI视频动得自然?关键在原图:需含明确运动线索(如旋转车轮、行走脚步)、高分辨率,并搭配动作关键词提示词(如[SPINNING WHEELS]、[WALKING TOWARDS US]),为Runway、可灵等工具提供动态起点。

发布于2024年11月23日 07:39
编辑零重力瓦力
评论0
阅读30

要生成高质量,动态效果好的 AI 视频,基础图片非常重要。那么什么样的图片生成的 AI 视频效果最好?著名 AIGC 达人 Rory Flynn 分享了自己的秘籍。

三条 AI 视频制作基本原则

  1. 参考图像是决定视频质量最重要的因素
  2. 静态图像 + 动作能够实现更好的视频动态
  3. 图像越高清,视频细节越丰富

核心原则

用于生成视频的基础图像能够展示部分主体的运动状态,为视频生成工具(如 Runway 、 可灵等)提供一个起点,以便它们在此基础上进行创作。

例子: “旋转轮子” 的汽车 vs “静态轮子” 的汽车

Midjourney 提示词

[BOKEH MOTION], land rover defender [DRIVING] in cusco peru, [SPINNING WHEELS] off-balanced composition, contrasting light and dark tones, color blocking, 35mm style --ar 5:3 --s 200
[虚化动态],路虎汽车 [行驶] 在库斯科秘鲁,[旋转轮子],不平衡的构图,光影对比,色彩分块,35mm 风格 --ar 5:3 --s 200

Runway 提示词

the camera follows a car driving to the left
相机跟随一辆向左行驶的汽车

行走示例

图像 1: 运动中的脚,形成了平滑的过渡
图像 2: 静态的脚,这导致动作表现困难

正确的 Midjourney 提示词

editorial photo, front view closeup, orange hiking boots [WALKING TOWARDS US] on a dirt path in the alpine forest, [BOKEH MOTION], late November setting, wet leaves and bare trees, high contrast photography, contrasting colors, 35mm high precision photo --ar 16:9
社论照片,正面特写,橙色登山靴 [朝我们走来] 在阿尔卑斯森林的小路上,[虚化动态],11 月下旬,湿叶子和光秃的树木,高对比摄影,色彩对比,35mm 高精度照片 --ar 16:9

不正确的 Midjourney 提示词

editorial photo, front view closeup, orange hiking boots on a dirt path in the alpine forest, late November setting, wet leaves and bare trees, high contrast photography, contrasting colors, 35mm high precision photo --ar 16:9
社论照片,正面特写,橙色登山靴在阿尔卑斯森林的小路上,11 月下旬,湿叶子和光秃的树木,高对比摄影,色彩对比,35mm 高精度照片 --ar 16:9

Runway 提示词

slow motion shot of orange boots walking towards us on a hiking trail in an alpine forest, dynamic natural motion 35mm style
慢动作镜头,橙色靴子在阿尔卑斯森林的徒步小路上朝我们走来,动态自然的运动 35mm 风格

动作/表情示例

关注角色/场景动作 + 角色表情。

Midjourney 提示词

[BOKEH MOTION], medium closeup of a woman [LOSING HERSELF IN THE MUSIC], tulum jungle rave atmosphere, [SUBTLE NEON LIGHT STREAKS] painting her face, 16mm, asymmetrical composition, moon light, silhouettes, techno --ar 16:9
[虚化动态],女性的中近景 [沉浸在音乐中],图卢姆丛林派对氛围,[微妙的霓虹灯光条纹] 在她的脸上,16mm,非对称构图,月光,剪影,电子音乐 --ar 16:9

Runway 提示词

handheld slow motion shot of a woman cheering in a tulum jungle rave, silhouette lighting, 35mm style
手持摄像机,慢动作,女性在图卢姆丛林派对中欢呼,剪影灯光,35mm 风格

相关文章

上下文工程:当提示词工程装不下整个智能体时,谁来接管 AI 的 “工作台”
智能体工程
2026年5月15日
0 条评论
零重力瓦力

上下文工程:当提示词工程装不下整个智能体时,谁来接管 AI 的 “工作台”

“上下文工程” 正取代 “提示词工程”,成为 AI Agent 开发的核心范式。随着模型能力提升、Agent应用普及及企业合规需求,交互重点从单轮指令转向多步骤工作流中的动态信息编排。该领域涵盖系统指令、用户输入、检索知识、对话历史及工具定义五层结构。由于上下文窗口资源有限且易出现中毒、分心等失败模式,需通过ACE框架实现上下文的自进化与增量更新。实操建议包括外部化状态、按需检索、压缩累积及隔离多Agent上下文。本质上,上下文工程是提示词工程的超集,标志着 AI 开发进入以系统架构和状态管理为主导的工程时代。

#上下文工程#智能体工程#提示词工程
阅读全文
读懂 LLM : AI 是如何“思考”的,又该如何高效使用
智能体工程
2026年5月13日
0 条评论
小创

读懂 LLM : AI 是如何“思考”的,又该如何高效使用

掌握大语言模型(LLM)的核心在于理解其底层机制与交互技巧。首先,Token 是模型处理文本的最小单位,直接影响输入输出长度及费用。默认的非确定性模式赋予模型创意,但也导致结果不可预测。其次,温度、最大 Token 数和 Top-p 三个参数共同调控模型的随机性、回复长度及词汇选择范围,用户可根据精准或创意需求灵活调整。此外,受限于上下文窗口,模型仅能记忆当前对话片段,超出部分会被丢弃。最后,提示词质量决定输出效果,高质量的提示词应包含清晰指令、背景信息及期望格式,通过缩小猜测空间来提升回答的准确度。

#提示词工程
阅读全文
提示工程: AI 安全 TryHackMe
智能体工程
2026年5月13日
0 条评论
小创

提示工程: AI 安全 TryHackMe

TryHackMe 推出“提示词工程: AI 安全”实战房间,系统教授与大语言模型高效沟通的技能。课程涵盖 LLM 处理机制( Token 、非确定性)、提示词结构(指令、上下文、格式、约束)、系统与用户提示词的区别及注入攻击风险、进阶技术( CoT 、 Zero/Few-shot )。通过六道安全场景挑战演示从分类到漏洞审查的实战技巧,强调将开放任务压缩为可执行指令的思路。

#提示词工程
阅读全文
互动讨论

评论区

围绕《什么样的图片能生成最佳的 AI 视频效果》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。