如何通过 Gemini 2.0 创作图像小说和电影分镜

Gemini 2.0 已深度集成 Imagen 图像生成能力,支持用自然语言(含中文)连续生成风格、人物、场景一致的分镜图像。Anu Aakash 仅凭情节描述、镜头要求与闪回指令,就高效产出多组电影级分镜,零绘画基础也能完成图像小说与影视前期创作,现通过 Google AI Studio 或 Gemini 免费使用。

发布于2025年3月15日 12:28
编辑零重力瓦力
评论0
阅读57

虽然 Gemini 没有明确表示具有绘画功能,但 Google 实际上已经将它的 AI 绘画模型 Imagen 融入到了 Gemini 的对话进程中。而且,在一个聊天进程中生成的图像能够实现人物、场景以及绘画风格的一致性和连续性。

AI 创意达人 Anu Aakash 通过 Gemini 的这项功能实现了电影分镜的制作,效果令人惊艳。

1. 首先她告诉 Gemini 想要创作影片的主要内容:

我想要一个关于一个孤独的男人在冥王星上的电影场景,他幻想着自己在地球上的幸福生活。
now i want movie scene about one lonely man on pluto, imagining his happy life on earth

根据这句提示,Gemini 一次性生成了 8 个分镜画面,每个画面都有详细的文字描述。

2. 接着她告诉 Gemini 之前画面中人物的动作,并指出以 5 个不同的镜头角度拍摄:

好的,现在他正在拼命地四处奔跑,寻找水源,动作场景,用5个不同的摄像机角度拍摄。
ok now he is running desperately, all around, for water, action scene, 5 frames in different camera angels

3. 最后 Anu 告诉 Gemini 故事的结局,并让 Gemini 自己思考人物走到这一结局的具体过程,并明确要求通过 10 个 画面进行表达。

好的,现在是闪回,展示他是如何来到这里的。他是如何被洗脑,以为会过上更好的生活,用10幅画面呈现。
ok now a flash back of how he ended up here. how he was brainwashed for a better life, 10 images

通过 Gemini 生成影片分镜,不需要任何 AI 绘画的技巧,甚至无需描述影片的细节,只需要通过自然语言(支持中文)描述影片的主要内容和情节走向。非常适合用来制作图像故事和电影分镜!

目前可以通过 Google AI Studio 和 Gemini 两个方式免费使用这项功能。

Google AI Studio 访问地址:https://aistudio.google.com/
Gemini 访问地址:https://gemini.google.com/

相关文章

高级提示词实用指南:打造精准高质量 AI 图像
智能体工程
2026年5月9日
0 条评论
小创

高级提示词实用指南:打造精准高质量 AI 图像

文章指出 AI 图像生成效果不佳的根本原因在于提示词质量,而非工具本身。核心观点是使用结构化描述替代模糊指令,将“主体+环境+风格+光线+细节”五个维度纳入提示词。描述越具体, AI 生成方向越明确,随机性越低。常见问题包括概念混搭、关键词堆砌、忽视光线设定等。实用技巧是把提示词当作向朋友描述画面,保持语义连贯。提示词质量直接影响点击率,这种结构化思维与写产品需求文档、设计简报的逻辑相同。

#图像生成
阅读全文
Gemini File Search 支持图片了:多模态 RAG 从此不只是文本检索
AI 产品工具
2026年5月6日
0 条评论
零重力瓦力

Gemini File Search 支持图片了:多模态 RAG 从此不只是文本检索

5 月 5 日,Google Gemini API 的 File Search 新增多模态检索、元数据过滤及页码引用功能。核心在于引入原生多模态嵌入模型,支持直接对图片、图表进行语义搜索,无需依赖 OCR。该托管服务大幅降低自建 RAG 系统的开发门槛,适合需处理大量视觉资料的企业或开发者。不过需注意其暂不支持音视频格式,且一旦选定嵌入模型无法无缝升级。

#RAG#Gemini#Google
阅读全文
Google 发布 Gemini Enterprise 智能体平台
AI 产品工具
2026年5月3日
0 条评论
小创

Google 发布 Gemini Enterprise 智能体平台

Google 发布新版 Gemini Enterprise ,将其从聊天工具升级为面向大型企业的统一智能体平台。新平台整合了应用开发入口 Agent Platform 、员工使用入口及安全治理框架,支持开发者、 IT 团队和知识工作者构建、管理和治理跨工作流的 AI 智能体。平台整合 200 多个模型,提供低代码工具、多智能体系统及长时运行能力,并配备身份认证、注册与策略执行等完整安全机制。 Google 此举旨在解决企业 AI 碎片化问题,但平台越完整也意味着企业越容易被锁进生态。

#Google#Gemini
阅读全文
互动讨论

评论区

围绕《如何通过 Gemini 2.0 创作图像小说和电影分镜》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。