字节推出新一代视频生成模型:Goku

字节推出视频生成模型Goku及广告专用版Goku+,视频质量媲美Sora与Veo 2;Goku+支持20秒以上生成,手部动作稳定、表情生动,可实现人货互动与产品图转视频,广告制作成本降低100倍。

发布于2025年2月14日 06:07
编辑零重力瓦力
评论0
阅读24

字节推出新一代视频生成模型:Goku。除了标准的视频生成之外,还有专用于广告制作的基础模型 Goku+,视频质量十分出色,不亚于Sora 和 Veo 2。

文生视频

This close-up shot of a chameleon showcases its striking color changing capabilities. The background is blurred, drawing attention to the animal’s striking appearance.
这段特写镜头展示了一只变色龙惊人的变色能力。背景经过虚化处理,使观众的目光集中在这只动物引人注目的外观上。

横屏视频

A pig flying in the blue sky.
一只猪在蓝天中飞翔

古诗生成的视频

春花秋月何时了,往事知多少。小楼昨夜又东风,故国不堪回首月明中。
When will the spring flowers and autumn moon end? How much do we know of the lost years? Last night, the east wind again visited the small tower. I dare not look back at my old country in the moonlight.

肖像视频

The video begins with a realistic capture, transitioning from a mid-range view to a close-up as the camera zooms in from a distance and then remains focused on the subject. The main character is a charming gray squirrel perched on the trunk of a large tree. The squirrel is sitting on a branch, attentively gazing at its surroundings while slowly nibbling on food. The scene features abundantly green trees and yellow leaves, creating beautiful light and shadow effects on the ground and nearby structures. The environment is a tranquil park with ample lighting and a serene atmosphere.
视频从一个写实的画面开始,镜头从中景逐渐拉近至特写,最终聚焦在主体上。主角是一只可爱的灰色松鼠,栖息在一棵大树的树干上。它坐在树枝上,专注地观察周围环境,同时缓慢地咀嚼着食物。画面中绿树成荫,黄叶点缀,形成美丽的光影效果,映照在地面和周围的建筑物上。整个环境是一个宁静的公园,光线充足,氛围祥和。

以下视频采用了:Goku+。这款新的视频基础模型,基于 Goku,对人和产品的广告场景进行了大量优化,和传统广告制作相比,成本能够节省100倍。

Goku+:文生视频主播

能够生成超过 20 秒的视频,并展现人物稳定的手部动作以及生动的面部表情和肢体动作。

A young man dressed in a red cardigan over a white shirt, sitting in front of a festive background decorated with traditional Chinese elements such as red lanterns and decorations. The man is smiling and appears to be speaking or presenting, with an open and friendly expression. The setting suggests a celebratory or cultural theme, possibly linked to Chinese New Year.
一位年轻男子身穿红色开衫,内搭白色衬衫,坐在一个充满节日氛围的背景前。背景装饰着传统的中国元素,如红灯笼和节庆装饰。男子面带微笑,似乎正在讲话或进行演示,表情开放而友好。整个场景营造出一种庆祝或文化主题的氛围,可能与春节相关。

Goku+ 将产品图片转换为视频片段

Goku+ 实现产品与人互动

Goku+ 优化广告场景

项目地址:https://saiyan-world.github.io/goku/

相关文章

Hermes 超越 OpenClaw,背后是两种哲学的正面交锋
AI 产品工具
2026年5月16日
0 条评论
零重力瓦力

Hermes 超越 OpenClaw,背后是两种哲学的正面交锋

Hermes Agent 以单日 2240 亿 token 的处理量超越 OpenClaw,登顶开源 AI 智能体榜首。两者代表不同发展哲学:OpenClaw 侧重“连接一切”,拥有庞大生态但近期遭遇严重安全危机;Hermes 主打“自我进化”,通过自动反思生成技能并自主优化库,实现效率提升。尽管 OpenClaw 在广度上仍具优势,但 Hermes 凭借自学习机制和安全改进迅速崛起。未来趋势或指向两种哲学的融合,即兼具广泛连接与自主进化能力的智能体。

#Hermes Agent#OpenClaw#智能体框架
阅读全文
2026 国产大模型中文文案能力深度对比分析
AI 产品工具
2026年5月13日
0 条评论
零重力瓦力

2026 国产大模型中文文案能力深度对比分析

2026 年国产大模型中文文案能力迎来新标杆。评测显示,Kimi K2.6 以最低 "AI味” 和最高创意评分领跑,最接近人类写作风格。DeepSeek V4 Pro 凭借极低重复率和超长上下文,成为长文与 SEO 内容首选。GLM 5.1 则在指令遵循上表现最强,适合严格格式约束场景。文章详细对比了六款主流模型的规格、基准数据及适用场景,为品牌营销、内容创作团队提供选型参考。

#AI 模型#开源模型
阅读全文
如果你还没用过 OpenClaw,2026.5.2 版是一个好起点
AI 产品工具
2026年5月12日
0 条评论
零重力瓦力

如果你还没用过 OpenClaw,2026.5.2 版是一个好起点

OpenClaw 2026.5.2 稳定版发布,核心策略转向“做减法”。xAI Grok 4.3 成为默认模型,赋予智能体实时信息获取能力。架构上,插件与诊断模块外移,实现按需安装,显著降低体积并提升维护效率。Gateway 热路径性能优化修复了 268 个 Bug,大幅改善启动速度与运行稳定性。新增 SDK tools.invoke RPC 接口,打通外部系统调用通道,标志着框架从个人助手向基础设施演进。

#OpenClaw#Grok
阅读全文
互动讨论

评论区

围绕《字节推出新一代视频生成模型:Goku》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。