ElevenLabs Eleven Music 最佳提示指南

本指南总结了在使用 Eleven Music 模型时,最有效的提示词编写方法,涵盖了流派与创意、乐器与人声分离、音乐控制、结构时长与歌词等方面。

该模型能够理解你的意图,并根据你的目标生成完整、具备上下文感知能力的音频内容。即使是像 “运动鞋品牌广告” 或 “带旁白的宁静冥想” 这样简单的描述,也能有效引导模型生成符合你需求的音乐氛围、结构和内容。

流派与创意表达

Eleven Music 模型能够准确把握音乐流派的特点和情感基调。你可以使用抽象的情绪描述(如“诡异感”、“不祥”),也可以采用详细的音乐术语(如 “刺耳的小提琴尖叫配低沉的低音” )。

提示词的长度和细节不一定与输出质量直接相关。想要获得更具创意和惊喜的音乐效果时,建议尝试用简洁、富有画面感的关键词,让模型自由发挥、自由作曲。

乐器与人声分离

当前 v1 版本模型无法直接从完整音轨中生成乐器分轨(stem)。如果你需要更高的分轨可控性,可以通过更有针对性的提示词和结构实现:

  • 在乐器前加上 “solo” 一词,例如:“solo 电吉他”、“C 小调 solo 钢琴”。
  • 对于人声,在描述前加上 “a cappella”,如:“a cappella 女声”、“a cappella 男声合唱”。

想要进一步提升分轨质量和控制力,可以在提示词中加入调性、节奏(BPM)和音乐风格描述,例如:“A 大调,90 BPM,灵魂感且原始的 a cappella 人声”。

总之,描述越具体,越能引导模型输出更贴合你需求的内容。

音乐控制

Eleven Music 模型可以准确遵循你的节奏(BPM)和调性设置。为了获得更好的时间与和声控制,可在提示词中添加如“130 BPM”、“A 小调”等节奏和调性提示。

还可以通过“原声、现场、故障、轻声、激烈”等情绪词汇影响人声表现和整体氛围。

模型还支持多位歌手的和声表达,例如用“C 大调双人合唱”来指定人声编排。

总体而言,提示词越详细,输出的可控性和表现力就越高。

结构时长与歌词控制

你可以明确指定歌曲时长(如“60秒”),或者选择自动模式让模型自行决定音乐长度。如果没有提供歌词,模型会根据你选择或自动检测的时长,生成结构合理的歌词。

默认情况下,大多数音乐提示词都会包含歌词。如果你只需要纯音乐,请在提示词中加入“仅限器乐”(instrumental only)。当然,你也可以自定义歌词,实现更有创意的控制。模型会结合你的歌词和提示时长,决定人声的结构和出现位置。

如果希望控制人声的进入或退出时间,可以添加例如“歌词于15秒开始”、“1分45秒后仅器乐”等明确的时间指示。

模型支持多语言歌词生成。若需更改歌曲语言,可以在 UI 中追加“改为日语”或“翻译为西班牙语”等后续指令。

示例提示词

Eleven Music 支持结合意图进行创造性音乐生成,不止于简单的音乐描述。以下为部分示例:

视频游戏音乐控制

睫毛膏音频广告创意

现场独立摇滚演出

原文地址

Prompting Eleven Music