零样本提示

不提供任何示例,直接让模型完成任务

什么是零样本提示?

如今,经过大量数据训练并调整指令的大语言模型能够执行零样本任务。零样本提示是指在不向模型提供任何示例的情况下,直接提示模型给出回答。

将评论分类为好评、中评或差评。

评论:这家店的螺蛳粉味道挺正宗的,就是排队太久了。

评分:

输出:

中评

在上面的提示中,我们没有向模型提供任何示例——这就是零样本能力的作用。

指令调整与零样本能力

指令调整已被证明可以改善零样本学习。指令调整本质上是在通过指令描述的数据集上微调模型的概念。此外,RLHF(来自人类反馈的强化学习)已被采用以扩展指令调整,其中模型被调整以更好地适应人类偏好。这一最新发展推动了像 DeepSeek、豆包等国产大模型的涌现。

零样本提示的局限

当零样本提示不起作用时,建议在提示中提供演示或示例,这就引出了少样本提示技术。零样本提示对于简单、明确的任务效果很好,但对于需要更复杂推理的任务,往往需要更高级的提示方法。

下一步