零样本提示
不提供任何示例,直接让模型完成任务
什么是零样本提示?
如今,经过大量数据训练并调整指令的大语言模型能够执行零样本任务。零样本提示是指在不向模型提供任何示例的情况下,直接提示模型给出回答。
将评论分类为好评、中评或差评。
评论:这家店的螺蛳粉味道挺正宗的,就是排队太久了。
评分:
输出:
中评
在上面的提示中,我们没有向模型提供任何示例——这就是零样本能力的作用。
指令调整与零样本能力
指令调整已被证明可以改善零样本学习。指令调整本质上是在通过指令描述的数据集上微调模型的概念。此外,RLHF(来自人类反馈的强化学习)已被采用以扩展指令调整,其中模型被调整以更好地适应人类偏好。这一最新发展推动了像 DeepSeek、豆包等国产大模型的涌现。
零样本提示的局限
当零样本提示不起作用时,建议在提示中提供演示或示例,这就引出了少样本提示技术。零样本提示对于简单、明确的任务效果很好,但对于需要更复杂推理的任务,往往需要更高级的提示方法。