AI 技术进阶
微调 vs 提示词——你应该选哪个?
提示词快速且免费;微调永久调整模型行为。知道何时选择各方法可以为你节省数千美元和数周工作。
TL;DR: 提示词快速且免费;微调永久调整模型行为。知道何时选择各方法可以为你节省数千美元和数周工作。
提示词:用指令引导
提示词是指在推理时编写指令来引导模型行为。系统提示词、少样本示例、思维链——这些都是提示词技术。零成本、即时迭代、适用于任何开箱即用的模型。
system promptfew-shotchain-of-thoughtinference
微调:改变权重
微调在你的自定义数据集上重新训练基础模型,将新行为烘焙到模型权重中。结果:更低的推理延迟(需要更短的提示词)、一致的风格,以及学习预训练时不可用数据的能力。
model weightsfine-tuning datasetbase modelinference latency
决策框架
选择提示词:当你在原型阶段、任务简单,或数据频繁变化时。选择微调:当你有 1,000+ 高质量示例、需要在数千次调用中保持一致的格式/语气,或在认真尝试后提示词已失败时。
"提示词优先"原则
OpenAI、Anthropic 和 Google 都建议:在微调之前穷尽提示词方法。大多数看似需要微调的任务可以通过更好的提示词解决——系统指令 + 上下文示例 + 思维链推理。