Blog

  • 提示词构建技巧-Yechiel整理

    设计有效的提示词以指导模型执行期望任务的方法被称为提示工程(见下图:提示工程全景)。 提示工程具有一定高度,它具有指引性且有方法论。其核心在于构建撰写提示词的逻辑,即思考如何写出更优质的提示词,而这首先需要有较高的思维高度。在工程化方面,则是思考如何让代码将思维和方法实际呈现出来。因此,一方面要具备思维和方法,另一方面要让程序员将想法落地实现。 提示词和提示工程不会过时,因为它是大模型不断迭代优化及产品化的关键,是将其改造成人人可用的智能体的过程。2025 年,随着模型能力提升,提示工程愈发重要。简单来说,在不改变模型效果的前提下,开展提示工程能让模型更易用、更通用,使普通人能更好理解问题,这正是提示工程的价值所在。 经过最近的实践归根结底还是基于业务的结构化、模板化的 Prompt 的性能更好! 一些框架 为大家提供一些参考模板框架,例如 CRISP 框架。使用该框架时,首先要描述决策主体,明确信息要求。若想让模型处理的问题较为复杂,就需将问题信息阐述得更加清晰,这样模型才能有效解决问题。要先尝试把需求表述清楚,接着可添加一些备注说明,最后明确输出模式。 这些是常见的框架类型,选择其中任意一个框架来操作均可,但必须按照相应步骤进行,而操作过程中的指导思想就是之前所提及的内容。 提示技术 了解这些对于后面的掌握有帮助,建议阅读。 1. 零样本提示 指令调整已被证明可以改善零样本学习 Wei等人(2022)。指令调整本质上是在通过指令描述的数据集上微调模型的概念。此外,RLHF(来自人类反馈的强化学习)已被采用以扩展指令调整,其中模型被调整以更好地适应人类偏好。这一最新发展推动了像 ChatGPT 这样的模型。 2. 少样本提示 零样本设置,大模型在更复杂的任务上表现不佳。少样本提示可以作为一种技术,以启用上下文学习,在提示中提供演示以引导模型实现更好的性能。演示作为后续示例的条件,我们希望模型生成响应。 根据 Touvron et al. 2023 等人的在 2023 年的论文,当模型规模足够大时,小样本提示特性开始出现 (Kaplan et al., 2020)。 让我们通过 Brown 等人 2020 年 提出的一个例子来演示少样本提示。在这个例子中,任务是在句子中正确使用一个新词。 提示: 输出: 根据Min等人(2022)的研究结果,以下是在进行少样本学习时关于演示/范例的一些额外提示: 少样本提示的限制 标准的少样本提示对许多任务都有效,但仍然不是一种完美的技术,特别是在处理更复杂的推理任务时。之前的任务: 如果我们再试一次,模型输出如下: 这不是正确的答案,这不仅突显了这些系统的局限性,而且需要更高级的提示工程。 让我们尝试添加一些示例,看看少样本提示是否可以改善结果。 提示: 输出: 这没用。似乎少样本提示不足以获得这种类型的推理问题的可靠响应。上面的示例提供了任务的基本信息。引入的任务类型涉及几个更多的推理步骤。换句话说,如果我们将问题分解成步骤并向模型演示,这可能会有所帮助。最近,思维链(CoT) 已经流行起来,以解决更复杂的算术、常识和符号推理任务。 总的来说,提供示例对解决某些任务很有用。当零样本提示和少样本提示不足时,这可能意味着模型学到的东西不足以在任务上表现良好。从这里开始,建议开始考虑微调模型或尝试更高级的提示技术。 3. 思维链(CoT) 图片来源:Wei等人(2022)…

    READ MORE u003cspan aria-hidden=’true’u003e→u003c/spanu003e