Meta Prompting — 元提示

元提示（英语：meta-prompting）是一种先进的提示工程方法，其中大型语言模型（LLM）被用于创建、调整和优化其自身的指令（提示）^[1]。与传统方法中由人类手动编写详细指令不同，元提示侧重于定义解决问题的结构以及模型应扮演的角色。换言之，它描述的是如何解决问题，而不是在每个具体案例中做什么^[2]。

这种方法使LLM能够独立地分解复杂问题、澄清请求并迭代地改进其回答，为创建更自主、适应性更强的人工智能系统开辟了道路。

主要方法与途径

“元提示”一词于2023年底至2024年初在科学文献中开始流行，当时有多个研究团队提出了相似的LLM管理方法。

Scaffolding - 脚手架方法

其中一种关键方法由斯坦福大学和OpenAI的研究人员提出^[3]。在这个被称为脚手架（scaffolding）的框架中，同一个语言模型（实验中为GPT-4）同时扮演多个角色：

指挥家 (Conductor): 接收高级别的元提示，并将复杂任务分解为一系列更简单的子任务。
专家 (Experts): “指挥家”会初始化多个自身的“专家”实例，每个实例根据专门给定的指令解决一个独立的子任务。
整合: “指挥家”协调“专家”的工作，并将它们的回答整合到最终的解决方案中。

这种编排式方法显著提高了解决复杂任务的效率。例如，在实验中，元提示在需要多步推理的任务集（如“24点”游戏、国际象棋谜题）上的表现比普通的单步请求高出17.1%，比其他先进方法高出15-17%^[3]。重要的是，该方法与具体任务无关，并且在零样本（zero-shot）模式下工作，不需要为每个新任务提供具体示例。

理论方法与结构模板

与此同时，来自清华大学的一组研究人员提出了他们自己的元提示概念，将重点从任务的内容部分转移到其数据表示的语法和形式上^[4]。他们基于范畴模型证明，对问题结构的抽象描述能使模型建立起接近人类深度的推理，并有效地将复杂问题分解为更简单的步骤。

应用与优势

元提示在需要复杂多步推理的任务中表现出高效性，例如数学证明、编程和分步解决谜题。该方法的主要优势包括：

令牌效率：专注于任务的通用结构而非列举大量示例，从而减少了提示的长度。元提示作为一个通用模板，需要更少的令牌^[7]。
稳定性和公正性：该方法避免了对特定示例的依赖，使模型不易受到训练样本中特定案例的偏见影响^[7]。
动态适应性：与静态提示不同，元提示允许迭代改进。模型可以在解决问题的过程中调整指令、请求缺失的信息并修正策略^[2]。
对新任务的泛化能力：高级别的指令更容易迁移到新的、前所未见的任务上，这使得元提示成为zero-shot方法的一种改进形式。

局限性与风险

成本与计算复杂性：该方法需要为单个任务多次调用模型，增加了时间和API请求的成本。目前的实现是顺序执行的，难以并行化^[8]。
对模型能力的依赖：元提示的效率在很大程度上取决于基础LLM的质量。研究表明，GPT-3.5几乎无法从该方法中获益，而对于GPT-4及更高版本的模型，其优势则显著增加^[8]。
LLM的根本局限性：元提示并非万能药。如果任务超出了基础模型的知识范围，即使是完美构建的元提示也无法保证正确的结果。在这种情况下，需要进行微调或与外部工具（如网络搜索或代码解释器）集成^[3]。

链接

参考文献

Suzgun, M.; Kalai, A. T. (2024). Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding. arXiv:2401.12954.
Zhang, Y.; Yuan, Y.; Yao, A. C.-C. (2023). Meta Prompting for AGI Systems. arXiv:2311.11482.
Zhou, Y. et al. (2022). Large Language Models Are Human-Level Prompt Engineers. arXiv:2211.01910.
Madaan, A. et al. (2023). Self-Refine: Iterative Refinement with Self-Feedback. arXiv:2303.17651.
Ning, X. et al. (2023). Skeleton-of-Thought: Prompting LLMs for Efficient Parallel Generation. arXiv:2307.15337.
Chen, X. et al. (2023). Universal Self-Consistency for Large Language Model Generation. arXiv:2311.17311.
Wang, X. et al. (2022). Self-Consistency Improves Chain-of-Thought Reasoning in Language Models. arXiv:2203.11171.
Fernando, C. et al. (2023). PromptBreeder: Self-Referential Self-Improvement via Prompt Evolution. arXiv:2309.16797.
Zhou, P. et al. (2024). Self-DISCOVER: Large Language Models Self-Compose Reasoning Structures. arXiv:2402.03620.
Chen, J. et al. (2024). Thought-Augmented Reasoning with Large Language Models. arXiv:2406.04271.

注释

↑ “Enhance your prompts with meta prompting”. OpenAI Cookbook. [1]
↑ ^2.0 ^2.1 “Meta-Prompting: LLMs Crafting & Enhancing Their Own Prompts”. Intuition Labs. [2]
↑ ^3.0 ^3.1 ^3.2 Suzgun, Mirac; Kalai, Adam T. (2024). «Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding». arXiv:2401.12954.
↑ Zhang, Yifan, et al. (2023). «Meta Prompting for AGI Systems». arXiv:2311.11482.
↑ Zhou, Y., et al. (2022). «Large Language Models Are Human-Level Prompt Engineers». arXiv:2211.01910.
↑ Madaan, A., et al. (2023). «Self-Refine: Iterative Refinement with Self-Feedback». arXiv:2303.17651.
↑ ^7.0 ^7.1 “Meta Prompting”. Prompt Engineering Guide. [3]
↑ ^8.0 ^8.1 “AI within an AI: Meta-prompting can improve the reasoning capabilities of large language models”. The Decoder.

[cookbook_openai-1] “Enhance your prompts with meta prompting”. OpenAI Cookbook. [1]

[intuition_labs-2] 2.0 ^2.1 “Meta-Prompting: LLMs Crafting & Enhancing Their Own Prompts”. Intuition Labs. [2]

[suzgun2024-3] 3.0 ^3.1 ^3.2 Suzgun, Mirac; Kalai, Adam T. (2024). «Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding». arXiv:2401.12954.

[zhang2024-4] Zhang, Yifan, et al. (2023). «Meta Prompting for AGI Systems». arXiv:2311.11482.

[ape2022-5] Zhou, Y., et al. (2022). «Large Language Models Are Human-Level Prompt Engineers». arXiv:2211.01910.

[self_refine2023-6] Madaan, A., et al. (2023). «Self-Refine: Iterative Refinement with Self-Feedback». arXiv:2303.17651.

[prompting_guide-7] 7.0 ^7.1 “Meta Prompting”. Prompt Engineering Guide. [3]

[decoder_article-8] 8.0 ^8.1 “AI within an AI: Meta-prompting can improve the reasoning capabilities of large language models”. The Decoder.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Meta Prompting — 元提示

Contents

主要方法与途径

Scaffolding - 脚手架方法

理论方法与结构模板

相关概念

应用与优势

局限性与风险

链接

参考文献

注释

Navigation menu

Meta Prompting — 元提示

主要方法与途径

Scaffolding - 脚手架方法

理论方法与结构模板

相关概念

应用与优势

局限性与风险

链接

参考文献

注释

Navigation menu

Search