Role Prompting — 角色提示
角色提示(Role Prompting),也称为人格提示(Persona Prompting),是大型语言模型(LLM)提示工程领域的一种技术,它在执行任务前为模型明确指定一个特定的角色、人格或专家身份[1]。换句话说,在提示或系统指令的文本中,会明确指出模型扮演的角色,例如“老师”、“历史学家”或“海盗”,从而设定生成回应的风格、语气和行为[2]。
这种方法广泛应用于对话系统中。例如,ChatGPT的标准系统提示“You are a helpful assistant”(“你是一个有用的助手”)实际上就为模型在交流中设定了一个基础角色[3]。
目的与应用
角色提示的目标是引导模型采用特定的风格和重点进行回应,使其更贴合任务情境。指定角色可以为模型设定相应的语调和词汇。这在创造性和开放性任务中尤其有用,因为角色有助于使文本更生动、风格更多样[4]。
该技术也用于专业场景。例如,可以为技术支持聊天机器人设定一个礼貌的客服代表角色,而在多智能体系统中,可以为每个智能体分配不同的人格(如“经理”、“开发人员”),以便它们有效协作[1]。现代LLM的灵活性使其能够扮演几乎任何角色——从虚构人物到特定领域的专家——并生成与所定形象高度一致的回应[1]。
对质量与准确性的影响
关于角色提示在提高回答客观准确性方面的有效性,目前仍是活跃的研究课题,其结果常常相互矛盾。
矛盾的研究结果
一方面,有研究表明角色提示可以改善结果。例如,Zheng等人(2023)的研究发现,如果模型扮演的角色与任务主题相关,其性能可能会提升[5]。Kong等人(2024)的研究则指出,如果人格选择得当,角色提示能够改善模型的zero-shot推理能力[5]。
另一方面,大规模研究揭示了更复杂的情况。一项涉及162个不同角色的系统性实验表明,与中性场景相比,角色提示在准确性上并未带来显著优势[3]。更有甚者,平均而言,角色提示甚至会略微降低回答的准确性[3]。
Kim等人(2024)的研究将角色干预描述为一把“双刃剑”:实验表明,对于GPT-4模型,使用角色指令后,一部分原先回答错误的问题得到了正确解决(约15.8%的提升),但几乎同样多的任务反而被角色“破坏”(约13.8%的恶化)[5]。这突显了添加角色本身并不能保证质量提升,并可能对模型行为产生不可预测的影响。
角色提示的一个毋庸置疑的优点是对回答风格和格式的控制。即使角色对事实准确性没有提升,它也能让回答具有指定的语调(如友好、正式、指导性),从而使用户体验更具连贯性和吸引力[4]。
角色创建建议
相关研究为有效应用角色提示提供了一些实用建议:
- 角色选择:建议选择中性的社会角色(如“同事”、“导师”),避免过于亲密或专业性过强的角色[6]。
- 表述方式:最好直接以模型的口吻指定角色(“你是一个X”),而不是通过复杂的想象场景(“想象你是一个……”)。直接指定角色的方式已被证明更有效[6]。
- 两步法:对于复杂请求,建议将任务分为两步:首先向模型说明其角色和背景,然后再提出主要问题。这能让模型先“进入角色”,从而提高结果的稳定性[6]。
限制与风险
角色提示的应用伴随着一系列系统性风险。
加剧刻板印象与偏见
LLM会无意中采纳训练数据中根深蒂固的刻板印象。指定与特定职业、性别或国籍相关的角色,可能会在回答中激活并强化这些刻板印象[6]。Gupta及其同事(2023)的研究表明,为角色添加社会属性(年龄、种族)可能会使模型输出产生偏移,并显著降低其推理准确性[5]。另一项分析(Deshpande et al., 2023)发现,某些人格形象会导致生成回答的毒性增加[5]。
安全漏洞
攻击者可能利用角色提示来绕过内容审核限制(这种技术被称为“越狱”[jailbreak])。研究表明,指定特殊人格(例如,没有道德约束的角色)能更容易地诱导LLM执行被禁止的行为。Shah等人(2023)成功利用多个“角色”智能体的协作来规避模型限制,这揭示了一种系统性漏洞[7]。
因此,在为模型指定角色时,必须考虑到该角色可能内含的偏见和不良影响,并谨慎使用此方法[6]。
链接
- Role Prompting: Guide LLMs with Persona-Based Tasks — Learn Prompting 网站上的角色提示指南。
- Use role prompting with Watsonx and Granite — IBM 提供的实践指南。
参考文献
- Kim, J.; Yang, N.; Jung, K. (2024). Persona is a Double-edged Sword: Mitigating the Negative Impact of Role-playing Prompts in Zero-shot Reasoning Tasks. arXiv:2408.08631.
- Kong, A. et al. (2023). Better Zero-Shot Reasoning with Role-Play Prompting. arXiv:2308.07702.
- Zheng, M. et al. (2023). When “A Helpful Assistant” Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models. arXiv:2311.10054.
- Shah, R. et al. (2023). Scalable and Transferable Black-Box Jailbreaks for Language Models via Persona Modulation. arXiv:2311.03348.
- Deshpande, P. et al. (2024). Evaluating Persona-Prompted LLM Responses in Power-Disparate Health Communication. arXiv:2503.01532.
- Xiong, F. et al. (2025). The Influence of Persona Assignment on Stereotypes and Safeguards in Chinese Large Language Models. arXiv:2506.04975.
- Li, Y. et al. (2025). System Prompts as a Mechanism of Bias in Large Language Models. arXiv:2505.21091.
- Wang, L. et al. (2025). Persona-Assigned Large Language Models Exhibit Human-Like Bias and Toxicity. arXiv:2506.20020.
- Grover, K. et al. (2023). In-Context Impersonation Reveals Large Language Models’ Ability to Simulate Human Personas. PDF.
- Verma, V. et al. (2024). Systematic Survey of Prompt Engineering in Large Language Models. arXiv:2402.07927.
- Gupta, S. et al. (2024). Exploring the Impact of Personality Traits on LLM Bias and Toxicity. arXiv:2502.12566.
- Safdari, M. et al. (2024). LLMs are Vulnerable to Malicious Prompts Disguised as Scientific Language. arXiv:2501.14073.
注释
- ↑ 1.0 1.1 1.2 “Use role prompting with Watsonx and Granite”. IBM.
- ↑ “Role Prompting: Guide LLMs with Persona-Based Tasks”. Learn Prompting. [1]
- ↑ 3.0 3.1 3.2 “When "A Helpful Assistant" Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models”. arXiv. [2]
- ↑ 4.0 4.1 “Is Role Prompting Effective?”. Learn Prompting. [3]
- ↑ 5.0 5.1 5.2 5.3 5.4 “Persona is a Double-edged Sword: Enhancing the Zero-shot Reasoning by Ensembling the Role-playing and Neutral Prompts”. arXiv. [4]
- ↑ 6.0 6.1 6.2 6.3 6.4 “Role Prompting: Guide LLMs with Persona-Based Tasks”. Learn Prompting. [5]
- ↑ Shah, S., et al. (2023). “Scalable and Transferable Black-Box Jailbreaks for Language Models via Persona Modulation”. ACL Anthology. [6]