Claude提示词被扒Karpathy提出LLM新学习范式
Claude的系统提示词最近被扒上了GitHub,全文将近1.7万字、2.4万个token,详细定义了模型的行为风格、工具使用方式、回答策略等等。【图1】
虽然被称作“泄漏”,但Claude的提示词本身在官方页面上是可查的。【图2】
而真正引发热议的,是大神Karpathy的点评。他认为这份Claude提示词文档,暴露了LLM目前在“学习方式”上的核心问题。
他说,当前主流的大模型学习方式,还停留在“像RLHF(强化学习)这种方法调完就完”的阶段,缺乏模拟人类经验积累的机制。于是他提出一个新思路:系统提示学习(System Prompt Learning)。【图3】
简单来说,新范式的思路就是——
- 用系统提示给LLM写“备忘录”,帮助它记住问题解决策略;
- 像人一样形成长期记忆,遇到相似问题能快速调取并泛化;
- 提示词不仅是“设定”,还能成为模型不断调整自我行为的“自主策略层”。
这种方式的好处在于,提示词可以随时人工检查、更新,既具备“测试时训练”的能力,又比权重微调更安全灵活。
然而反对者认为,这种方法只是变相“手动喂知识”,大模型自身并不理解提示内容,是否真的形成“学习”还有待验证。【图4】
回到Claude这份超长提示词来,里面大约80%的内容都和工具使用有关,比如如何引用、如何使用搜索、遇到日期类问题该怎么处理等等。还有一些是热修内容,补充知识截止点之后的重要信息。
这种“全手工打造”的提示体系,让Claude有了不一样的体验。
正因如此,更凸显出LLM在自我学习、自主演化上的局限。而Karpathy提出的新思路,或许会是下一波AI范式的起点。
Claude提示词泄漏版:
Claude提示词官方版: