#Karpathy解释上下文工程##AI要用好需要提供好语境# 用“上下文工程”

量子位 2025-06-26 17:56:35

#Karpathy解释上下文工程##AI要用好需要提供好语境# 用“上下文工程”取代“提示词工程”,大佬们纷纷转发赞同! Shopify的CEO不久前在X上发帖感叹,比起“提示词工程”,还是喜欢“上下文工程”这个概念。原因非常简单: “上下文工程”更准确地描述了核心技能:为任务提供所有必要语境的艺术,使得大语言模型能够合理解决问题。【图1】 此话一出,瞬间引来了许多人的共鸣,大家都纷纷表示:比起那些“答对就给小费”的小技巧,与AI打交道的核心,应该是让AI能够获取解决问题的关键线索。【图2】 像和一个人交流一样,如果只给他简单的指令(提示词),他可能无法完全理解你的意图。但如果你提供更多背景信息、具体示例(上下文),他就能更好地领会,并给出更准确的回答。 卡帕西也出现在了转发区,解释了自己对于这一问题看法:【图3】 他解释道,尽管人们通常将“提示”理解为日常使用大模型时输入的简短任务描述。但在所有工业级大模型应用中,上下文工程实则是一门精妙的艺术与科学——它需要精确地为上下文窗口填充恰到好处的信息。 这项工作涉及:任务描述与解释、示例演示、检索增强生成(RAG)、相关(可能是多模态的)数据、工具调用、状态记录与历史信息、内容压缩... 信息过少或形式不当,模型就缺乏最优表现所需的语境;信息过载或无关内容过多,则会导致成本攀升而性能下降。 要做好这一点绝非易事。需要开发者对“大模型心理学”有着近乎直觉的把握,确实是一门艺术。 此外,“上下文工程”只是新兴复杂软件层中的一小部分。一个真正的大模型应用,还需要处理更复杂的工作: 将问题精准拆分为控制流 优化上下文窗口的信息密度 调度适配不同能力维度的大模型 设计生成-验证的交互流程 以及更多——安全护栏、权限控制、效果评估、并行处理、预加载机制... 因此,所谓“ChatGPT套壳”的说法不仅过时,更是彻头彻尾的误解。 这个观点,你是否赞同呢?

0 阅读:0
量子位

量子位

关注前沿科技资讯,追踪人工智能动态