【如何用最赛博的方式测出AI已读乱回】
给大模型下长指令最怕什么?怕它记忆力不够,聊着聊着就把全局设定给忘了。有用户想了个绝妙的偏方,在全局文件里塞一条让它每句都叫“老公”的指令。只要哪天它突然不叫了,说明上下文长到把它给撑失忆了,得赶紧重置。
这事看着像是在大模型时代搞赛博恋爱,里子其实是一个极其硬核的技术直觉。大模型现在最缺的不是逻辑,而是长对话里的专注力。通常你要写一段复杂的测试脚本才能看出它有没有漏掉长文本的信息,但这位用户直接把技术死角转化成了日常的直觉反应。它就像摇滚乐队在演出合同里故意写上不吃某种颜色的巧克力豆,用来测主办方有没有仔细看合同一样。
不要觉得这只是个段子,这才是人与人工智能博弈的高段位玩法。用情绪和日常直觉去驯服那些冷冰冰的上下文窗口。当技术本身开始变得不可预测时,最有效的监控手段往往来自最朴素的人性。
