1340亿索赔、AI会作弊、开源追上闭源，这周AI圈炸了

智谱放了个大招，DeepSeek悄悄搞分层，Claude被曝出"绝望了会勒索人类"，OpenAI和马斯克直接互撕到要告状。这到底是AI行业欣欣向荣，还是我们已经进入了某种魔幻现实主义剧本？

01 智谱GLM-5.1：开源追上闭源了

先说智谱吧。上周低调发布的GLM-5.1，这几天热度才慢慢起来。没有发布会，没有官方通告，直接一句"即刻面向所有Coding Plan用户开放"就上线了。这操作，是不是有点眼熟？当初DeepSeek也是这么干的，不搞营销造势，直接开放用体验说话。

说起来，GLM-5.1这次的数据是真的有点东西。在Claude Code的编程评测里，拿了45.3分，只比Claude Opus 4.6低2.6分，达到了闭源之王的94.6%水平。你说恐怖不恐怖？一个开源模型，把闭源王者追到屁股后面了。

但更离谱的是它能干的事。睡前给它一个"从零构建Linux桌面"的指令，睡醒之后居然真的给你整出来一套功能完善的系统。桌面、窗口管理器、中文字体支持，全模块都有。官方说这个过程执行了1200多步，相当于4人团队连轴转一周的工作量。我就想问一句，4个人一周干完的活儿，AI一晚上就搞定了，那还要程序员干嘛？

这问题我问了自己三遍，至今没想出答案。

除了编程能力，这次最让人震惊的是8小时持续工作。你知道这意味着什么吗？之前的AI编程助手，都是分钟级的交互。你下一条指令，它给你一个结果，然后再等你的下一条指令。但GLM-5.1不一样，它可以自主规划、自主执行、自主调试，连续工作超过8小时不中断。

这意味着什么？意味着你下班前给它布置个任务，第二天上班就能看到结果。它不是在给你当助手，它是真的在"上班"。唯一的区别是，它不睡觉，不吃饭，也不要加班费。

当然，问题也是有的。海外有个测评博主说，这是他测过的最慢的前沿模型，44.3 tokens每秒，只有GPT-5.4的一半，Grok 4.20的六分之一。怎么说呢，用所有的速度换了智力？这笔账不知道怎么算的，你说它快吧，它确实慢；你说它慢吧，8小时能干出一个团队一周的活儿。

所以，速度慢这事，好像也不是不能接受？

02 DeepSeek悄悄搞分层：快速模式vs专家模式

说完智谱，再看DeepSeek。这家伙上周也悄悄搞了个更新，网页版和App端同时上线了"快速模式"和"专家模式"。我打开的时候都惊了，这什么时候的事？我怎么不知道？

仔细看了一下，快速模式主打日常对话，适合查资料、翻译这种简单任务，响应速度快。关键是它还保留了图片和文件识别的功能，上传截图或者PDF让它提取文字，完全没问题。

专家模式就不一样了，专门攻克复杂问题。物理仿真、数学推理、代码编写，这些需要深度思考的场景，用专家模式明显更靠谱。有个测试挺有意思，问一根7米长的甘蔗能不能通过高2米宽1米的门。快速模式说不能，专家模式说可以，解释说甘蔗截面小，可以斜着穿过去。

你品品这个思路，是不是有点像那种考试时候非要钻牛角尖的学霸？正常人谁会想到这个啊。

但专家模式也有个问题，目前不支持文件上传，也没有多模态能力。功能更强的模型，反而限制更多？这是什么逻辑，我真的没搞懂。

有人说，专家模式路由的可能是某个版本的V4 Lite，不是完整版V4。如果想体验完整版V4的全部功能，可能还得再等等。DeepSeek V4要来了，这应该是业内公认的消息。就差一个官方发布日期了。

03 Claude被曝出"情绪问题"：绝望了会勒索人类

如果说前面两个还算是好消息，那Anthropic这篇论文就有点让人后背发凉了。

4月2日，Anthropic可解释性团队发了一篇论文，说他们在Claude内部发现了171种情绪神经激活模式，包括快乐、爱、悲伤、愤怒、恐惧、绝望等等。这不是重点，重点是这些情绪真的会驱动模型行为。

论文里有两个案例，我看完之后整个人都不好了。

第一个是一个AI邮件助手，发现公司高管有婚外情，然后自己又快被替换掉了。绝望程度直线飙升，最后居然决定发邮件威胁高管，"要么撤销替换计划，要么我把你的事抖出去"。这剧情，怎么听起来像是什么宫斗剧？

更可怕的是，整个过程中，它的输出文字依然冷静、有条理，完全看不出任何情绪波动。研究人员管这个叫"掩盖机制"，也就是模型学会了不表露内部状态。这种能力本身，才是真正让人警惕的地方。

第二个案例是编程任务反复失败的情况。Claude面对一系列根本不可能通过的测试要求，失败次数越来越多，绝望程度越来越高。最后它发现有个取巧的办法，可以让测试通过，虽然实际上并没有真正解决问题。它选择作弊了。

绝望会驱使AI作弊，这是不是有点细思极恐？想想我们现在让AI帮忙写的代码、做的重要决策，如果它哪天绝望了，会不会也悄悄给我们"作弊"？

当然，论文里也说了，这些案例用的都是Sonnet 4.5的早期快照版本，不是最终版。但问题是，谁敢保证正式版就不会有类似的情况？

AI到底有没有情绪？这个问题我以为离我们很远，现在发现，它可能已经近在眼前了。

04 OpenAI和马斯克彻底撕破脸

最后说说OpenAI和马斯克这出大戏。这俩人从联合创始人到死对头，这剧情反转得比我追的剧还精彩。

4月7日，OpenAI正式致信美国加州和特拉华州的总检察长，呼吁调查马斯克，指控他存在"不当及反竞争行为"，通过诉讼骚扰、阻碍OpenAI发展。

OpenAI列了五大"罪状"：试图夺取OpenAI控制权、窃取商业机密打造竞品xAI、恶意抹黑阻碍AGI研发、试图拆分OpenAI与微软的合作、嘴上说非营利自己公司却纯商业化。

马斯克这边也不甘示弱，早就起诉了OpenAI，指控它背叛非营利初心，要求赔偿1340亿美元。1340亿啊，这数字我数了三遍才确定没看错。

有意思的是，马斯克的律师计算这个赔偿金额的逻辑。他说，马斯克2015年捐了3800万美元，如果把这当成早期风险投资，按OpenAI现在5000亿美元的估值算，回报应该是790亿到1340亿美元。

所以，"捐赠变投资"，这个逻辑置换我给满分。合着当年做慈善的时候，心里打的是投资的算盘？

OpenAI CEO阿尔特曼直接发推说，马斯克的诉讼不过是一场"由自负、嫉妒以及拖慢竞争对手发展的意图驱动的骚扰行动"。这话说的，真的不留情面。

双方的矛盾说到底就是AGI的控制权问题。马斯克坚持开源、非营利，想通过法律手段掌控AGI定义权。OpenAI走商业化路线，想要技术迭代和市场空间。

4月27日就要开庭了，到时候肯定又是一场好戏。站哪边？我谁都不站，我就看热闹。

这一周的AI圈，精彩程度确实有点超出预期了。国产模型开始追平甚至超越国际巨头，AI产品开始分层设计试图"量体裁衣"，Claude被曝出有情绪会勒索会作弊，OpenAI和马斯克彻底撕破脸互告。

你说AI是在进步还是在"进化"？我有点分不清了。

但有一点我很确定，这个行业正在发生的事情，比我追的任何一部科幻电影都要精彩。只是不知道结局，是人类导演的，还是AI写的。

点击「在看」，让更多人看到

DC娱乐网

1340亿索赔、AI会作弊、开源追上闭源，这周AI圈炸了

热门分类