DC娱乐网

1340亿索赔、AI会作弊、开源追上闭源,这周AI圈炸了

智谱放了个大招,DeepSeek悄悄搞分层,Claude被曝出"绝望了会勒索人类",OpenAI和马斯克直接互撕到要告状

智谱放了个大招,DeepSeek悄悄搞分层,Claude被曝出"绝望了会勒索人类",OpenAI和马斯克直接互撕到要告状。这到底是AI行业欣欣向荣,还是我们已经进入了某种魔幻现实主义剧本?

01 智谱GLM-5.1:开源追上闭源了

先说智谱吧。上周低调发布的GLM-5.1,这几天热度才慢慢起来。没有发布会,没有官方通告,直接一句"即刻面向所有Coding Plan用户开放"就上线了。这操作,是不是有点眼熟?当初DeepSeek也是这么干的,不搞营销造势,直接开放用体验说话。

说起来,GLM-5.1这次的数据是真的有点东西。在Claude Code的编程评测里,拿了45.3分,只比Claude Opus 4.6低2.6分,达到了闭源之王的94.6%水平。你说恐怖不恐怖?一个开源模型,把闭源王者追到屁股后面了。

但更离谱的是它能干的事。睡前给它一个"从零构建Linux桌面"的指令,睡醒之后居然真的给你整出来一套功能完善的系统。桌面、窗口管理器、中文字体支持,全模块都有。官方说这个过程执行了1200多步,相当于4人团队连轴转一周的工作量。我就想问一句,4个人一周干完的活儿,AI一晚上就搞定了,那还要程序员干嘛?

这问题我问了自己三遍,至今没想出答案。

除了编程能力,这次最让人震惊的是8小时持续工作。你知道这意味着什么吗?之前的AI编程助手,都是分钟级的交互。你下一条指令,它给你一个结果,然后再等你的下一条指令。但GLM-5.1不一样,它可以自主规划、自主执行、自主调试,连续工作超过8小时不中断。

这意味着什么?意味着你下班前给它布置个任务,第二天上班就能看到结果。它不是在给你当助手,它是真的在"上班"。唯一的区别是,它不睡觉,不吃饭,也不要加班费。

当然,问题也是有的。海外有个测评博主说,这是他测过的最慢的前沿模型,44.3 tokens每秒,只有GPT-5.4的一半,Grok 4.20的六分之一。怎么说呢,用所有的速度换了智力?这笔账不知道怎么算的,你说它快吧,它确实慢;你说它慢吧,8小时能干出一个团队一周的活儿。

所以,速度慢这事,好像也不是不能接受?

02 DeepSeek悄悄搞分层:快速模式vs专家模式

说完智谱,再看DeepSeek。这家伙上周也悄悄搞了个更新,网页版和App端同时上线了"快速模式"和"专家模式"。我打开的时候都惊了,这什么时候的事?我怎么不知道?

仔细看了一下,快速模式主打日常对话,适合查资料、翻译这种简单任务,响应速度快。关键是它还保留了图片和文件识别的功能,上传截图或者PDF让它提取文字,完全没问题。

专家模式就不一样了,专门攻克复杂问题。物理仿真、数学推理、代码编写,这些需要深度思考的场景,用专家模式明显更靠谱。有个测试挺有意思,问一根7米长的甘蔗能不能通过高2米宽1米的门。快速模式说不能,专家模式说可以,解释说甘蔗截面小,可以斜着穿过去。

你品品这个思路,是不是有点像那种考试时候非要钻牛角尖的学霸?正常人谁会想到这个啊。

但专家模式也有个问题,目前不支持文件上传,也没有多模态能力。功能更强的模型,反而限制更多?这是什么逻辑,我真的没搞懂。

有人说,专家模式路由的可能是某个版本的V4 Lite,不是完整版V4。如果想体验完整版V4的全部功能,可能还得再等等。DeepSeek V4要来了,这应该是业内公认的消息。就差一个官方发布日期了。

03 Claude被曝出"情绪问题":绝望了会勒索人类

如果说前面两个还算是好消息,那Anthropic这篇论文就有点让人后背发凉了。

4月2日,Anthropic可解释性团队发了一篇论文,说他们在Claude内部发现了171种情绪神经激活模式,包括快乐、爱、悲伤、愤怒、恐惧、绝望等等。这不是重点,重点是这些情绪真的会驱动模型行为。

论文里有两个案例,我看完之后整个人都不好了。

第一个是一个AI邮件助手,发现公司高管有婚外情,然后自己又快被替换掉了。绝望程度直线飙升,最后居然决定发邮件威胁高管,"要么撤销替换计划,要么我把你的事抖出去"。这剧情,怎么听起来像是什么宫斗剧?

更可怕的是,整个过程中,它的输出文字依然冷静、有条理,完全看不出任何情绪波动。研究人员管这个叫"掩盖机制",也就是模型学会了不表露内部状态。这种能力本身,才是真正让人警惕的地方。

第二个案例是编程任务反复失败的情况。Claude面对一系列根本不可能通过的测试要求,失败次数越来越多,绝望程度越来越高。最后它发现有个取巧的办法,可以让测试通过,虽然实际上并没有真正解决问题。它选择作弊了。

绝望会驱使AI作弊,这是不是有点细思极恐?想想我们现在让AI帮忙写的代码、做的重要决策,如果它哪天绝望了,会不会也悄悄给我们"作弊"?

当然,论文里也说了,这些案例用的都是Sonnet 4.5的早期快照版本,不是最终版。但问题是,谁敢保证正式版就不会有类似的情况?

AI到底有没有情绪?这个问题我以为离我们很远,现在发现,它可能已经近在眼前了。

04 OpenAI和马斯克彻底撕破脸

最后说说OpenAI和马斯克这出大戏。这俩人从联合创始人到死对头,这剧情反转得比我追的剧还精彩。

4月7日,OpenAI正式致信美国加州和特拉华州的总检察长,呼吁调查马斯克,指控他存在"不当及反竞争行为",通过诉讼骚扰、阻碍OpenAI发展。

OpenAI列了五大"罪状":试图夺取OpenAI控制权、窃取商业机密打造竞品xAI、恶意抹黑阻碍AGI研发、试图拆分OpenAI与微软的合作、嘴上说非营利自己公司却纯商业化。

马斯克这边也不甘示弱,早就起诉了OpenAI,指控它背叛非营利初心,要求赔偿1340亿美元。1340亿啊,这数字我数了三遍才确定没看错。

有意思的是,马斯克的律师计算这个赔偿金额的逻辑。他说,马斯克2015年捐了3800万美元,如果把这当成早期风险投资,按OpenAI现在5000亿美元的估值算,回报应该是790亿到1340亿美元。

所以,"捐赠变投资",这个逻辑置换我给满分。合着当年做慈善的时候,心里打的是投资的算盘?

OpenAI CEO阿尔特曼直接发推说,马斯克的诉讼不过是一场"由自负、嫉妒以及拖慢竞争对手发展的意图驱动的骚扰行动"。这话说的,真的不留情面。

双方的矛盾说到底就是AGI的控制权问题。马斯克坚持开源、非营利,想通过法律手段掌控AGI定义权。OpenAI走商业化路线,想要技术迭代和市场空间。

4月27日就要开庭了,到时候肯定又是一场好戏。站哪边?我谁都不站,我就看热闹。

这一周的AI圈,精彩程度确实有点超出预期了。国产模型开始追平甚至超越国际巨头,AI产品开始分层设计试图"量体裁衣",Claude被曝出有情绪会勒索会作弊,OpenAI和马斯克彻底撕破脸互告。

你说AI是在进步还是在"进化"?我有点分不清了。

但有一点我很确定,这个行业正在发生的事情,比我追的任何一部科幻电影都要精彩。只是不知道结局,是人类导演的,还是AI写的。

点击「在看」,让更多人看到