当地时间11月17日,xAI公司正式推出Grok 4.1版本。这一版本已全面开放给grok.com、X平台以及iOS、Android应用上的所有用户,免费用户同样能够使用,并且在Auto模式下默认启用。xAI的创始人埃隆·马斯克(Elon Musk)表示,用户将“明显察觉到速度与质量方面的显著提升”。Grok 4.1在感知细微意图的能力上有所增强,与用户的对话更加引人入胜,整体人格展现也更为连贯,同时还完整保留了前代模型所具备的强大智能与可靠性。

Grok 4.1支持两种模式:思考模式能够进行深度推理,非推理模式则无需消耗token即可实现即时响应。官方公布的数据显示,Grok 4.1的幻觉率从12.09%大幅降低至4.22%,FActScore也从9.89%降至2.97%。 在国际盲测平台LMSYS Arena上,Grok 4.1的表现十分亮眼。其Thinking模式获得了1483 Elo(Elo评分体系用于衡量模型在盲测对战中的相对实力),在所有公开模型中排名第一;非推理模式也取得了1465 Elo的成绩,位居第二。此外,Grok聊天机器人还在特斯拉车辆中承担起语音助手的功能。

值得一提的是,谷歌也在紧锣密鼓地筹备发布Gemini 3.0,该模型有望成为迄今为止最为强大的模型。预测市场显示,Gemini 3.0预计将于下周推出,且在专业领域的测试中已展现出突破性进展。加拿大劳瑞尔大学历史学教授Mark Humphries通过Google AI Studio对疑似Gemini 3.0的未发布模型进行了测试,发现其在识别18世纪手写文稿方面表现近乎完美,字符错误率仅为0.56%,词错误率为1.22%,相比前代Gemini 2.5 Pro提升了50% - 70%,达到了专家级人类水平。