没有发布会、没有倒计时,GPT-5.2 凌晨突然上线。只有一篇技术博客和奥特曼在 X 上的轻描淡写,却挡不住背后的火药味。说白了,这是谷歌 Gemini 3 发布后,OpenAI 打出的“红色警报”版本:分成 Instant、Thinking、Pro 三个梯队,尤其是 Thinking 版,在长文理解、编程、工具调用上都明显跃升,第一次在大量专业任务里逼近甚至超越人类专家。更夸张的是速度与效率:GPT-5.2 Thinking 在 44 类知识工作里整体追平甚至超越人类专家,产出速度快 11 倍、成本低到 1%。在投行建模里,评分从 59.1% 升到 68.4%;长文本检索中,它是目前唯一能在 256k token 文档里接近满分命中率的模型。工程能力也被拉满:在跨语言、真实代码修复的 SWE-Bench Pro 上,它拿到 55.6%,刷新行业最高记录;图表推理、仪表盘和 UI 理解错误率几乎砍半。面对竞争者的贴身肉搏,GPT-5.2 更像是 OpenAI 必须打出的加速器。至于这场“红色警报”能否重新拉开ChatGPT 和别家的差距,相信很快就会见分晓。



