GPT-5.6的Sol模型在Terminal-Bench 2.1测试中拿下88.8%,开启Ultra模式后冲到91.9%,编程能力确实压过Claude Mythos 5。但这次发布只对约20家合作伙伴开放,普通开发者暂时用不了。Terra价格砍半,Luna成本压到1/5,原生多智能体协同能自动拆任务,150万token上下文也够用。OpenAI自己说政府筛选客户不应成常态,性能到位了,开放节奏还得等。 OpenAI官宣新一代旗舰大模型

GPT-5.6的Sol模型在Terminal-Bench 2.1测试中拿下88.8%,开启Ultra模式后冲到91.9%,编程能力确实压过Claude Mythos 5。但这次发布只对约20家合作伙伴开放,普通开发者暂时用不了。Terra价格砍半,Luna成本压到1/5,原生多智能体协同能自动拆任务,150万token上下文也够用。OpenAI自己说政府筛选客户不应成常态,性能到位了,开放节奏还得等。 OpenAI官宣新一代旗舰大模型
