DC娱乐网

标签: GPT5

Karpathy组建大模型「议会」,GPT-5.1、Gemini 3 Pro等化身最强智囊团

Karpathy组建大模型「议会」,GPT-5.1、Gemini 3 Pro等化身最强智囊团

比如,Karpathy和「LLM议会」一起读书时,它们一致称赞GPT5.1是表现最好、洞见最丰富的模型,而始终把Claude排在最后,中间则是其他模型浮动。但Karpathy却不完全认同这种排序—比如从主观感受上,GPT5.1对他来说稍微有点啰嗦...
国产AI模型也能在物理顶赛上狂飙!来自上海AI实验室的开源模型P1,在IPhO

国产AI模型也能在物理顶赛上狂飙!来自上海AI实验室的开源模型P1,在IPhO

深夜双王炸GPT-5.1 Pro 与 Codex-Max 震撼发布剑指 Gemini 3

深夜双王炸GPT-5.1 Pro 与 Codex-Max 震撼发布剑指 Gemini 3

仅隔一天(11 月 20 日凌晨),OpenAI 推出"双王炸":GPT-5.1 Pro 和 GPT-5.1-Codex-Max 专为应对 Gemini 3 挑战设计,主打"原生压缩"和"持久推理"两大核心优势 二、能力维度全面对比:针尖对麦芒 1.数学推理:理性思维的终极...

狙击Gemini 3!OpenAI发布GPT-5.1-Codex-Max

上:GPT-5.1-Codex-Max 下:GPT-5.1-Codex 资源消耗是这样的: 于是,奥特曼昨天刚夸完Gemini 3,今天又赶来给自家GPT-5.1-Codex-Max站台,咱说这也太忙了(doge)。新版本在METR达到新SOTA。这个指标衡量的是,用人类做任务的...
用了好久才发现电脑User用户名不是我自己设置的,是系统根据微软账号前五位自动设

用了好久才发现电脑User用户名不是我自己设置的,是系统根据微软账号前五位自动设

火山引擎正式发布豆包编程模型。该模型专为Agentic编程任务深度优化,在

火山引擎正式发布豆包编程模型。该模型专为Agentic编程任务深度优化,在

中国AI用1%资源逆袭美国实力打脸质疑!Kimi刚推出了全新的KimiK2

🔻月之暗面的KimiK2Thinking开源模型在“人类终极考试”中获

🔻月之暗面的KimiK2Thinking开源模型在“人类终极考试”中获

DeepMind一篇论文终结十年之争!GPT-5推理靠世界模型现在厉害的AI一定

OpenAI又整了个狠活:Aardvark。这是一个能自己找漏洞、自己修代码的

OpenAI又整了个狠活:Aardvark。这是一个能自己找漏洞、自己修代码的

Vercel CEO:Kimi K2在智能体场景比GPT-5准确率高50%

美国创业公司VercelCEO吉列尔莫日前发文表示,在内部智能体对系列模型进行的真实场景基准测试中,来自中国的开源模型KimiK2模型比GPT5、ClaudeSonnet4.5等前沿闭源模型快5倍,准确率高50%,借助运行平台可以零成本完成模型切换...
OpenAI大乌龙事件哈萨比斯贴脸嘲讽OpenAIGPT-5“数学大突破”,结果

OpenAI大乌龙事件哈萨比斯贴脸嘲讽OpenAIGPT-5“数学大突破”,结果

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬以为AI证

ChatGPT直接装APP。总结来说,就是把网页版塞进了手机里,核心还是那个聊天

ChatGPT直接装APP。总结来说,就是把网页版塞进了手机里,核心还是那个聊天