DC娱乐网

国产AI模型也能在物理顶赛上狂飙!来自上海AI实验室的开源模型P1,在IPhO

国产AI模型也能在物理顶赛上狂飙!来自上海AI实验室的开源模型P1,在IPhO 2025理论考试中,打败全球顶级AI,拿下金牌线分数,成绩仅次于Gemini-2.5-Pro和GPT-5。不仅如此,在团队新构建的HiPhO物理竞赛集合上,P1模型还交出了一份几乎满分的战绩:13场比赛12金1银,平均得分38.4/50,排名第一。具体来说,HiPhO覆盖了2024–2025年最新13场物理赛事的理论题,包括IPhO、APhO、EuPhO这样的国际赛事,以及NBPhO、PanPhO、F=MA等区域性高难赛事。在统一的评分体系下,P1-235B-A22B单一模型(不使用多智能体)就已经在13场比赛中取得12金1银,与Gemini-2.5-Pro、Gemini-2.5-Flash-Thinking并列第一(GPT-5 11金、Grok-4 10金、Claude-4-Sonnet-Thinking 8金)。划重点:全链路开源。模型、算法、数据集、推理框架,全部放出。此外它在中国物理奥林匹克CPhO金牌线上的表现也很强:227/320分,远超人类第一名(199分)。不但通用能力没削弱,反而因为学了更复杂的物理题,数学、编程、推理能力一并提升,说明AI真能举一反三。项目主页:prime-rl.github.io/P1/论文地址:arxiv.org/abs/2511.13612