国产AI模型也能在物理顶赛上狂飙！来自上海AI实验室的开源模型P1，在IPhO

国产AI模型也能在物理顶赛上狂飙！来自上海AI实验室的开源模型P1，在IPhO 2025理论考试中，打败全球顶级AI，拿下金牌线分数，成绩仅次于Gemini-2.5-Pro和GPT-5。不仅如此，在团队新构建的HiPhO物理竞赛集合上，P1模型还交出了一份几乎满分的战绩：13场比赛12金1银，平均得分38.4/50，排名第一。具体来说，HiPhO覆盖了2024–2025年最新13场物理赛事的理论题，包括IPhO、APhO、EuPhO这样的国际赛事，以及NBPhO、PanPhO、F=MA等区域性高难赛事。在统一的评分体系下，P1-235B-A22B单一模型（不使用多智能体）就已经在13场比赛中取得12金1银，与Gemini-2.5-Pro、Gemini-2.5-Flash-Thinking并列第一（GPT-5 11金、Grok-4 10金、Claude-4-Sonnet-Thinking 8金）。划重点：全链路开源。模型、算法、数据集、推理框架，全部放出。此外它在中国物理奥林匹克CPhO金牌线上的表现也很强：227/320分，远超人类第一名（199分）。不但通用能力没削弱，反而因为学了更复杂的物理题，数学、编程、推理能力一并提升，说明AI真能举一反三。项目主页：prime-rl.github.io/P1/论文地址：arxiv.org/abs/2511.13612

DC娱乐网

国产AI模型也能在物理顶赛上狂飙！来自上海AI实验室的开源模型P1，在IPhO

热门分类