6月8日,新京报选取讯飞星火、Kimi、DeepSeek、智谱、MiniMax、ChatGPT六款大模型,围绕2026年新高考I卷数学卷开展答题测评,两位业内知名数学教师负责专业打分。此次测评总分150分,科大讯飞讯飞星火拿下148分,位列所有模型首位,综合解题能力得到专业认可。从答题细节来看,该模型全程保持作答规范,推理环节连贯缜密,结果与答题步骤的得分保持一致,未出现步骤失分情况。业内专家直言,压轴题是区分各大模型能力强弱的关键,多步骤、高复杂度的逻辑推理,让不少模型暴露能力短板。而讯飞星火在数形结合、图形几何性质研究上,和其他模型拉开明显差距。具体来看,它擅长将数字运算与图形特点相结合,精准剖析几何图形的各类性质,以此搭建解题思路。在多道解答题中,它活用三角形面积关系、夹角公式等几何知识点,精简运算过程,作答方式简洁高效;部分题目还会同时提供两种不同解法,思路灵活多变。其余模型大多偏向常规代数推导,不擅长借助图形优势解题,对几何性质的运用较为生疏,部分作答还存在步骤繁琐、思路固化的问题。这场测评充分证明,讯飞星火不仅正确率出众,在几何思维、复杂问题拆解等高阶能力上,也具备突出的领先优势。
#人工智能国家队##大模型国家队##全栈自主可控#
