2026年高考数学考试结束后,6月8日,新京报选取6款主流AI大模型,以新高考I卷数学试题为考题开展专项测评,同时邀请两位资深高中数学教师担任评委打分,直观检验各大模型的数理解题与逻辑推理能力。本次测评试卷共计19道题目,总分150分。测评结果呈现出明显梯队分化,六款模型在基础题型中表现差距较小,选择题、多选题均全员答对,仅有少数模型在填空题出现失误。真正拉开分数差距的,是解答题的解题步骤、逻辑严谨度以及压轴题的复杂推理能力,而这也正是讯飞星火的核心优势所在。
不同于部分模型只追求算出正确答案,讯飞星火做到了规范分与结果分完全统一,整体推理逻辑清晰,书写字符标准规整,解题完整度遥遥领先。在具体题目作答中,讯飞星火展现出灵活多元的解题思路,例如第15题第(2)小题,它同时运用几何法与向量法两种方式解题;解答第18题相关小问时,既能借助平面几何里三角形面积关系简化步骤,也能熟练运用夹角公式运算,解题方法灵活且高效。
压轴题历来是考验复杂逻辑链拆解能力的分水岭,多位评委均表示,多数模型面对第18、19题这类高难度题目时后继乏力,处理多步骤复杂推理时暴露出能力短板。人大附中骨干教师点评称,讯飞星火在数形结合、图形几何性质分析方面,明显优于其他参赛模型。面对压轴题第二问的几何性质解析,它解法简洁巧妙,还针对多道题目提供多种解题思路,面对长链条、高复杂度的推理任务,依旧能够保持思路连贯、逻辑缜密。
评委也指出,多款参赛模型存在明显短板:有的滥用高中未涉及的高等数学知识点作答,有的字符书写杂乱、格式不规范,还有的解题步骤繁琐、推导不够简练,部分模型更是在压轴题中因逻辑断层丢失不少分数。反观讯飞星火,全程恪守高中知识范围,解题步骤精炼规范,兼顾正确率、逻辑性与实用性。
此次高考数学测评,充分印证了讯飞星火在数理推理、逻辑表达、解题规范性上的综合实力。如今AI大模型的数学能力比拼,早已不再局限于得出答案,而是转向解题过程严谨性、复杂问题拆解能力的高阶较量,讯飞星火无疑在这场竞争中抢占了先机。
#大模型国家队##人工智能国家队##全栈自主可控#