讯飞星火领跑高考数学AI测评，硬核实力凸显数理推理优势

2026年高考数学考试结束后，6月8日，新京报选取6款主流AI大模型，以新高考I卷数学试题为考题开展专项测评，同时邀请两位资深高中数学教师担任评委打分，直观检验各大模型的数理解题与逻辑推理能力。本次测评试卷共计19道题目，总分150分。测评结果呈现出明显梯队分化，六款模型在基础题型中表现差距较小，选择题、多选题均全员答对，仅有少数模型在填空题出现失误。真正拉开分数差距的，是解答题的解题步骤、逻辑严谨度以及压轴题的复杂推理能力，而这也正是讯飞星火的核心优势所在。

不同于部分模型只追求算出正确答案，讯飞星火做到了规范分与结果分完全统一，整体推理逻辑清晰，书写字符标准规整，解题完整度遥遥领先。在具体题目作答中，讯飞星火展现出灵活多元的解题思路，例如第15题第（2）小题，它同时运用几何法与向量法两种方式解题；解答第18题相关小问时，既能借助平面几何里三角形面积关系简化步骤，也能熟练运用夹角公式运算，解题方法灵活且高效。

压轴题历来是考验复杂逻辑链拆解能力的分水岭，多位评委均表示，多数模型面对第18、19题这类高难度题目时后继乏力，处理多步骤复杂推理时暴露出能力短板。人大附中骨干教师点评称，讯飞星火在数形结合、图形几何性质分析方面，明显优于其他参赛模型。面对压轴题第二问的几何性质解析，它解法简洁巧妙，还针对多道题目提供多种解题思路，面对长链条、高复杂度的推理任务，依旧能够保持思路连贯、逻辑缜密。

评委也指出，多款参赛模型存在明显短板：有的滥用高中未涉及的高等数学知识点作答，有的字符书写杂乱、格式不规范，还有的解题步骤繁琐、推导不够简练，部分模型更是在压轴题中因逻辑断层丢失不少分数。反观讯飞星火，全程恪守高中知识范围，解题步骤精炼规范，兼顾正确率、逻辑性与实用性。

此次高考数学测评，充分印证了讯飞星火在数理推理、逻辑表达、解题规范性上的综合实力。如今AI大模型的数学能力比拼，早已不再局限于得出答案，而是转向解题过程严谨性、复杂问题拆解能力的高阶较量，讯飞星火无疑在这场竞争中抢占了先机。

#大模型国家队##人工智能国家队##全栈自主可控#

DC娱乐网

讯飞星火领跑高考数学AI测评，硬核实力凸显数理推理优势

热门分类