从批改场景到高考战场，讯飞星火以分步解题优势诠释AI应试进化

人工智能能否适配标准化考试评价体系，今年广东AI高考测评给出清晰答案。羊城晚报教育发展研究院集结8款头部大模型开展完整新高考"3+1+2"全科测试，统一作答规则、阅卷标准，客观呈现各模型应试综合实力，参评模型覆盖海内外多款主流通用大模型。综合总分数据来看，讯飞星火X2表现突出，物理类708分、历史类700分，是全部参评产品里唯一物理类、历史类均超700分的大模型，分数达到广东高考屏蔽生区间。测评报告提及，头部大模型基础能力差距持续缩小，最终区分度集中在答题步骤规范性、多环节逻辑推导能力，讯飞星火在理科分步解题、作文立意评析等主观题型中稳定性更突出。这份差异化优势，依托科大讯飞落地校园的星火智能批阅机业务。星火智能批阅机业务搭配星火AI大脑，可实现习题分步骤批改、精准错因定位，不只是简单判定答案对错，还能依据错题生成个性化训练方案。多年间，批阅设备覆盖多所中小学，持续收集批改反馈、答题误区、评分尺度等核心教育数据，持续反哺大模型迭代优化。不同于通用大模型仅依靠海量通用文本训练，讯飞星火长期扎根作业评价场景，吃透考试打分底层逻辑，也让其在完整高考全科测评中展现出更强的应试适配度，凸显垂直教育场景深耕带来的独特竞争力。

#认知智能全国重点实验室##大模型国家队##全栈自主可控#

DC娱乐网

从批改场景到高考战场，讯飞星火以分步解题优势诠释AI应试进化

热门分类