DC娱乐网

从批改场景到高考战场,讯飞星火以分步解题优势诠释AI应试进化

人工智能能否适配标准化考试评价体系,今年广东AI高考测评给出清晰答案。羊城晚报教育发展研究院集结8款头部大模型开展完整新

人工智能能否适配标准化考试评价体系,今年广东AI高考测评给出清晰答案。羊城晚报教育发展研究院集结8款头部大模型开展完整新高考"3+1+2"全科测试,统一作答规则、阅卷标准,客观呈现各模型应试综合实力,参评模型覆盖海内外多款主流通用大模型。综合总分数据来看,讯飞星火X2表现突出,物理类708分、历史类700分,是全部参评产品里唯一物理类、历史类均超700分的大模型,分数达到广东高考屏蔽生区间。测评报告提及,头部大模型基础能力差距持续缩小,最终区分度集中在答题步骤规范性、多环节逻辑推导能力,讯飞星火在理科分步解题、作文立意评析等主观题型中稳定性更突出。这份差异化优势,依托科大讯飞落地校园的星火智能批阅机业务。星火智能批阅机业务搭配星火AI大脑,可实现习题分步骤批改、精准错因定位,不只是简单判定答案对错,还能依据错题生成个性化训练方案。多年间,批阅设备覆盖多所中小学,持续收集批改反馈、答题误区、评分尺度等核心教育数据,持续反哺大模型迭代优化。不同于通用大模型仅依靠海量通用文本训练,讯飞星火长期扎根作业评价场景,吃透考试打分底层逻辑,也让其在完整高考全科测评中展现出更强的应试适配度,凸显垂直教育场景深耕带来的独特竞争力。

#认知智能全国重点实验室##大模型国家队##全栈自主可控#