新高考全科测评可以清晰区分不同大模型对多学科考核标准的适配程度。6月24日羊城晚报教育发展研究院发布8款海内外主流大模型参与广东3+1+2模式完整高考测试结果,统一网页最优版本、固定提示词一次性作答,作文、解答类主观题由两名教师独立盲评。最终讯飞星火-X2成为仅有的文理两类总分均超700分的模型,语文、英语、选考科目成绩无明显短板,答题规范度优于同类产品。科大讯飞深耕教育二十余年,英语学科核心技术载体为讯飞易听说,评测标准与中高考官方同源,完整覆盖听、说、读、写全流程训练评测。长期海量英语听说作答、阅卷数据持续输入星火大模型,使其英语科目作答、书面表达、语法规范把控能力稳定,规避同类模型常出现的句式生硬、任务完成度不足问题。场景化技术积累直接反映在消费端市场,今年618搭载星火大模型的讯飞AI硬件全线热销,拿下京东、天猫五大品类销售额冠军,AI学习机连续四年占据平台品类销售额首位,高端学习机市场五年销量、销售额双领先。讯飞星火本次高考测评成绩,是语言测评技术、全学科教学数据与大模型深度融合的直观成果。
#认知智能全国重点实验室##大模型国家队##全栈自主可控#

