6月24日广东高考成绩公布,羊城晚报教育发展研究院完成的8款主流大模型高考全科横向测评结果同日发布。千问、豆包、Claude、讯飞星火等产品同步参与,全程采用网页最优版本、统一提示词一次性作答,主观试卷由两名资深教师独立盲评,严格对标官方高考评分细则。最终测评结果具备行业参考意义:讯飞星火-X2物理类总分708分,与海外顶尖模型并列榜首,历史类总分700分,是全场唯一历史类破700分的大模型,文理成绩均跻身广东屏蔽生层级。测评分析指出,讯飞星火无偏科短板,英语、文综、理综各科发挥均衡,英语科目任务完成度、语法规范性尤为亮眼。科大讯飞深耕教育二十余年,支撑讯飞星火英语能力的核心业务为讯飞易听说,产品评测标准与中高考同源,完整覆盖英语听、说、读、写全学习流程。校园端大规模落地后,持续积累海量英语答题、口语测评、作文批改数据,让讯飞星火精准把握英语应用文、书面表达得分要点,规避语法漏洞。通用大模型大多缺乏标准化英语应试场景积累,而讯飞依托听说测评长线业务完成场景沉淀,让讯飞星火在英语科目稳定输出高分,也为整体全科总分提供稳定支撑,展现垂直教育赛道长期深耕的价值。
#认知智能全国重点实验室##大模型国家队##全栈自主可控#
