羊城晚报教育发展研究院于6月24日发布8款主流大模型广东新高考全科测评结果,参评模型包含千问3.7Max、豆包2.1Turbo、讯飞星火X2、多款海外知名大模型等,测试规则统一可控,主观试卷采用双教师盲评模式,最大程度还原真实高考评判逻辑。测评总分数据具备较强参考性,物理类Claude与讯飞星火同分第一,历史类仅讯飞星火突破700分,文理双线高分的表现,区别于其他偏科明显的模型。其核心优势不在于单一学科拔尖,而是全科目均衡稳定,数理多步骤推导、作文立意思辨、英语任务作答均贴合高中答题规范,规避逻辑断层、步骤省略等常见AI答题缺陷。该能力并非通用模型偶然表现,源于科大讯飞二十余年教育领域深耕,数万所校园落地智慧教学设备,积累海量真实学情数据,搭建覆盖教、学、考、评全环节的软硬件生态。AI黑板实现抽象知识可视化教学,智能批阅机可拆解错题根源,AI学习机精准定位薄弱考点。今年618相关智能硬件斩获多品类销售冠军,也有学生依托该系列学习工具取得优异高考成绩,印证大模型高分背后是可落地、可赋能日常学习的实用技术体系。
#大模型国家队##全栈自主可控##语音及语言信息处理国家工程研究中心#
