适配AI发展!教育部、国家语委发布两项语言文字新规范。 为积极回应人工智能时代对语言文字的现实需求,补齐AI领域语言文字规范短板,推进语言文字规范标准体系向数字化、智能化升级,教育部、国家语言文字工作委员会近日正式发布两项语言文字新规范,分别为《机器合成普通话水平测评等级标准及测评大纲》和《人工智能 语料库 基础术语》,为AI领域语言文字应用划定标准、提供指引。 两项新规范均由教育部语言文字应用研究所组织研制,经国家语委语言文字规范(标准)审定委员会审定通过,目前已由语文出版社正式出版发行。其中,《机器合成普通话水平测评等级标准及测评大纲》聚焦机器合成语音的规范化测评,明确划定了机器合成普通话的等级标准和具体测评大纲,适用范围覆盖机器合成语音的普通话水平测评全场景,无论是AI语音技术研发、相关产品优化,还是应用效果评价,都可参照该规范执行,填补了机器合成普通话测评缺乏统一标准的空白。 另一项规范《人工智能 语料库 基础术语》则聚焦AI领域的核心基础——语料库,系统界定了语料库在属性、建设和应用等方面的常用术语及定义。作为AI模型训练的核心基础,语料库的规范程度直接影响模型性能,该规范的出台,将统一人工智能领域语料库建设、使用、管理、测评及研究等环节的术语标准,解决此前行业内术语不统一、表述混乱的问题,为语料库相关工作的有序开展提供统一遵循。 两项新规范的发布,有着明确的政策导向和现实意义,既是落实《中华人民共和国国家通用语言文字法》中“推进国家通用语言文字信息化、数字化、智能化建设”要求的具体举措,也是响应《关于加强数字中文建设 推进语言文字信息化发展的意见》部署的重要行动。其落地实施,标志着我国语言文字标准体系建设向数字化、智能化方向迈出坚实步伐,既能为AI领域语言文字应用提供规范指引,推动相关技术和产业高质量发展,也能进一步夯实数字中文建设基础,助力中文在全球AI领域发挥更大价值。