
#大模型备案#
一、前期准备与对接
预计耗时:7-10个工作日
这个阶段要明确三件事:
1、确认是否需要备案
不是所有的大模型产品都需要做大模型备案,需要具备以下几个条件
条件具体要求服务对象向中华人民共和国境内用户提供服务服务属性具备舆论属性或社会动员能力模型本身属于自研大模型或对接入的第三方大模型进行了二开或微调
注意:
如果你的大模型只接入了第三方大模型未进行任何改动,那么只需要进行大模型登记。以及我们常说的算法备案和大模型备案是两回事,不要搞混淆了,还有疑问建议可以直接咨询属地网信办。
2、与属地网信办取得联系
第一时间联系企业注册地或实际经营地的省级网信部门,沟通以下事项:
确认产品内容是否需要备案
确认本地区备案受理的具体要求和流程
获取《生成式人工智能服务上线备案表》
注意:
北京等大模型备案数量较多的区域,因为申报量大需先领取生成式人工智能(大语言模型)备案信息采集表,并完成填写,其他地区可以直接与网信办沟通获取备案材料准备清单。
3、产品开发与基础材料整理
在产品开发的同时,同步准备基础材料:
企业营业执照
法人身份证复印件
安全负责人和技术负责人任命文件
大模型产品的简要介绍文档(包括模型名称、版本号、核心技术架构、服务场景、目标用户群体)
阶段实操建议:
不要等所有东西都准备好了才去联系网信办。先对接、先获取备案表、先确认要求,再回来准备材料,能少走很多弯路。
二、填写备案表启动安全评估
预计耗时:60个工作日
1、填写备案信息表
备案表是大模型备案的核心,也是大模型备案的"基本档案",需要填报的信息主要包括:
模块具体内容模型基础信息模型名称、版本号、参数规模、训练框架、部署方式(公有云/私有部署)研发主体信息企业资质、技术团队规模、核心研发人员背景服务信息服务场景、覆盖范围、目标用户画像、是否涉及未成年人等特殊群体训练信息训练数据量(以Token计量)、训练算力资源、训练周期安全保障措施内容安全机制、数据保护措施、应急响应预案
2、启动安全评估
安全评估不是填一份表格那么简单,它涉及模型安全的全方位验证。大模型备案材料的重中之重《安全自评估报告》需要在此基础上进行撰写
组建安全评估团队(建议技术+法务+合规跨部门协作)
对标《生成式人工智能服务安全基本要求》(TC260-003)逐项排查
安排模型安全测试(包括内容安全、数据安全、系统安全)
对测试题库和关键词库进行测试
完善隐私政策和服务协议
注意:
评估测试集和关键词库需一并作为材料附件提交给网信办审核
三、训练语料与标注语料梳理
在等待安全评估结果的时候可同步开展
预计耗时:7-14个工作日
1、训练语料来源分类与合规审查
语料类型合规要求需要准备的证明材料开源语料需提供开源许可协议或授权文件,关注Robots协议及个人信息拒绝授权声明开源协议副本、授权文件自采语料需保留采集记录,禁止采集他人明确禁止的语料采集日志、采集规则说明商业语料需具备法律效力的交易合同,合作方需提供语料来源、质量及安全证明购买合同、合作方资质证明
2、语料安全核验
依据《生成式人工智能服务安全基本要求》附录A,需要规避5大类31种不良语料,包括:
政治敏感内容
色情暴力内容
虚假信息与谣言
歧视性内容
其他违法有害信息
四、编写安全评估报告+准备其他材料附件
预计耗时:7-14个工作日
安全评估报告是大模型备案的核心材料,也是审核专家重点审查的内容。这份报告不是随便写写就行的,它需要覆盖160余项评估指标,篇幅通常在30-100页以上,涉及技术、法律、伦理多个专业领域。
1、报告核心框架
模块核心内容评估基础信息评估主体、评估对象、评估依据、评估范围和周期评估方法与工具采用的评估方法、使用的测试工具、样本来源分项安全评估按维度逐一评估:语料安全、模型安全、内容安全安全事件应急能力应急预案、演练记录、资源储备风险汇总与整改列出已识别风险、等级、整改方案、责任人、时限评估结论明确给出结论,尽量不要模棱两可
2、报告必须覆盖的评估维度
维度具体要求语料安全训练数据来源合法性、违法不良信息占比、数据隐私保护模型安全算法机制透明度、算法偏见识别与纠正、模型鲁棒性内容安全有害信息过滤机制、拒答能力、生成内容合规率用户权益知情权、选择权、退出权、投诉举报渠道(≥3种)数据安全数据加密、匿名化处理、访问控制、数据跨境合规应急响应应急预案完整性、48小时内响应用户投诉、应急演练记录
实操建议:
安全评估报告是整个备案过程中复杂、专业的环节,如果团队内部没有相关经营,建议寻求第三方专业机构帮助
五、备案申请
预计耗时3-5个月
1、向属地网信办提交材料清单
一切准备就绪后向网信办提交备案申请,提交前逐项核对以下材料是否齐全
大模型备案上线申请表+所需附件附件一安全评估报告PDF+word版各一附件二模型服务协议PDF+word版各一附件三语料标注规则PDF+word版各一附件四拦截关键词列表一份excel版附件五评估测试集一份excel版附件六企业简介PDF+word版各一
2、提交测试账号等待实际测评
提交测试接口至网信办,网信办根据材料及测试账号进行实际测评,主要考察以下维度:
功能测试:
模型基本功能是否正常、各项性能指标是否达标
安全测试:
内容拦截是否有效、拒答能力是否达标、关键词覆盖率是否足够
合规测试:
用户投诉举报机制是否畅通、隐私保护措施是否落实
3、提交至中央网信办进行二轮审核
属地网信办审核通过后,由属地网信办提交至中央网信办进行二轮审核,在此过程中往往需对材料进行多轮补充修正
4、审核通过后下发备案号
审核通过后及时关注地方网信办官方账号,会公示备案编号