现在模型蒸馏问题越来越敏感,连 Meta 这种看似暂时置身事外的企业,也不得不防患于未然。
据『The Information』报道,Meta 正严格限制其 AI 工程部门的工程师使用 Claude Code 和 Codex,甚至不惜在部分任务中直接叫停使用外部模型。
原因就是担忧部分外部模型的输出会渗入 Meta 的训练数据。这可能会违反 Claude 和 Codex 的使用协议,并影响到和 Anthropic 及 OpenAI 的合作关系。
Meta 一直是 Claude Code 的最大客户之一。今年初,Meta 成立了应用 AI 工程团队,负责改进自家的编程助手 MetaCode。
这个团队需要构建高质量的数据集和编程难题,供工程师用来训练和测试其编程模型。尽管 Meta 允许该团队在某些特定用途上使用外部 AI 工具,但要求工程师必须亲自设计这些编程题,而不是直接丢给 AI 生成。
Meta 仅允许应用员工使用 AI 工具处理一些日常工作,例如设置工作流、整理代码和文件,以及为正在开发的内部 AI 工具构建测试基础设施。
即便在这些情况下,AI 生成的任何内容在投入使用前,也必须经过人类的仔细审查。
另一项限制则是,工程师不能使用 AI 查找源代码中的 Bug,也不能基于代码分析让 AI 为任务生成想法。
此外,Meta 的内部指南规定,如果正在测试的内部模型可以访问基础设施容器(即装载应用程序及其运行所需的代码和依赖库等一切内容的环境),那么该容器内不得放置任何 AI 生成的材料。
尽管法律并未明确禁止蒸馏,且 AI 生成的内容不受版权保护,但各大 AI 实验室已表现出一种倾向:他们会不惜代价封禁任何涉嫌蒸馏的个人或公司 —— 而这则是 Meta 暂时最不想触碰的红线。
