谷歌宣布,其用于识别AI生成文本的SynthID文本水印技术现已通过谷歌负责任生成式AI工具包开源。这项技术能够在生成文本时添加不可见的水印,帮助开发者检测文本是否由其自身的模型生成。
SynthID的工作原理是通过微调每个词语的概率评分来实现的。大型语言模型(LLM)生成文本时,会逐个预测下一个最可能的词语。SynthID会在不影响文本质量、准确性和创造性的前提下,调整这些概率评分。最终,模型的词语选择和调整后的概率评分的模式构成水印。
谷歌表示,SynthID已经集成到其Gemini聊天机器人中,并且不会影响生成文本的质量、准确性、创造性或速度。它可以识别短至三句话的文本,即使文本被裁剪、释义或修改,也能有效工作。然而,它在处理短文本、被改写或翻译的内容以及事实问题的回答方面仍然存在挑战。
谷歌承认SynthID并非完美的AI生成内容识别工具,但它是一个重要的组成部分,可以帮助人们更好地识别AI生成内容。 随着大型语言模型被用于传播政治虚假信息、生成非自愿色情内容等恶意目的,水印技术变得越来越重要。加州正在考虑强制实施AI水印,中国政府去年也开始强制要求使用AI水印。
目前,其他AI开发者可以使用SynthID来检测其自身模型生成的文本,这将有助于更负责任地开发AI。 然而,水印技术仍处于发展阶段,需要不断改进。