谷歌新闻搜索结果中,AI垃圾信息排名高于原创报道

球千任谈科技 2024-07-07 07:51:37

最近,我在使用谷歌搜索时,偶然发现了一篇似曾相识的文章。

当时,我正在搜索有关Adobe人工智能政策的最新信息,于是在谷歌中输入了“adobe train ai content”,并切换到“新闻”标签页。我已经看过WIRED的报道,它出现在结果页面的第二位:“Adobe承诺不会使用艺术家的作品训练AI。创意人士对此表示怀疑”。虽然我不认识排名第一的出版物Syrus #Blog,但这篇文章的标题却让我感到似曾相识:“当Adobe承诺不会用艺术家的内容训练AI时,创意界对此表示怀疑”。

点击排名第一的链接,我发现自己进入了一个充斥着抄袭文章的垃圾网站,这些文章经过了重新包装,其中许多文章的顶部都使用了AI生成的插图。在这篇垃圾文章中,WIRED的整篇文章都被复制了,只是措辞略有改动。甚至连原文中的引言也被照搬了过来。网页底部只有一个孤零零的超链接,指向我们版本的文章,这是唯一的署名形式。

这个机器人不仅仅是复制英文新闻——我还发现了这篇抄袭文章的10种其他语言版本,包括WIRED使用的许多语言,比如日语和西班牙语。

路透社和TechCrunch等媒体最初发表的文章也被这个博客以多种语言抄袭,并配上了类似的AI图片。在6月下旬和7月初,在我研究这篇报道的时候,Syrus网站似乎已经很好地操控了谷歌的新闻搜索结果,在多个科技相关搜索的首页上都能看到它的身影。

我搜索了“competing visions google openai”,看到一篇TechCrunch的文章出现在谷歌新闻的顶部。下面是《大西洋月刊》和彭博社的文章,比较了两家公司在AI发展上的不同方法。但在这些更知名的网站下方,排名第四的是另一篇Syrus #Blog的文章,它大量抄袭了排名第一的TechCrunch文章。

正如404 Media在1月份报道的那样,在今年年初,AI生成的文章在谷歌新闻搜索结果中多次出现。两个月后,谷歌宣布对其算法和垃圾邮件政策进行重大调整,试图改善搜索结果。到4月底,谷歌表示,从其搜索引擎排名系统中删除无用结果的重大调整已经完成。“截至4月19日,我们已经完成了这些变化的推出。现在,搜索结果中质量低下、非原创内容的数量减少了45%,而我们预计这项工作将减少40%,”谷歌产品管理总监伊丽莎白·塔克在一篇博客文章中写道。

尽管做出了这些改变,但借助AI创建的垃圾内容仍然是谷歌新闻面临的一个持续存在且普遍存在的问题。

“这是谷歌目前面临的一个非常普遍的问题,很难具体解释为什么会发生这种情况,”营销机构Amsive的搜索引擎优化高级总监莉莉·雷说。“我们的一些客户说,‘嘿,他们拿走了我们的文章,用AI对其进行了改写。它看起来和我们原创内容一模一样,只是像胡言乱语一样,是AI改写的版本。’”

乍一看,我就能清楚地看出,Syrus博客中的一些图片是AI生成的,因为这些插图的眼睛下垂,身体其他部位也有畸形——这是AI试图表现人体的明显迹象。

现在,我们文章的文本是用AI改写的吗?我联系了博客背后的人,想了解更多关于他们是如何制作博客的信息,并通过电子邮件收到了确认,一家意大利营销机构创建了这个博客。他们声称在写作过程中使用了AI工具。“关于你对抄袭的担忧,我们可以向你保证,我们的内容创作过程涉及使用AI工具,这些工具可以分析和整合来自各种来源的信息,同时始终尊重知识产权,”一位使用Daniele Syrus这个名字的人通过电子邮件写道。

他们指出,被抄袭文章底部唯一的超链接就足以构成署名。虽然总比没有好,但一个甚至没有提到出版物名称的链接不足以构成对抄袭的辩护。此人还声称,该网站的目标不是从谷歌的搜索引擎获得点击量,而是测试多种语言的AI算法。

当通过电子邮件联系谷歌征求回应时,谷歌拒绝就Syrus发表评论。“我们不对特定网站发表评论,但我们更新后的垃圾邮件政策禁止为了在谷歌上获得排名而大规模创建低价值、非原创内容,”谷歌发言人梅根·法恩斯沃斯说。“我们会对全球范围内不遵守我们政策的网站采取行动。”(法恩斯沃斯曾是WIRED的员工。)

查看谷歌的垃圾邮件政策,似乎这个博客确实直接违反了该公司关于在线抓取数据的规定。“滥用抓取数据的例子包括:……从其他网站复制内容、只做轻微修改(例如,用同义词代替或使用自动化技术)并重新发布的网站。”法恩斯沃斯拒绝证实这个博客是否违反了谷歌的政策,也拒绝证实该公司是否会根据这篇报道降低它在谷歌新闻搜索结果中的排名。

那些写原创文章的人能做些什么来适当地保护自己的作品?目前还不清楚。不过,在我与SEO专家进行的所有对话中,有一条主线贯穿始终,那就是一种挥之不去的焦虑感。

“我们的行业遭受着某种形式的创伤,我并不是在开玩笑,”在线链接建设服务公司Forte Analytica的顾问安德鲁·博伊德说。“我认为,造成这种情况的主要原因之一是,如果你是那些受到影响的出版商之一,你就没有任何追索权。你一觉醒来,突然发现你的流量减少了50%。”博伊德说,在过去几年里,谷歌的搜索算法更新导致一些网站失去了大部分访问者。

虽然许多SEO专家对谷歌缺乏透明度感到不满,但并非所有与我交谈的人都批评搜索结果中充斥着垃圾邮件。“事实上,谷歌在这方面没有得到足够的认可,但谷歌面临的最大挑战是垃圾邮件。”《产品导向型SEO》一书的作者埃利·施瓦茨说。“因此,尽管我们对谷歌现在的质量有很多抱怨,但你不会在搜索硬件时发现成人网站。他们做得已经足够好了。”该公司继续发布规模较小的搜索更新,以打击垃圾邮件。

是的,谷歌有时会为用户提供良好的体验,在用户搜索不相关的热门查询时,保护他们免受粗俗色情网站的侵害。但我们仍然有理由期待世界上最强大的公司之一——对在线内容的创作、分发和消费方式有着巨大影响力的公司——在过滤新闻搜索结果中的抄袭和无用内容方面做得更好。

“这让人沮丧,因为我们看到我们正在努力做正确的事情,然后我们看到这么多低质量的AI内容的表现超过了我们,”雷说。“所以我希望这只是暂时的,但它正在我们的行业中导致很多紧张和敌意,这是我个人在15年来从未见过的。”除非那些充斥着AI内容的垃圾网站从搜索结果中消失,否则出版商将没有动力去创作高质量的内容,而用户也将没有理由去信任出现在谷歌新闻搜索结果顶部的网站。

0 阅读:0

球千任谈科技

简介:感谢大家的关注