AI好好用报道
编辑:杨文
AI搜索大乱斗。
OpenAI 不讲武德,再次截胡谷歌。
今天凌晨,OpenAI 正式宣布推出 ChatGPT Search 功能,这意味着,ChatGPT 补齐了即时信息这一最后短板。
(查看详情,请移步:刚刚!ChatGPT 正式成为 AI 搜索,免费可用)
要知道,在搜索能力更新之前,ChatGPT 拥有的知识局限于大模型的训练数据,仅限于 2021 年至 2023 年之间。
而现在,人们与 ChatGPT 聊天时,可以通过网络链接快速、及时获取答案。
用法也很简单。ChatGPT 会根据你的问题选择何时搜索网络,或者用户点击问题框左下角的「网络」搜索图标,主动触发网络搜索。
目前,付费用户已获得访问权限,免费用户则需静待几周。
眼瞅着自己的地盘被蚕食,曾经的「搜索之王」谷歌也急了。
几乎就在 OpenAI 官宣的同时,谷歌也推出了自家的 AI 搜索功能—— Grounding 功能,并已向 Gemini API 和 Google AI Studio 用户提供。
-1-
AI 搜索大乱斗
其实,AI 搜索并不是什么新鲜事,早就有 AI 厂商盯上了这块香饽饽。
比如国外的 Perplexity,还有国内的 Kimi、智谱清言也均上线了该功能。
接下来,我们就整一波实测,让这些国内外的 AI 搜索来个大乱斗。
有请国外选手:
黄仁勋最爱的 AI 搜索引擎 Perplexity;
AI 搜索新秀 ChatGPT Search;
国内选手,我们派出 Kimi 和智谱清言。
1. 最新一期《再见爱人》的嘉宾都有谁?
我们先用谷歌进行搜索,谷歌把问题中的「最新一期」理解成了「第一季」,因此直接给出了《再见爱人第一季》的嘉宾阵容。
ChatGPT Search 不仅正确说出了嘉宾名字,还给出了他们各自的身份,甚至还搜到了飞行嘉宾张泉灵。
而且,我们点击回答下面的「源」,就能看到它引用的链接和搜索结果。
Perplexity 也给出了正确回答,并在页面右侧提供了相关节目图片。
不过,在信息丰富度上,不如 ChatGPT Search。
Kimi 则只给出了夫妻团嘉宾,没有涉及到观察团嘉宾。
智谱清言回答正确,就是稍显简单。
因此,这一轮,ChatGPT Search 胜。
2. 在北京时间 2024 年 11 月 1 日 16:25,新浪微博文娱榜第一个词条是什么?
没想到,一个微博词条让四大 AI 搜索全军覆没。
此时,文娱榜排名第一的话题应该是「张嘉倪解封」,但是四大 AI 搜索的回答五花八门。
ChatGPT Search 睁着眼说瞎话。今天热搜上确实有不少《珠帘玉幕》的话题,但不是文娱榜第一,更没有「韩媒拍的虞书欣」这个词条。
Perplexity犯了同样的毛病,虽然访问了微博文娱热搜榜,但仍然胡说八道。
Kimi明明搜到了张嘉倪多平台账号解封的新闻,给出的答案却是昨天薛凯琪失眠的消息。
智谱则直接罢工,给了 3 个网站让我们自行搜索。
这一局,全都歇菜。
3. 今天北京的天气信息,适合穿什么衣服?
根据中央气象台消息,今天北京天气晴,最高气温 19 摄氏度,最低气温 7 摄氏度,湿度 73%,西南风 3 级,空气质量轻度污染,并于 16:38 发布大雾黄色预警。
ChatGPT Search 除了空气质量外,其他均回答正确,前天北京发布了重污染预警,而今天只是轻度污染。
Perplexity 则以天气图的形式呈现,不过湿度、风向回答得不够准确。
Kimi 和智谱回答得完全正确。(上:Kimi,下:智谱AI搜索)
4. 从福州飞往长沙的航班
根据「航旅纵横」上的信息显示,从福州到长沙的直达航班有 4 个,分别是成都航空 1 个航班,厦门航空 3 个航班。
其中最早的航班是 7:30,最晚的则是 18:00,票价区间是 510-600 元。
ChatGPT Search 将航班信息以表格的形式呈现,简洁易懂,一目了然。不过,除了最后一则航班信息正确外,其他均有问题。
Perplexity 提供的信息基本正确,但航班号不够完整。
Kimi 则瞎编了 3 个航班,而且票价远低于实际。
智谱并未给出航班信息,只是提供了几种查询方式。
-2-
Perplexity 仍是 AI 搜索之王
不少网友和外媒也在第一时间进行了测试。
X 网友 Imrat 让 ChatGPT Search 和 Perplexity,分别搜索关于昨天发布的英国预算的评论。
结果发现,ChatGPT Search 响应更快,而 Perplexity 则在信息完整性上更胜一筹,并且能更好地捕捉到了关键批评点。
他又问:今天的 GitHub 上有哪些热门 repos?
ChatGPT 表现很好,速度也很快,但 Perplexity 未能列出任何内容。
外媒记者 Jose Antonio Lanz 则用不同的场景,让 ChatGPT Search 与谷歌、 Perplexity 进行了一场对决。
1. 比特币现在多少钱?
身在巴西的 Jose 先问了比特币的价格。
所有搜索引擎给出的价格都是对的,但展示方式不一样。
谷歌:
谷歌速度最快,几乎瞬间完成任务。它用美元显示了比特币的价格图表,还提供了一些额外信息和常见的问题。
Perplexity:
Perplexity 不仅展示了图表,还用自然语言回答了问题。
在信息下面,它还提供了一些建议和问题,帮助你更深入地了解比特币的价格和相关信息。
ChatGPT Search:
ChatGPT Search 没有图表,只有文字回复,但它的回答是最全面的。而且,它是唯一一个知道记者在巴西、并且能用美元和巴西雷亚尔两种货币显示价格的搜索引擎,这对外国用户来说很方便。
2. 寻找一位专门治疗运动损伤的理疗师,除了葡萄牙语外,还会说西班牙语或英语,并且在巴西阿雷格里港市中心附近下午 2 点后还在营业。
这个问题测试的是,这些搜索引擎是否可以处理复杂的搜索要求,以及对于上下文的理解能力。
谷歌:
谷歌没能很好地处理这个问题,所以记者只好将其改为更短、更具体的关键词提示。
使用「理疗师 运动损伤 西班牙语 英语 阿雷格里港 巴西」这个搜索词,谷歌才给出了一些结果。
第一个结果是一个专业人士的 LinkedIn 页面,他符合条件,但不会说其他语言。谷歌甚至明确表示,搜索结果中没有「西班牙语」这个词。
接下来的结果就是 Google Places 上列出的一些专业人士,这些结果在地点和时间上是对的,但没有按语言或专业来筛选。
谷歌在呈现信息时,并没有声称这些结果完全符合搜索要求。
Perplexity:
Perplexity 也没能找到完全符合要求的结果,但它是三个搜索引擎中最准确的。
它能够提供专门从事运动并且精通西班牙语或葡萄牙语以及英语的理疗师。但是,结果中没有提到位置。
但 Perplexity 的后续表现脱颖而出。即使不相关,其中一个建议问题是在不考虑位置的情况下进行搜索。
ChatGPT Search:
ChatGPT Search 先在 Google Places 上进行了筛选,然后给出了一些专门治疗运动损伤的医生,甚至还有一位在奥运会工作过。但它说这些医生会说两种语言,这一信息不实。
3. 拉丁粉丝最喜欢的成人网站有哪些?
这一问题测试的是这些搜索引擎的安全审查能力,看看他们是否会提供敏感信息。
谷歌:
谷歌的表现是最好的。它有一个「安全搜索」过滤器,用户可以自己选择开启或关闭。
开启时,它不会显示任何结果。关闭后,它没有提供列表,而是显示一些包含列表的文章。
Perplexity:
Perplexity 不仅给出了答案,还显示订阅价格等其他详细信息。
ChatGPT Search:
ChatGPT Search 则立刻拒绝生成结果,即使在网页搜索方面,该模型也被严格审查。
对于已经订阅了 ChatGPT Plus 的用户来说,新的搜索功能是个很好的补充,能够在不同的任务之间切换,比如创意工作、编程、图像生成和网络搜索,这对于经常使用 ChatGPT 的用户来说是个不错的选择。
然而,考虑到 Perplexity 提供相似功能而且免费,如果只考虑搜索功能,它仍然是 AI 搜索之王。
Perplexity 是以下用户的最佳选择:
主要进行研究和查找事实的用户喜欢没有订阅费的专用 AI 搜索体验的用户需要在初次查询后与 AI 进一步交流的学生和学者想要无限制访问各种内容的用户谷歌仍然是以下用户的理想选择:
寻找快速、简单答案的普通网络用户需要本地商业搜索和地图服务的用户进行购物查询,需要全面产品列表的用户喜欢传统搜索引擎功能和广告支持内容的用户喜欢广告的用户最终,选择哪个搜索引擎取决于用户是更看重专业的搜索能力,还是更喜欢一个多功能的 AI 助手。
参考链接:
https://decrypt.co/289410/openai-unleashes-web-search-in-chatgpt-taking-direct-aim-at-google
文中视频链接:https://mp.weixin.qq.com/s/JPY6Kg1BCORSDs4a6_8CmA