否认放弃大模型,百度目前并不打算因小失大

三易生活 2024-09-18 22:04:51

最近,网络上突然传出百度要放弃通用大模型研发的消息。要知道就在去年举行的中关村论坛上,百度创始人李彦宏还曾表示,“AI大模型将改变世界,百度要做第一个把全部产品重做一遍的公司”。毫无疑问,All in AI是过去一年百度的基调,但这个传言直指他们突然要不做大模型了。

如此强烈的反差,自然也引得各路吃瓜群众下场。眼见这个消息越传越广,百度文心一言的市场部负责人张全文在朋友圈辟谣,“所谓‘放弃通用大模型研发’纯属谣言!文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。”

事实上,从百度近期的一系列动作来看,怎么看也不像要放弃大模型的样子。就在不久前,百度方面宣布文心一言App升级为文小言,定位百度旗下的“新搜索”智能助手,并带来富媒体搜索、多模态输入、文本与图片创作、高拟真数字人。而在两个月前,他们才刚刚发布了文心大模型4.0 Turbo。

那么问题就来了,近年来一直押注AI,且进入2024年以来也继续在大模型上投入资源的百度,关于他们要退出大模型研发的谣言为什么会有市场呢?

不同于以往的传言,这次谣言的作者用洋洋洒洒数百字给出了一个逻辑自洽的帖子。给出的理由,是下一代大模型的研发成本高昂,且当下大模型缺乏可行的变现渠道,唯独拥有现金奶牛的厂商才烧得起钱。

大模型的研发成本越来越高这件事,确实是事实。按照Anthropic首席执行官Dario Amodei此前在播客节目中的说法,该公司目前正在开发的AI模型训练成本高达10亿美元,并且他还预测,训练大模型的成本将在短短三年内就上升至100亿美元的水平。

同时更让AI厂商烦恼的,是直到今天,不光大模型本身不挣钱,使用大模型作为基座的各类AI应用也赚不钱,使得他们都押注下一代大模型的智能化水平会再一次出现跃迁,让AI Agent得以落地。从某种程度上来说,现在的大模型研发已然变成了一场“胆小鬼游戏”,而在一众大厂里百度确实是最“胆小”的。

根据百度方面此前发布的2024年第二季度财报显示,其最大的收入来源线上广告业务该季度收入为192亿元、同比下滑2%。造成这一结果的原因,是AI在搜索结果内的渗透率达18%,但由于并未商业化,进而拖累了广告收入的增长。而在B端的百度云业务中,9%的收入来自外部客户使用大模型及生成式AI相关服务,这个数字显然还不足以证明AI重塑了百度云业务。

最致命的风险是Scaling Law没有失效,以至于通用大模型的开发看起来就变成了无底洞。而Scaling Law是指大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,换而言之,只要继续堆参数、堆算力,大模型的性能就会进步。例如OpenAI刚刚发布的“草莓”大模型(OpenAI o1),就继续验证了Scaling Law的有效性。

Scaling Law对于绝大多数体量有限的大模型开发商显然不是一个好消息,因为这意味只要肯花钱,大模型就一定会进步。简而言之,现在的大模型开发已经变成了一个纯粹的氪金游戏,购买英伟达H100等算力卡、雇佣专业的AI科学家、清洗出更高质量的语料,乃至向外界宣传大模型,样样都离不开钱。

可问题在于,市值300亿美元、现金储备550亿人民币的百度在一众大厂中并不出挑,而且现在百度的AI战略是大模型和AI应用全都要。一边是“橙篇”、“文小言”,以及智能体联盟解决方案,另一边是要在2025年亮相的文心大模型5.0。相比于搞得风风火火的文小言和智能体,文心大模型在今年确实显得缺乏亮点。

月之暗面的Kimi开启了大模型内卷长文本的先河,幻方的SeepSeek消除推理时间键值缓存的瓶颈,未来极有可能会成为所有模型共同采用的优化方式。可反观百度的文心大模型,目前最强的ERNIE-4.0-Turbo-8K旗舰级模型在跑分上也已经成为了追赶者。

因此这样看来,放弃大模型是一个在商业层面说得过去的决策。只不过如果百度真的选择放弃大模型的研发,就意味着它要从牌桌上下来,这对于百度的品牌价值而言就会是一个巨大的打击。要知道早早打出“All in AI”的百度,一直都是国内AI赛道的领跑者,放弃大模型就等于放弃了通往未来的船票。

当年百度已经为错失移动互联网时代付出了巨大的代价,如果现在真的要继续放弃AI时代的入场券,恐怕接下来“BAT”的含义就要变了。

0 阅读:47

三易生活

简介:专注IT,最快最专业资讯!