大概2个月前,有一次 AI 大模型发展方向的大辩论,或者叫做大争论吧,whatever,争论的双方核心人物,就是杨植麟和朱啸虎。
争论的中心议题,就是国内的 AI 发展方向,究竟是应该跟随 OpenAI 的脚步继续拼科技,拼技术呢?还是说,就跟在 OpenAI 屁股后面找找能落地的点,打小规模的战斗。
再直白点,就是国内的 AI 发展,到底是去和 OpenAI 比刀枪,还是说,跟在 OpenAI 后面喝汤。前者非常烧钱,风险巨大,后者摊子小,更有确定性的盈利。
首先,我作为一个 AI 开发者来说,那我肯定站杨植麟。说实话,国内技术开发的氛围比较差,你要说你想去追逐星辰大海,100个人里会有98个对你说,你没病吧?有杨植麟这样的人能够喊出愿意做技术创新,本身已经不错了,我当然支持。
不过返回头来看,我认为,朱啸虎其实说的也没错。国内这个国际这个竞争环境,真的是非常激烈。你稍微慢一步,搞了大半年的 AI 模型就成了垃圾。去年有个公司曾经给了我一个 offer,说实话,薪资真的很丰厚,我也非常感谢那家公司的老板。但是我当时还是问了他一个问题,自研的 LLM 打算如何盈利呢?尤其是,在国内“百模大战”的环境下。我至今仍未找到答案。
但是,朱啸虎说的其实还是有问题的。问题在哪呢?还是从互联网说起吧。
从 2000年开始,中国家庭里逐渐普及了电脑,又从 2012年开始,中国又逐渐普及了智能手机,互联网发展了这么多年,其实你可以看到,这玩意并不直接创造价值,而只是改变了物资和信息的传播渠道和生活方式。
过去,我们去农村集市上买鞋买衣服,后来在城市里,我们又去商场里买鞋买衣服。
到了现在,网上购物成为了主流。人们需要的衣服鞋子,还是那些。你不可能说,你有6条胳膊,3个身体,消费的衣服能够翻倍。
同样地,你也不可能说过去吃饭吃3两米饭,现在一顿能干8两。这不可能。
衣食住行皆是如此。总归来说,人们的需求总量有限。互联网只是改变了物资和信息的传递方式。而本身并没有创造太多额外新的需求。
于是,移动互联网进入了寒冬。反正在我的朋友圈,脉脉、知乎、公众号里,裁员的信息遍地都是。你稍微关注一下,就能找到一大堆。
而且很多公司把裁员搞得十分恶臭,明明是裁员,纯粹就是经济问题,员工们其实并不开心,对未来满满地焦虑。而很多互联网公司非要把裁员说成“毕业”,搞得好像公司和员工之前情深意重,一会是员工(还被称为“同学”)从公司毕业了,一会是公司和员工后会有期,江湖再见。
我的妈呀,其实不少公司都把裁员这事,搞得,明面上特别绿茶,特别装13,暗地里又杀伐狠辣果断,毫不留情。
话说回来,其实很简单,互联网的寒冬,一个核心原因,就是,人们找不到新的需求了。
穿,我可以网上购物,吃,我可以点外卖,行,我可以手机打车,住,我可以网上订酒店。玩,有手机游戏,娱乐,我可以看短视频消磨时间。
你会发现,一个人的一整天时间,已经完全可以被互联网支配了,你几乎抽不出别的时间来搞别的。就连你说你放下手机去健身,互联网照样有对应 的健身 app来填充你的时间和需求。人们一天的所有时间,都被互联网狠狠地填满。
再也挖不倒什么重要的需求,于是,移动互联网进入寒冬。裁员潮来临。
恰逢 OpenAI 凭借 ChatGPT 一炮而红。互联网又把目标转到了 AI 上。
AI 的爆火,其实是受到了互联网寒冬的影响的,互联网的冬天越是寒冷,AI 就越显得爆火。因为好不容易,有 AI 这个概念是这么得出圈,这么得漂亮。
回到朱啸虎的那个论点上来看,跟在 OpenAI 后面,跟在开源模型后面做应用,可行吗?表面上,当然可行。但实际上,还是难以挖掘需求。我们前面说了,互联网的萎缩和裁员,本来就是大家找不到新的需求了,那么,利用 AI 找需求同样很难。
是,你可以找到 AI 面试,AI 辅助协作,AI 作画等等。但是,除了这些呢?还有哪些?
其实,“百模大战”打了一年,烈火烹油。每一家模型都是大张旗鼓地宣传完了之后,把模型开放出来,供用户问答使用。
然后呢?其实大家很清楚,这样不行,不落地,不赚钱。
大家也在找,怎么能落地,怎么能赚钱?需求在哪里?
这次 AI 的发展,远不同于以往。在过去,我说,我利用了 VGG 深度模型实现了图像分类,应用在 XX 领域,我说我使用了 Bert,在文本信息抽取上取得了 YY 的应用。
客户和广大用户都懵了,什么是 VGG,什么又是 Bert?
实际上,在过去,AI 始终都是局限在一个小圈子里的东西,前些年,深度学习开始流行。什么公司对外宣传都在吹自己应用了深度学习,在自己的业务上体现了很大的价值。
真的是这样吗?狗屁!
忽悠外行罢了。在2020年以前,如果你非要细数,AI 在产业中的具体落地应用的话,人脸识别是一个,道路交通车牌识别是一个,指纹识别是一个,机器翻译是一个,某些细分工业领域的应用是一个,其它呢?能数出几个来?
数不出几个来。
AI 无非就是机器代替人类的高阶形式。
而在过去,如果把人类所能够完成的各种工作总量算作 100% 的话,AI 能替代的工作不到 1%。
我们天天喊着 AI 科技,其实,AI 根本就干不了多少事情。
我粗略的认为,ChatGPT 这样的模型出来,能够替代的人类的工作总量,其实也就10%左右。当然,这个数字是我瞎拍的。这个数字的真实含义就是,ChatGPT 能够替代的人类的工作量,远远大于过去的 AI 模型,而当前这次 AI 大模型的爆发,实际上就是深度学习2.0时代。但,这些大语言模型实际上依然替代不了很多人类的思考和工作。
一方面,互联网行业实在找不到太多能够推进的业务和需求了,另一方面,AI 其实仍然不能大规模地替代人类。
这就是我认为朱啸虎说的有问题的点。你想落地,想找需求,但是,这种需求仍然是不多的。
我身边所接触的小老板们,他们的业务也并非 AI 相关,看到 AI 行业去年至今,火了一整年,大家都非常着急,想着如何能够利用 AI 搞搞落地和突破。
其实,绝大多数人,折腾一番,最后发现,毫无意义。原因很简单,AI 还没那么强,AI还没那么有效。
然而,大家的日子都紧衣缩食熬这一次互联网经济寒冬,大家都迫不及待地找 AI 的落地点,想落地的心情实在是很迫切。盲目觅食一圈,才发现所获无几。
当然,你可能也听说过,有人利用 AI 搞自动面试,效果拔群,还盈利了,有人搞 AI 复原真人,也日进斗金。
不过,这些新闻,经过自媒体的渲染,就有一种什么感觉呢?没错,就是传销的感觉。我曾经记得,90年代的时候,郑州一带传销很盛,有个普通女工搞传销,把自己搞成了千万富婆。她人早已不在江湖,但她的故事传遍了江湖。
总之,这些 利用 AI 应用落地成功的例子,反而像是一剂强心针,给很多创业者和团队打了一次又一次。彷佛就是兴奋剂。
其实,OpenAI 干的就是另外一条路,拓宽 AI 的能力,从而搞出新的需求。奥特曼本人也非常清楚。当前的AI 水平,顶多能替代 10%的人的工作,之后再加上多模态,可能能到20%?maybe,总之就是,不太多。
人们太需要新方向,新需求了。而杨植麟想做的(如他所说),就是 OpenAI 想做的事情,只不过,是一个中国版本。
说起中国创新,我感觉这是一个非常恶臭的词汇。中国人的思想,中国的体制,中国的文化氛围,内卷氛围,几乎都和真正的科技创新搭不上界。
ChatGPT 能诞生在 OpenAI,诞生在美国。
但是我要说,假如中国搞出了 GPT2,有可能接下来搞出 GPT3.5,也就是 ChatGPT吗?
若你问我一万遍,我也回答,没可能。
如果是在高校里,研究所里,各种院士和专家、领导会质疑,GPT2 这种模型毫无意义,没有创新,不予拨款。
如果是在科技公司里,老板会直接质疑,除了能发论文,GPT2 能拿来赚钱吗?什么,给你一年时间,这玩意不能赚钱?好了,不用研究了。
反正,这样的事情,我本人深有体会。ChatGPT 在中国毫无研发出来的可能,哪怕平行宇宙平行了100次。
所以,其实也可以看到各种对中国创新的嘲讽。这些嘲讽绝大多数都来自失望到习以为常的普通人。
之前有个同学的父亲,曾经把中国的知识分子,称作“吃屎分子”。原因很简单,看透了前面我所说的这一切。
话说回来,即便如此,我还是对中国创新心存一丝希望。我觉得,不至于吧。我们除了互联网应用创新,也能搞出来从 0到1的革命性创新。
如果看月之暗面至今的发展,我个人认为还是不错的。原因在于,月之暗面在产品推广时,有一个非常亮眼的点,那就是超过 200万 token 上下文的无损理解。
其实,自研 AI 大模型,打来打去,为啥都打不过 OpenAI?很简单,因为 OpenAI 是第一个吃螃蟹的公司。后来者再去吃螃蟹,也就只能吃点螃蟹壳了。
OpenAI 之所以吃到螃蟹,吃得很香,原因就在于,它掌握了核心的技术,掌握了一批能够把 AI 模型搞出来的人。
月之暗面其实也通过 200万token 上下文来宣传这件事。宣传自身的团队技术实力。
若按朱啸虎的思路来看,国内上百家的 大模型团队,都能盈利吗?我看一家能盈利的都没有,包括月之暗面,迄今为止都不行。连上游大模型都不能盈利,不可持续,那下游模型的营利性其实也是个问号。
不能盈利,那搞 AI 大模型自研,意义何在?我个人认为还是走技术创新的路子。说白了,OpenAI 前些年日子也过得紧紧巴巴,自从有了 ChatGPT,翻身农奴把歌唱了,微软直接砸了100亿刀,拿去,随便花。所以,真正适合 AI 发展的路子,就是技术创新,然后融资,再创新,再融资。
核心不是盈利,而是,你得给我拿出来世界顶尖,数一数二的从 0到1的创新成果出来。
盈利其实都还是靠后的事。盈利其实是融不上资的时候考虑的事。
金融行业搞了股票,搞了融资,搞了股权,那么多东东,不就是改进生产关系,为生产力的突破做准备吗?
其实,这就回到了一个相信和不相信的问题。你对中国创新这个词,有信心吗?你是否相信,中国人真的能做出从 0 到 1 的创新?而非最后虚头八脑,一地鸡毛?
说实话,我很难分辨,毕竟,我也在工作当中,深刻地见识了太多太多的所谓的“中国创新”,打引号的。但是,我依然希望,中国能够有这么一家公司,做到这样。
说近一点,杨植麟和朱啸虎的观点无分对错。对于中小企业来说,听朱啸虎的,没三瓜俩枣,就别瞎折腾去搞 AI 自研啦。对于大公司来说,还是希望多少能够改改身上的大公司病,看得更长远一些,去做一些大公司有能力,也该去做的事。
说到大公司病,然后说说谷歌,从谷歌身上也能看到一些奇奇怪怪的现象。
今天看到一个炸裂的新闻,google 公司裁掉了 python 核心团队。也就是,我们现在程序员们天天使用的 python语言,本质上是 CPython,是谷歌的一个专门的团队在维护的。十几个人被裁,引起了很大的震动。
谷歌向来是以善待技术人员出名的,更不用说维护 Python 这个语言的挺核心的团队了。
很多人都惊掉了下巴,互联网寒冬下,谷歌也开始节衣缩食,省钱过日子了,只是,裁掉 Python 团队,劈柴(谷歌现任CEO)你确定大丈夫吗?
有人嘲讽:谷歌靠着搜索起家,很依赖 AI 技术,而 AI 技术又严重依赖 Python 语言,结果 Google 把 Python 团队连锅端了。
公司大了,总会有各种各样臃肿的管理上的毛病。我想这也和谷歌这些年开始在 AI 领域掉队有关系。按理说,谷歌掌握了全世界最全面的互联网数据,AI 人才,以及资金,想买多少英伟达的显卡买不到呢?
但就是这样的王炸级资源积累的情况下,AI 上却被 OpenAI 将了一军。问题出在哪?
我个人认为还是大企业的弊病。能不能开发出好的软件,能不能做出真正的创新,还是得看核心内在的思想和文化。臃肿的组织和很长的管理线条,导致生不出名叫创新的孩子来,实属正常。
之前,有人分析,为何国内造不出 ChatGPT,原因在于中国仍然能够通过低端的方式实现盈利和扩张。我实名反对这种说法。
其实,国内的互联网现状,早就已经挤压得不行了,实在没有新需求,那就把眼睛钉在了互联网买菜上面,打算把线下菜市场都替代掉。
其实你可以发现,大家为了争抢低端的需求,已经被逼到了极限,从牙缝里抠肉的程度。但是即便这样,有催生出真正的创新的动力吗?完全没有。大家只会看着眼前最近的一块肉,没人会去思考,往远处走走,找找新的肉。
没有,完全没有。
很大程度上,这还是内卷和大公司病导致的。
所以,一个轻量的团队还是很重要的。
最后,其实我有一点很费解。一方面,大量的人口失业,经济危机逐渐加深;另一方面,科技公司又在卯足了劲,研发 AI 技术,其结果就是更进一步地替代人类,它其实也不能创造新需求,而只是像互联网一样,转移了一部分需求,甚至是消除了一部分需求。
总而言之,社会发展,为了应对危机,需要研发AI技术,而研发出了 AI 科技,替代了人类,进一步地加深了危机。
这个内卷和危机螺旋一步套一步地往更深层次递进,谁也不知道啥时候会炸锅。到时候,作为普通人该怎么应对。
其实,搞 AI 科研的人从来不去想,我这科技会对人类产生什么影响。最典型的一个例子就是奥本海默和原子弹。
而普罗大众也很少去想,科技替代了我,我该怎么办?
过去,英国的纺织女工面对纺织机,还会砸机器,抵抗和反抗。而现在的被裁员的人们,反而像是被教育体系驯化了太久,已经完全不会做出反抗这个本能的行为动作。
这不,前一阵子,美丽国还出现了共产主义活动了么?人们生活在城市里,又丢了工作,该如何自处?实在是很难说。
总归来说,其实你会发现, AI 在向着一个奇怪的方向发展。大家都很焦虑,大家也都很期待。在期待什么呢?当然是美好的未来,但,AI 技术这个潘多拉魔盒,指不定会迸发出什么力量,来摧毁整个世界。
最后,我想说, AI 的 scaling law 是有上限的。杨立昆最近一两年,在社交媒体上,上蹿下跳,彷佛猴子一般,大家也都看戏一般看他。不过我依然认为他是对的。
现阶段,AI 始终都没有解决意识和智能这两者之间的关系。这也是各种大模型幻觉、没法 100% 对自己行为负责,人类最大的竞争力是背锅等等问题的根源。
现在的 AI 有意识吗?有意识代表有智能吗?有智能代表有意识吗?
中文房间问题,有谁能够解答这个问题?当前 AI 的一切发展,都可以追溯到图灵对计算机和设计,以及图灵测试的问题上。
我想,AI 的发展,也迟早会栽在图灵未解决的大坑里。