大厂们烧了几百亿现金做AI,结果被一家做量化交易的公司偷了家。
DeepSeek之所以能杀出一条血路,其实只靠三招。
第一,极致压缩成本。V3模型训练只花了557万美元,连GPT-4训练成本的零头都不到。背后的幻方量化主业赚钱,根本不靠融资输血,没有大厂那种不烧上百亿不好意思说在做AI.的包袱。
第二,全面开源。不是发个阉割版开源装装样子,是直接把模型权重、技术论文、训练细节全扔出来。开发者拿来就能用,三天就能基于R1搭个demo。大厂砸了整年的自研闭环,被这一招直接打成了性价比低得不能看。
第三,聚焦单点打穿。不到200人的团队,没有人人OKR、层层汇报、跨部门拉通那些大厂病。每人都在深度思考状态,研发效率是大厂团队的好几倍。
结果呢?腾讯第一个接入DeepSeek,百开始开源文心,字节紧急加班整合。一家初创公司,逼得全行业转向。
说白了,这仗打的就是:大厂的强项是砸钱堆人,DeepSeek的强项是让砸钱堆人变成没用…
