DC娱乐网

离职率不到4%!DeepSeek员工为何愿意跟着梁文锋“吃苦”?

过去一年,中国大模型江湖打得最凶的,不是参数,是人才。字节给郭达雅开出的薪酬包,业内传闻高得吓人;小米挖走罗福莉,直接让

过去一年,中国大模型江湖打得最凶的,不是参数,是人才。字节给郭达雅开出的薪酬包,业内传闻高得吓人;小米挖走罗福莉,直接让她负责MiMo大模型部门;腾讯、百度更是挥舞着钞票,见一个挖一个。

在这场“天价薪酬”的人才大战中,DeepSeek创始人梁文锋却交出了一份让人意外的成绩单:V4研发期间,近270人的核心研究工程团队,只走了大概10个人。

这是什么概念?对比OpenAI,他家前两年就流失了超过25%的关键研究人才。梁文锋留住了97%的员工,离职率不到4%,这在大模型江湖堪称“武林至尊”一样的表现。

在AI这个赛道能活下来的,是那些既懂技术,又懂人性,还懂什么时候该打开钱袋子的“聪明人”。

梁文锋,显然就是这样的聪明人。

“理想”遇上“真金白银”

2025年初,DeepSeek R1一炮而红的时候,梁文锋是有底气的。背后站着幻方量化,市场估算其盈利能力足以养一个AI团队绰绰有余。

那时候的投资人,排着队想给钱。腾讯、阿里、红杉、高瓴……哪个不是带着支票簿来的?但梁文锋一一婉拒。他的理由很“技术极客”:“我们不做应用,只做研究和探索”。

理想很丰满,现实却很骨感。骨感的地方在于,当大厂给核心人才开出的薪酬包高得令人咋舌时,DeepSeek员工手里的期权,还只是一张“白条”。

没有外部融资,就没有市场化估值。没有估值,期权就是纸上富贵。猎头圈流传,大厂给DeepSeek核心人员的开价,普遍是原薪资的两到三倍,更重要的是包括可立即定价的期权。

于是,裂缝出现了。V3架构的关键贡献者罗福莉去了小米,第一代大语言模型核心作者王炳宣加盟腾讯,多模态骨干阮翀转投元戎启行,还有核心成员在春节前后离开。

R1核心算法GRPO的提出者郭达雅,去了字节跳动Seed团队。尽管字节方面对传闻中的天价薪酬予以否认,但其获得的薪酬包显著高于DeepSeek时期,是行业普遍认知。

有消息称梁文锋后来对此有所反思,比如:加大团队建设资金投入、提升员工工资水平、增发奖金、丰富员工福利等。

总之,“得加钱”。

97%的“奇迹”是怎么来的?

但神奇的是,走了几个大牛,DeepSeek的研发团队居然基本没散。绝大多数人留下来了。

这就要说到梁文锋的“人才玄学”了。

早在2023年DeepSeek刚成立时,大部分开发人员是应届毕业生,或AI从业时间不长。如果追求短期目标,招聘有经验的人当然没错,但从长远来看,基本技能、创造力和热情更为重要。

DeepSeek团队里顶尖高校毕业生扎堆,很多都是刚出校门或还没毕业的年轻人。这些人有个特点:对技术的纯粹追求,可能暂时压过了对金钱的渴望。

梁文锋还给这些人画了一张足够大的饼,不是那种虚的饼,是实实在在的技术突破。

4月24日,DeepSeek V4预览版发布,Pro版参数高达1.6万亿,支持百万上下文,价格还特别“感人”:Pro每百万token输入1元(缓存命中)或12元(缓存未命中),输出24元。

比参数更震撼的,是技术报告里那份长长的作者致谢名单。近300个名字,梁文锋的名字和所有研究员、工程师排在一起。已离职的成员,也被郑重地标注出来。

这种仪式感,在技术圈里很受用。社交平台上,网友们热烈讨论:“看到我的名字了”、“也有我的”、“希望这种氛围能成为大多数”、“这才是真正的研究团队”……

但光靠情怀是留不住人的。梁文锋在V4技术报告里,把华为昇腾和英伟达并列写在验证平台。DeepSeek在英伟达坚固的CUDA生态上,硬生生敲开了一条裂缝。

国产算力大规模铺开后,Pro版本的价格会进一步下调。到时候,国产算力的成本优势,可能会让DeepSeek在价格战中拥有核武器级别的优势。

这种技术上的“降维打击”,比任何股权激励都更能让技术团队兴奋。

融资,不是为了活下去,是为了“定价”

DeepSeek融资的消息传出时,圈内人一点都不意外。

从十几亿到几十亿美元的传闻都有。更引人关注的是,领投方可能是国家级基金。

梁文锋这次融资,目的很明确:不是缺钱,是要给员工手里的“白条”定价。

没有估值的时候,员工跳槽出去,薪资翻两三倍。有了估值,哪怕只是纸面富贵,也能让员工心里有个底:我在DeepSeek的期权,值多少钱。

4月27日,DeepSeek注册资本由1000万元增加至1500万元,梁文锋认缴的注册资本由10万元增加到510万元,直接持股比例由1%升至34%。

这样一来,如果开展融资尽调,DeepSeek股权结构会显得更加清晰。

其实,就是告诉投资人:别担心,公司还是我说了算。

顺便告诉员工一声:别慌,期权有价了。

国产芯片的“阳谋”

DeepSeek V4适配华为昇腾等国产芯片,这步棋下得很大。多家国产芯片厂商,在V4发布当天就完成了适配。

二级市场立刻给出了反应,国产芯片板块集体大涨。

当底层芯片商与头部大厂开始围绕DeepSeek的标尺去咬合进化时,DeepSeek或许已经跃出了原本的竞争牌桌。

字节、腾讯、阿里三大国内头部互联网企业,已经就新增芯片订单与华为展开接洽。DeepSeek不仅自己做模型,还在定义国产AI的算力标准。

这种“生态位”,比单纯做个大模型公司,值钱多了。

慢就是快?

梁文锋和DeepSeek,一直走在一条“反共识”的路上。

别人疯狂融资的时候,他拒绝所有投资人。别人快速迭代的时候,他V4憋了15个月。别人追逐多模态的时候,他先放了个预览版,多模态能力慢慢来。

但就是这个“慢”公司,在人才大战中留住了超过97%的核心团队。就是这个“慢”公司,在国产芯片适配上一马当先。就是这个“慢”公司,估值从0开始一路攀升。

梁文锋的“人才保卫战”,第一回合算是赢了。超过97%的留存率,在AI圈堪称奇迹。

但第二回合才刚刚开始,融来的钱怎么花?国产芯片的生态能不能真的建起来?V4之后,还能不能继续领先?

这些问题,梁文锋得用下一个97%来回答。