早在2023年DeepSeek刚成立时,大部分开发人员是应届毕业生,或AI从业时间不长。如果追求短期目标,招聘有经验的人当然没错,但从长远来看,基本技能、创造力和热情更为重要。
DeepSeek团队里顶尖高校毕业生扎堆,很多都是刚出校门或还没毕业的年轻人。这些人有个特点:对技术的纯粹追求,可能暂时压过了对金钱的渴望。
梁文锋还给这些人画了一张足够大的饼,不是那种虚的饼,是实实在在的技术突破。
4月24日,DeepSeek V4预览版发布,Pro版参数高达1.6万亿,支持百万上下文,价格还特别“感人”:Pro每百万token输入1元(缓存命中)或12元(缓存未命中),输出24元。
比参数更震撼的,是技术报告里那份长长的作者致谢名单。近300个名字,梁文锋的名字和所有研究员、工程师排在一起。已离职的成员,也被郑重地标注出来。
这种仪式感,在技术圈里很受用。社交平台上,网友们热烈讨论:“看到我的名字了”、“也有我的”、“希望这种氛围能成为大多数”、“这才是真正的研究团队”……
但光靠情怀是留不住人的。梁文锋在V4技术报告里,把华为昇腾和英伟达并列写在验证平台。DeepSeek在英伟达坚固的CUDA生态上,硬生生敲开了一条裂缝。
国产算力大规模铺开后,Pro版本的价格会进一步下调。到时候,国产算力的成本优势,可能会让DeepSeek在价格战中拥有核武器级别的优势。
这种技术上的“降维打击”,比任何股权激励都更能让技术团队兴奋。