DeepSeek融资失控,估值被拉爆。梁文锋最开始的设计是投后估值100亿美元,但经过几轮投资,现在DeepSeek估值已达到450亿美元。
DeepSeek-R1发布当天,DeepSeek官方称模型能力对标OpenAI-o1,同时开放模型、技术报告和多个蒸馏模型,代码和模型采用MIT License,允许研究、蒸馏和商业化使用。这个动作改变了外界对DeepSeek的判断。
资本看见的不只是一个大模型公司,而是一套已经被开发者迅速使用和讨论的技术体系。融资热度从这里开始变得复杂,因为DeepSeek越受关注,愿意出钱的人越多,梁文锋要筛掉的人也越多。
首轮融资估值过高,会影响下一轮资金进入,也会加大领投方压力。领投方不只是出钱,还能影响投资条款、股东名单和后续融资节奏。
对DeepSeek这样的人工智能公司来说,钱当然重要,但谁的钱更重要。资金如果和技术路线不一致,未来就可能干扰研发节奏。
梁文锋如果想让DeepSeek继续按自己的判断推进,就必须在估值、股份和规则之间反复取舍。外界看到的是估值一路被抬高,梁文锋面对的是每一个投资人背后的长期影响。
这件事还有一条更硬的技术线。2025年9月18日,新华社科技频道转引科技日报报道称,DeepSeek-AI团队梁文锋及同事在《自然》发表DeepSeek-R1大规模推理模型训练方法。
研究显示大语言模型的推理能力可以通过纯强化学习提升,从而减少增强性能所需的人类输入工作量。强化学习,就是让模型在解决任务后根据反馈调整策略。
DeepSeek-R1受到关注,原因不只是发布得快,而是DeepSeek把训练方法变成了可以被学术界和产业界继续研究的成果。
技术声量起来以后,梁文锋的身份也被放进更大的产业坐标里。2025年2月17日,民营企业座谈会在北京召开。
人民网《人民日报海外版》2025年2月19日报道提到,宇树科技创始人王兴兴和DeepSeek创始人梁文锋受到关注,DeepSeek、宇树科技、游戏科学、强脑科技、群核科技、云深处科技被网友称为“杭州六小龙”。
这说明DeepSeek已经不只是融资市场里的热门项目,而是杭州创新生态中的代表性科技企业。
所谓估值被拉爆,表面是资本热,深处是技术路线被认可后带来的控制权考验。DeepSeek-R1开源带来开发者关注,公开发表的训练方法增强了技术可信度,“杭州六小龙”现象又让梁文锋站到更大的产业舞台上。
到这个阶段,融资不再只是把钱拿进来。估值越高,选择越少,条款越细,梁文锋越要谨慎。要看最终进入股东名单的资金,能不能和DeepSeek继续走长期技术路线保持一致。
