美国的外交电报突然发往全球。白纸黑字只有一句话:警告所有国家,离那个叫DeepSeek的中国模型远点。就在这份警告信满世界飞的时候,杭州的办公大楼里,DeepSeek的团队甚至连发布会都没开。他们只是在官网上默默更新了一份技术报告,V4预览版直接上线。
5月6日,外媒报道,DeepSeek正在进行首轮融资谈判,估值最高可能接近500亿美元,资金将用于扩充算力和改善团队待遇。
这个消息一出来,我的第一反应不是“它值多少钱”,而是:一个曾经被很多人当成“突然冒出来”的中国团队,已经被全球资本、产业和政策一起放到了聚光灯下。它不再只是一个技术新闻,而是中美科技竞争里绕不开的名字。
再往前看,4月24日这一天很有意思。美国国务院电报被媒体曝光,说要提醒各国注意中国AI模型的所谓风险;同一天,DeepSeek-V4预览版上线并开源。一个忙着提醒别人远离,一个忙着把模型拿出来给全世界试用。这样的对比,不需要太多修饰,普通人也能看懂。
美国担心什么?表面上是“蒸馏”、数据、安全、知识产权。可我觉得,更深处是另一种不安:过去前沿AI的玩法,基本是少数巨头关起门来训练模型,再用昂贵接口卖给全世界。谁有芯片、谁有资金、谁有云平台,谁就能坐在上游。现在中国公司突然用更低成本、更开放的方式,把强模型摆到台面上,这就动了原来那套生意的根。
当然,DeepSeek也不是神话,没必要把它说成天下无敌。美国国家标准与技术研究院下属机构5月1日发布评测,认为DeepSeek-V4 Pro整体能力仍落后于最前沿模型约数月。
这一点反而说明,中国AI的进步不是靠宣传吹出来的,而是在真实评测、真实竞争、真实质疑里往前走。技术世界最讲硬实力,夸大没有用,能被下载、能被调用、能被开发者留下来用,才是真的。
DeepSeek-V4这次最值得注意的,不只是参数大。官方资料显示,V4-Pro是1.6万亿总参数、49B激活参数,V4-Flash是284B总参数、13B激活参数,并支持百万级上下文。
对普通用户来说,这些数字可能有点冷冰冰;但换成大白话,就是它更能读长文档,更适合复杂任务,也更照顾成本。尤其是Flash版本,名字里就写着“快”和“省”,这恰恰是AI真正普及必须迈过的一道坎。
我很喜欢这种方向。因为科技如果只服务少数大公司、少数富裕市场,那它再先进,也少了点温度。中国这些年一直强调人工智能要服务产业、服务民生、服务实体经济。
2025年8月,国务院发布深入实施“人工智能+”行动的意见,提出到2027年推动人工智能与重点领域深度融合;2026年全国层面的新规划又继续强调AI与制造、医疗、教育、物流等场景结合。这不是空泛口号,而是给企业和开发者明确方向:模型不是摆在展厅里的奖杯,而是要进工厂、进学校、进医院、进千行百业。
所以,DeepSeek真正让人感到振奋的地方,不只是它让谁紧张了,而是它给出了一个中国式答案:在外部限制不断加码的情况下,不抱怨,不躺平,用算法、工程和生态去补短板。别人说没有顶级芯片就做不成,中国团队就想办法把已有条件榨出更高效率;别人把门槛越垒越高,中国团队就选择开源,让更多人进来一起试、一起改、一起用。
这不是要和谁赌气,而是科技发展本该有的样子。世界不需要只有一种AI路线,也不该由少数国家、少数公司决定谁能使用先进工具。中国坚持开放合作,也坚持自主创新,这两点并不矛盾。越是有人试图把技术变成围墙,中国越要把自己的路走稳、走实、走宽。
回头再看那封外交电报,它当然会造成噪音,也会带来压力。但压力从来不是中国科技第一次遇到。真正重要的是,杭州那份安静更新的技术报告已经说明了一件事:警告可以写在电报里,创新却写在代码里。电报飞得再远,也挡不住全球开发者用脚投票;声音喊得再高,也盖不住中国AI继续向前的脚步。
