DC娱乐网

谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了。 他带人干了件

谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了。

他带人干了件最狂的事,花五个月攻坚底层代码适配,把推理生态全面迁移到了华为昇腾上,彻底打破英伟达CUDA的独家垄断局面。

这不是简单的模型迭代升级,这是国产AI领域一次惊险的底层“换心手术”。

DeepSeek V4在4月底正式亮相,1.6万亿参数、百万token超长上下文,综合性能直接对标全球顶尖闭源大模型。行业众人都在追捧亮眼参数时,内行从业者却看出了关键变革,这款顶级模型的推理算力,全面落地华为昇腾950PR芯片。

梁文锋内部复盘时曾坦言,这次生态迁移,相当于在飞行中的飞机上更换核心引擎。技术难度拉满,全程容错率极低,稍有不慎就会导致模型性能崩盘,但他们硬生生啃下了这块硬骨头。

为了这次底层生态的全新突破,DeepSeek的核心工程师团队连续攻坚了整整五个月。

V4版本发布时间数次延后,并非遭遇算法和性能瓶颈,而是耗费海量精力重构底层适配逻辑。团队重写大量核心推理代码,从完全依赖英伟达CUDA生态,完成向华为CANN框架的深度适配优化,绝非简单更换硬件,而是整套运行体系的全方位革新。

更硬核的是,DeepSeek此次新版本迭代,没有给英伟达、AMD预留任何早期适配优化权限,将全部独家优化资源倾斜华为昇腾。这也造就了全球首个万亿参数顶级大模型,脱离CUDA生态实现稳定高效运行。

黄仁勋是真的慌了,甚至罕见公开表态流露担忧。

就在V4正式发布的前十多天,黄仁勋在公开播客节目中直言,如果全球顶尖AI模型优先适配华为芯片运行,对英伟达的生态布局将会造成灾难性冲击。他忌惮的从不是单一模型的竞争,而是CUDA数十年构筑的AI生态壁垒,第一次被国产技术撕开了缺口。

而这个担忧,如今彻底成为了现实。V4的API定价远低于英伟达平台同类服务,Flash版本输入仅1元一百万token,输出2元一百万token,极致的价格优势,彻底重塑了行业算力定价体系。

之所以能实现断崖式低价,核心源于两大硬核优势。

第一,华为昇腾950PR芯片性价比突出,采购成本仅为英伟达H200的三分之一到四分之一,综合性能足以支撑顶级大模型推理需求,成本优势得天独厚。第二,DeepSeek拥有顶尖的工程优化能力,经过多轮深度调优,模型在昇腾芯片上的推理效率实现大幅提升,能耗得到有效控制,资源利用率拉满。

双重优势叠加,让DeepSeek V4在商用落地层面,拥有了碾压级的市场竞争力。

有人说这是行业“去英伟达化”的开端,这个说法精准且贴切。

更准确的行业解读是,国产AI已经在推理核心市场实现弯道超车。目前超大规模模型训练领域,英伟达依旧凭借单卡算力、成熟生态占据优势。但全球AI行业重心,正快速从高成本的模型训练,转向高频刚需的推理落地。

黄仁勋今年3月就公开承认AI推理时代全面到来,行业机构预测,2028年全球AI推理工作负载,将占据行业总量的73%。

这是一个体量庞大、持续增长的核心增量市场,DeepSeek与华为联手突破,精准切入了英伟达最核心的营收腹地。

深耕AI领域多年的梁文锋,格局和选择格外耐人寻味。

DeepSeek创立以来,长期依靠梁文锋旗下幻方量化自主输血,他个人持股超84%。此前始终拒绝腾讯、阿里等互联网巨头的投资,只为避免外部资本干预技术研发路线,坚守纯技术自主路线。

但在今年4月,梁文锋态度迎来重大转变,正式启动首次外部融资,目标估值定格200至300亿美元。

这份转变背后,是AI行业残酷的现实。一方面行业人才争夺战白热化,头部互联网企业高薪挖人,核心人才流失风险加剧,融资是为了完善期权激励体系,稳住核心团队。另一方面,国产化AI生态搭建极度耗费算力和资金,长期自主研发离不开充足的资金支撑。

极致的技术理想,终究需要雄厚的资本作为底气支撑。

DeepSeek一直坚持独特的研发路线,不盲目堆砌算力,深耕算法效率优化,以技术精进降低落地成本。华为昇腾则依托国产硬件优势,以系统工程和集群算力弥补单卡差距。

两条国产技术路线,在DeepSeek V4身上完美交汇,共同践行着“以高效技术、有限资源实现顶级AI能力”的初心。

国产化AI突围的路依旧漫长,客观来说,昇腾单卡算力、CANN生态成熟度,和英伟达顶尖产品仍存在客观差距。

但DeepSeek此次突破,已经向整个行业证明,CUDA不再是顶级AI大模型运行的唯一标准答案。

一旦这个生态缺口被彻底打开,国产AI自主突围的浪潮,就再也无法被阻挡。

各位读者你们怎么看?欢迎在评论区讨论。

信息来源:中华人民共和国外交部官网、中国新闻网