
你有没有想过,一家公司能用不到美国同行1%的成本, 打造出让硅谷一整夜都没法安稳睡觉的数字大脑
2025年1月20号, 杭州深度求索公开了DeepSeek-R1模型,根据QuestMobile统计,到2月9号的时候,DeepSeekApp累计下载量已经超过1.1亿次,周活跃用户接近9700万,其中,1月27号到2月2号那一周的下载量达到6400万次,环比增长超过2700%,这样的增速就连ChatGPT当年花了两个月才达到的亿级用户里程碑都比不上。

据财新网报道,1月27号美股开盘的时候, 英伟达(NASDAQ,NVDA)的股价一下子就像跳水一样跌了16.86%,收盘的时候是118.58美元,当天市值直接就没了5890亿美元,创下了美股历史上个股单日市值缩水的最高记录,这也是英伟达从2020年3月新冠疫情爆发以来表现最不好的一次。
彭博社的数据显示,在标普500指数市值损失最大的10个交易日当中,有8次都和英伟达的大跌有关系,市场恐慌的根源是什么,DeepSeek用557.6万美元的训练成本仅仅是Meta训练成本的十分之一就达到了和OpenAIo1差不多的性能,这直接就冲击了「AI发展必须得依靠天价算力投入」的市场共识。

DeepSeek-R1采用的是混合专家架构(MoE)这个由6710亿参数构成的超级大脑,每次仅仅激活370亿参数,再加上多头潜在注意力机制(MLA),显存占用可以被压缩30%,更加厉害的是,团队运用纯强化学习让模型自己进化,使得R1在数学推理测试AIME2024中获取79.8%的准确率, 比OpenAIo1的78.5%还要高。
「这不是简单的效率提高,而是对规模定律的正面挑战」斯坦福AI实验室表示, DeepSeek证实了算法创新可以突破硬件封锁。
🚀技术的温度,就是体现在普通老百姓的日常生活当中在制造业当中,富士康引入DeepSeek之后,2000台机器人能够实现毫秒级协同,主板贴片的节拍时间减少了12%,每天的产量能够达到120万台,在医疗领域里, 斯坦福测试显示R1的诊断准确率比GPT-4o高出3.8个百分点。对于普通老百姓来说,某电商平台接入R1之后,客服的回应时间从30分钟降到了18分钟,满意度提升了35%。
🌐开源,是DeepSeek最厉害的工具发布还没几个星期,GitHub上的星标数就超过了6.9万,比OpenAI所有项目都要高, 全球140个国家的应用商店榜首都被它占据着,从华为、腾讯、阿里到亚马逊、微软、英伟达,一场全球适配潮就这么来了。

⚖️DeepSeek的兴起引起了行业连锁反应,1月31号,OpenAI上线o3-mini还下放了免费权限,2月13号,百度宣告文心一言全面免费,要晓得,去年李彦宏还说「最强的基础模型都是闭源的」,不到一年, 风向彻底改变了。
这场变革的深刻含义,或许不在技术自身, DeepSeek证明了,创造力和工程智慧可以重新构造成本曲线,小而精的团队可以挑战资源巨头。
将来3年,推理能力将会变成新的竞争关键点, 但是,更深入地去追问就是,当智能变得既廉价又普遍的时候,人类所特有的价值应该被确定在什么样的位置
声明:本文内容超过90%为原创,少部分借助AI进行辅助,但所有内容均经过本人严格审核与核对。所用图片均为真实拍摄或AI生成的原创素材。全文旨在传递积极健康的价值观,不含任何低俗或不良导向。特此说明,敬请读者知悉。