AI圈炸了!DeepSeek创始人梁文锋硬核出圈,别人忙着拉投资,他闷声搞出个“效率王炸”——原生稀疏注意力算法直接把大模型处理速度拉升十倍,算力成本砍掉六成!连腾讯云都抢着用这黑科技,但互联网巨头捧着钱上门全被拒,这哥就爱蹲实验室写论文。 技术宅的浪漫太顶了!他带队搞的DeepSeek-V3模型训练成本只要557万美金,价格直接卷穿行业地板,逼得大厂集体降价。最近刚发布的R1模型更是在数学推理和代码任务上追平国际顶流,关键人家团队才139人,这战斗力比硅谷巨头还凶残。 别看他在总理座谈会上谈笑风生,私下穿“Hello World”文化衫通宵调参数才是日常。09年实习就凭实力拿下1.6万月薪,现在身家百亿照样蹲老家门槛吃簸箕炊,捐1.38亿搞教育公益,硬核技术+人间清醒直接叠满buff。 DeepSeek问世后自研大模型还有必要吗
AI圈炸了!DeepSeek创始人梁文锋硬核出圈,别人忙着拉投资,他闷声搞出个“
牧田看娱
2025-03-24 12:25:13
0
阅读:0