【DeepSeek R2或在5月发布】据国内媒体报道称,深度求索可能会在下个月推出下一代AI大模型DeepSeek-R2。报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。 有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。 据相关人士透露,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
【DeepSeekR2或在5月发布】据国内媒体报道称,深度求索可能会在下个月推
超大型计算机
2025-04-29 14:39:53
0
阅读:91