Deepseek的5日盛宴第二弹——DeepEP。简而言之,就是极大地提升基于英

橙子的新观点 2025-02-25 14:18:01

Deepseek的5日盛宴第二弹——DeepEP。简而言之,就是极大地提升基于英伟达集群和cuda的MoE(混合专家模型)中专家之间的沟通与交流效率。 当前,由于美国的限制,国内的集群基于cuda在算力和数据传输等方面存在着某些先天的不足与制约。这就好比不同国家的人用英语交流,虽然大部分人都能听懂,但一些带有本地文化特色的语言依旧存在障碍,而DeepEP就是构建一种更为通用的纽带,使交流更加顺畅和精准。

0 阅读:12
橙子的新观点

橙子的新观点

感谢大家的关注