腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。DeepSeek致谢腾讯技术团队
腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多
子墨谈科技
2025-05-08 10:00:26
0
阅读:1