DeepSeek开源周第 3 天:DeepGEMM DeepGEMM 是一个用 CUDA 编写的库,旨在实现干净高效的具有细粒度缩放的 FP8 通用矩阵乘法(GEMM),支持普通和混合专家(MoE)分组 GEMM。安装时无需编译,通过轻量级即时(JIT)模块在运行时编译内核。
有一个问题我感到很奇怪,既然deepseek是开源的,那为什么美国人不直接抄过
【207评论】【96点赞】
DeepSeek开源周第 3 天:DeepGEMM DeepGEMM 是一个用 CUDA 编写的库,旨在实现干净高效的具有细粒度缩放的 FP8 通用矩阵乘法(GEMM),支持普通和混合专家(MoE)分组 GEMM。安装时无需编译,通过轻量级即时(JIT)模块在运行时编译内核。
猜你喜欢
【207评论】【96点赞】
【35评论】【34点赞】
【3评论】【3点赞】
【1评论】【1点赞】
作者最新文章
热门分类
科技TOP
科技最新文章