Deepseek开源周的第一个项目公布了:FlashMLA
github.com/deepseek-ai/FlashMLA
这是个用于 Hopper GPU (NVIDIA的H100、H800、H200等GPU)的高效 MLA 解码内核,可以用来提高推理效率。果然第一天是软硬结合的一个项目。
Deepseek开源周的第一个项目公布了:FlashMLA
github.com/deepseek-ai/FlashMLA
这是个用于 Hopper GPU (NVIDIA的H100、H800、H200等GPU)的高效 MLA 解码内核,可以用来提高推理效率。果然第一天是软硬结合的一个项目。
作者最新文章
热门分类
科技TOP
科技最新文章