Deepseek开源周的第一个项目公布了:FlashMLAgithub.com/

蚁工厂 2025-02-24 10:20:58

Deepseek开源周的第一个项目公布了:FlashMLA

github.com/deepseek-ai/FlashMLA

这是个用于 Hopper GPU (NVIDIA的H100、H800、H200等GPU)的高效 MLA 解码内核,可以用来提高推理效率。果然第一天是软硬结合的一个项目。

0 阅读:8
蚁工厂

蚁工厂

感谢大家的关注