在北大和deepseek发表那篇引发关注的原生稀疏注意力NSA论文()后,M

蚁工厂 2025-02-22 11:20:34

在北大和deepseek发表那篇引发关注的原生稀疏注意力NSA论文( )后,MIT博士Songlin Yang(松琳)根据论文做了个开源实现,项目托管在:github.com/fla-org/native-sparse-attention

通过基准测试(图2)也证实了其高效性。

0 阅读:75
蚁工厂

蚁工厂

感谢大家的关注