国产AI编译器杀疯了！海光DCU深度优化TileLang，性能直逼天花板今

国产AI编译器杀疯了！海光DCU深度优化TileLang，性能直逼天花板

今天国产GPU圈的大瓜，当属海光DCU联合中科院计算所发布的TileLang首版本了，这波操作真的有点东西，甚至有可能改写国产GPU软件生态的格局？

大家都知道，目前全球GPU市场还是英伟达独大，CUDA生态垄断得牢牢的，国产GPU想要突围，光靠硬件性能不够，软件生态才是命门。而算子开发，就是软件生态里最核心、最难啃的一块骨头——既要易用，又要高性能，这也是以前很多国产厂商折戟的地方。

TileLang的出现，刚好打破了这个僵局。海光DCU通过与其深度适配，聚焦算子级的高性能表达，一方面让开发者能用简单的Python语法快速编写内核，大幅降低入门门槛；另一方面，通过底层PASS优化、Pack指令降级调度等技术，将DCU的算力潜能挖掘得淋漓尽致，实现了“易用性+高性能”的双重突破。

更关键的是，它不是孤立存在的，海光DCU自研软件栈包含的Triton、TVM等编译器与其无缝协同，还兼容CUDA、ROCm生态，这就意味着，开发者不用再重新学习新的生态，就能快速迁移项目，大大降低了迁移成本。结合海光DCU在各地智算中心、金融、运营商等领域的大规模应用，软硬协同这条路，算是走得又快又稳。海光

DC娱乐网

国产AI编译器杀疯了！海光DCU深度优化TileLang，性能直逼天花板今

热门分类

国产AI编译器杀疯了！海光DCU深度优化TileLang，性能直逼天花板 今

热门分类

国产AI编译器杀疯了！海光DCU深度优化TileLang，性能直逼天花板今