DC娱乐网

谷歌近日推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant。根

2026-03-26 12:32:30 李可哥讲谈财经

谷歌近日推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant。根据谷歌介绍，TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存瓶颈问题。随着上下文窗口变大，这些缓存正成为主要的内存瓶颈。

宣称实现约6倍内存节省，对存储芯片板块偏利空。

阅读：0 点赞：0