技术党实测：海光DCU上跑满88万tokens，全程没崩过去一年，各大模型都在

技术党实测：海光DCU上跑满88万tokens，全程没崩
过去一年，各大模型都在卷上下文长度。但说实话，大部分是“能接住”但“接不稳”——窗口大了，推理慢得像PPT，或者模型直接在中间“失忆”。
GLM-5.2这次主打的是“Solid 1M”无损上下文。技术上说，他们通过IndexShare架构在每四层稀疏注意力层之间复用索引器，把1M上下文下的单位Token FLOPs消耗降下来了。白话就是：窗口大了，但算力消耗没跟着暴涨。
实际验证看数据：GLM-5.2在Terminal-Bench 2.1上得分81.0，较前代GLM-5.1的63.5提升17.5个百分点。在FrontierSWE上仅比Claude Opus 4.8低1%。这些评测可不是简单的“阅读理解”，是实打实的命令行操作和工具调用测试。
海光DCU能Day 0适配，说明国产算力在长序列推理场景下的硬件准备已经到位。不是等模型优化好了再适配卡，是卡已经准备好了，模型开源就能跑。这个区别很大。
海光信息 Day 0适配国产算力 GLM5.2

DC娱乐网

技术党实测：海光DCU上跑满88万tokens，全程没崩过去一年，各大模型都在

热门分类

技术党实测：海光DCU上跑满88万tokens，全程没崩 过去一年，各大模型都在

热门分类

技术党实测：海光DCU上跑满88万tokens，全程没崩过去一年，各大模型都在