DC娱乐网

技术党实测:海光DCU上跑满88万tokens,全程没崩 过去一年,各大模型都在

技术党实测:海光DCU上跑满88万tokens,全程没崩
过去一年,各大模型都在卷上下文长度。但说实话,大部分是“能接住”但“接不稳”——窗口大了,推理慢得像PPT,或者模型直接在中间“失忆”。
GLM-5.2这次主打的是“Solid 1M”无损上下文。技术上说,他们通过IndexShare架构在每四层稀疏注意力层之间复用索引器,把1M上下文下的单位Token FLOPs消耗降下来了。白话就是:窗口大了,但算力消耗没跟着暴涨。
实际验证看数据:GLM-5.2在Terminal-Bench 2.1上得分81.0,较前代GLM-5.1的63.5提升17.5个百分点。在FrontierSWE上仅比Claude Opus 4.8低1%。这些评测可不是简单的“阅读理解”,是实打实的命令行操作和工具调用测试。
海光DCU能Day 0适配,说明国产算力在长序列推理场景下的硬件准备已经到位。不是等模型优化好了再适配卡,是卡已经准备好了,模型开源就能跑。这个区别很大。
海光信息 Day 0适配 国产算力 GLM5.2