“地表最强开源模型” 智谱的 GLM-5.2 竟然能塞进本地电脑运行了!
知名的模型优化团队 Unsloth 憋了个大招,搞出了一个“动态量化”技术。把原本高达1.51TB的 GLM-5.2,直接一刀砍到了 238 GB,缩水了整整 84%!
最恐怖的是,体积虽然暴瘦,智商却依然在线,保留了高达 ~82% 的准确率。
以前你想跑这种级别的大模型,家里高低得有个服务器机房,现在一台 256GB 内存的 Mac直接本地硬啃!
别看它体积缩了,实力可一点没缩。
GLM-5.2 总参数量高达 744B,支持 100 万字的长文本。
在各种跑分测试里,它已经能直接和 Claude 4.8、GPT-5.5、Gemini 3.1 Pro 这种顶级闭源大厂牌掰手腕了。
最绝的是,它原生支持类似 O1 的 “思考模式”(Thinking Mode),有“普通、高、极限”三档努力程度。
遇到地狱难度的编程或数学题,直接拉到 Max 极限模式,它就会在后台疯狂思考。
在团队官方网页里还晒出了一个名场面:
本地用 2-bit 版本的模型,一句话就写出了一个带环绕音效、画面精美的 H5 游戏,代码能力强得让人头皮发麻。
这次 Unsloth 连工具都帮你喂到嘴边了,发布了带 Web UI 的 Unsloth Studio,不仅界面好看,还能一键开关思考模式,甚至自带“自我修复”的网页搜索和执行代码功能。复制一行命令就能安装,极度丝滑。
以前需要一间机房才能跑的顶级 AI,现在完全可以在你的工作台上、在完全私密不联网的环境下为你打工,这波白嫖顶级算力的红利,有设备的大佬们可以冲了!
GLM5.2


