DC娱乐网
实测 GLM-5+Claude Code:重构开源项目
2026-02-15 00:33:10
奔跑的跳跳
科技
GLM-5来了,依然采用 MoE 架构,总参数从 GLM-4.5 的 3550 亿翻倍至 7440 亿,激活参数从 320 亿提升到 400 亿,预训练数据也从 23T tokens 扩充到 28.5T tokens。
技术上有两个关键亮点:
1️⃣集成了 DeepSeek 的稀疏注意力技术 DSA,在保留强悍长上下文能力的同时有效降低部署成本,
2️⃣针对大模型强化学习训练效率偏低的行业痛点,智谱为 GLM-5 专门自研了一套异步强化学习框架 Slime,从底层优化训练效率。
一起来测测GLM-5在复杂工程任务上的效果吧~
热门分类
推荐
热榜
军事
NBA
体育
社会
明星八卦
娱乐
财经
科技
汽车
历史
国际
游戏
动漫
公益
搞笑
商业
互联网
数码
国际足球
房产
家居
时尚
科学探索
职场
育儿
股票
教育
影视
情感
热点
中国军情
武器
中国南海
中国足球
亚洲杯
科比
综合体育
CBA
投资
楼市
大咖秀
外汇
创业
风口
SUV
豪车
概念车
优惠
新能源
美国
欧洲
朝日韩
俄罗斯
孕期
街拍
恋爱攻略
婚姻
正能量