DC娱乐网

Deepseek 验证了MLA+ MOE的技术可行性; KIMI thinki

Deepseek 验证了MLA+ MOE的技术可行性; KIMI thinking 在此基础上,实现了 int4的快速推理和低成本部署,给MOE单个专家参量能力提升了50%以上,实现了模型推理和能力上限的权衡。我很期待 AD里面的 Kimi Thinking 时刻