【MiniMax推理模型M1:456B参数,性能超DeepSeek-R1】6

中南评汽车啊 2025-06-17 17:06:39

【MiniMax推理模型M1:456B 参数,性能超 DeepSeek-R1】6 月 17 日消息,MiniMax 稀宇科技宣布将连续五天发布重要更新。今天第一弹是开源首个推理模型 MiniMax-M1。根据官方介绍,MiniMax-M1 是世界上第一个开源的大规模混合架构的推理模型。MiniMax 表示:M1 在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型,接近海外的最领先模型,同时又有业内最高的性价比。

官方博客还提到,基于两大技术创新,MiniMax-M1 训练过程高效得“超出预期”,只用了 3 周时间、512 块 H800 GPU 就完成强化学习训练阶段,算力租赁成本仅 53.47 万美元(IT之家注:现汇率约合 384.1 万元人民币),相比一开始的预期直接降低了一个数量级。

0 阅读:8
中南评汽车啊

中南评汽车啊

感谢大家的关注