MetaStoneTec发布XBai o4,以其第四代开放技术引领行业革新。
• 创新训练架构:结合Long-CoT强化学习与Process Reward Learning,实现深度推理与高质量推理路径选择的统一模型训练。
• 显著优化推理效率:共享主干网络,PRMs推理成本降低99%,响应更快更优。
• 领先性能表现:在AIME24、C-EVAL等多项基准测试中全面超越OpenAI o3-mini和Anthropic Claude Opus。
• 开放许可与资源:Apache-2.0授权,模型权重与训练细节公开,助力全球开发者生态。
• 规模参数:32.8B,采用BF16精度,支持多平台Transformer部署。
• 关注前沿方法论:以“反思生成模型”为核心的训练范式,为复杂推理任务提供新路径。
• 产业影响:开源模型对边缘设备及企业AI应用潜力巨大,推动AI民主化和技术普惠。
• 持续迭代与社区支持:详细训练与测试流程见github.com/MetaStoneTec/XBai-o4,欢迎贡献与合作。
XBai o4展现了中国AI开源生态的强劲实力和深厚技术积累,预示着大型模型领域的未来竞争格局正快速演变。开放权重与顶级性能的结合,是AI创新与应用的关键驱动力。
了解更多详见👉 huggingface.co/MetaStoneTec/XBai-o4
论文🔗 arxiv.org/abs/2507.01951
开源大模型 人工智能 深度学习 推理优化 中国AI 机器学习 Apache2.0