Qwen3 已登录 MLX 与魔搭
一句话总结:更大的脑力,更强的推理,更长的记忆,更懂世界的多语言 AI。
训练规模全面升级
• 36 万亿 tokens,119 种语言,覆盖全球。
全面进化的模型家族
• 从轻量 0.6B 到旗舰 30B-A3B(稀疏 MoE 架构),全面适配不同应用场景。
双思维模式,灵活切换
• 深度推理(Thinking)与高速对话(Non-thinking),一体兼备,智能响应每一种需求。
超大上下文窗口
• 标配 32k tokens,可扩展至 38k+,轻松处理长文档、复杂任务。
新一代智能训练体系
• 全球批次均衡(Global-Batch Balancing)
• 高效归一化(qk-LayerNorm)
• 基于 Scaling Law 的精准超参调优
专为 Agent 时代而生
• Qwen-Agent 深度优化,工具调用、插件交互、真实场景集成表现卓越。
全开源,真自由
• Apache 2.0 许可证,PyTorch 后端,Safetensors 格式。快速部署,安心使用。
如果你正在构建
• 多语言应用
• 智能 Agent
• 下一代 AI 系统
Qwen3,你的理想之选。