Qwen3已登录MLX与魔搭一句话总结:更大的脑力,更强的推理,更长的记忆

基地科技切片 2025-04-29 02:52:25

Qwen3 已登录 MLX 与魔搭

一句话总结:更大的脑力,更强的推理,更长的记忆,更懂世界的多语言 AI。

训练规模全面升级

• 36 万亿 tokens,119 种语言,覆盖全球。

全面进化的模型家族

• 从轻量 0.6B 到旗舰 30B-A3B(稀疏 MoE 架构),全面适配不同应用场景。

双思维模式,灵活切换

• 深度推理(Thinking)与高速对话(Non-thinking),一体兼备,智能响应每一种需求。

超大上下文窗口

• 标配 32k tokens,可扩展至 38k+,轻松处理长文档、复杂任务。

新一代智能训练体系

• 全球批次均衡(Global-Batch Balancing)

• 高效归一化(qk-LayerNorm)

• 基于 Scaling Law 的精准超参调优

专为 Agent 时代而生

• Qwen-Agent 深度优化,工具调用、插件交互、真实场景集成表现卓越。

全开源,真自由

• Apache 2.0 许可证,PyTorch 后端,Safetensors 格式。快速部署,安心使用。

如果你正在构建

• 多语言应用

• 智能 Agent

• 下一代 AI 系统

Qwen3,你的理想之选。

0 阅读:4
基地科技切片

基地科技切片

感谢大家的关注