发布时间:2026年4月10日
专为Apple Silicon打造的YOLO26 MLX版本正式发布!纯MLX实现,无需PyTorch,M4 Pro上推理速度最高提升2.07倍,目标检测进入"苹果原生加速"时代。
为什么这个项目值得关注?1. 真正的"纯血"苹果优化
市面上大多数AI框架都是先写CUDA(NVIDIA),再勉强适配MPS(Apple)。而这个项目从底层开始就用Apple的MLX框架重写,100%原生支持Metal GPU加速。
✅ 零PyTorch依赖(运行时)✅ 专为M1/M2/M3/M4芯片设计✅ 利用mx.compile JIT编译加速2. 速度实测:小模型收益最大
在M4 Pro上的实测数据(对比PyTorch MPS):
模型
MLX速度
PyTorch MPS
提升倍数
YOLO26n
170.6 FPS
82.6 FPS
2.07×
YOLO26s
105.3 FPS
-
显著领先
YOLO26m
54.6 FPS
-
1.1×
结论:模型越小,MLX优势越明显。对于边缘设备、实时应用(如摄像头检测),这意味着更低的延迟和更高的帧率。
3. 精度不打折
COCO数据集验证(5000张图片):
模型
MLX精度
官方精度
差距
YOLO26n
40.2%
40.1%
+0.1%(反超)
YOLO26s
47.6%
47.8%
-0.2%
YOLO26x
56.7%
56.9%
-0.2%
最大偏差仅0.5%,完全可以替代官方版本用于生产环境。
三大核心功能✅ 端到端目标检测(无NMS)
传统YOLO需要复杂的非极大值抑制(NMS)后处理,而YOLO26采用一对一匹配策略,检测流程更简洁,速度更快。
✅ 完整训练 pipeline
不只是推理,训练也全支持:MuSGD优化器(专为MLX设计)、EMA(指数移动平均)、学习率预热与调度、早停机制。
✅ 多目标跟踪(ByteTrack/BoT-SORT)
内置两种主流跟踪算法,配备纯MLX实现的卡尔曼滤波器。MOT17数据集测试:MLX跟踪速度37.2 FPS,比PyTorch CPU快4.5倍。
5分钟上手体验第一步:环境准备(Mac用户专属)
# 克隆项目git clone https://github.com/thewebAI/yolo-mlx.gitcd yolo-mlx# 创建虚拟环境python3 -m venv .venv && source .venv/bin/activate# 安装依赖pip install -e .pip install -e ".[convert]"
第二步:下载模型(自动转换PyTorch权重)
# 一键下载所有官方权重bash scripts/download_yolo26_models.sh# 转换为MLX格式(.npz)yolo-mlx converters convert models/yolo26n.pt -o models/yolo26n.npz --verify
第三步:运行检测(3行代码)
from yolo26mlx import YOLOmodel = YOLO("models/yolo26n.npz")results = model.predict("your_image.jpg", conf=0.25)results[0].save() # 自动保存标注结果
摄像头实时检测
# 0表示默认摄像头,show=True实时显示results = model.track(0, conf=0.25, show=True)
性能对比图表推理加速对比(MLX vs PyTorch):
对比CPU:最高3.6倍加速对比MPS:最高2.1倍加速(YOLO26n)关键发现:随着模型变大(n→x),加速比逐渐下降。这说明MLX在小模型上的优化空间更大,非常适合移动端和边缘设备部署。
适合谁用?用户类型
使用场景
推荐理由
Mac开发者
本地AI开发
摆脱PyTorch MPS的各种bug,原生加速更稳定
视频创作者
自动标注、跟踪
实时处理4K视频,CPU占用低
科研人员
模型训练
训练速度提升2-4倍,节省大量时间
嵌入式开发者
边缘设备部署
小模型170+ FPS,满足实时性要求
⚠️ 注意事项仅限Apple Silicon:必须M1/M2/M3/M4芯片,Intel Mac不支持Python 3.10+:需要较新的Python版本MLX 0.30.3+:框架版本要求较新权重转换:首次使用需要将官方.pt文件转换为.npz格式 项目信息
GitHub地址:https://github.com/thewebAI/yolo-mlx开源协议:查看项目仓库官方文档:包含3份详细指南(推理/跟踪/训练) 小编点评这个项目标志着Apple Silicon在AI领域的真正崛起。过去我们用Mac跑AI,要么忍受CPU的龟速,要么忍受MPS的各种兼容性问题。现在终于有了原生的、高性能的解决方案。
对于手握MacBook Pro、Mac Studio的开发者来说,这无疑是2026年最值得尝试的计算机视觉项目之一。无需购买昂贵的NVIDIA显卡,用你的M4 Pro就能跑出170 FPS的实时检测速度——这才是苹果芯片应有的表现。