DC娱乐网

推理速度提升2倍,mac用户可以不用pytorch了

纯MLX版YOLO26发布发布时间:2026年4月10日专为Apple Silicon打造的YOLO26 MLX版本正
纯MLX版YOLO26发布

发布时间:2026年4月10日

专为Apple Silicon打造的YOLO26 MLX版本正式发布!纯MLX实现,无需PyTorch,M4 Pro上推理速度最高提升2.07倍,目标检测进入"苹果原生加速"时代。

为什么这个项目值得关注?

1. 真正的"纯血"苹果优化

市面上大多数AI框架都是先写CUDA(NVIDIA),再勉强适配MPS(Apple)。而这个项目从底层开始就用Apple的MLX框架重写,100%原生支持Metal GPU加速。

✅ 零PyTorch依赖(运行时)✅ 专为M1/M2/M3/M4芯片设计✅ 利用mx.compile JIT编译加速

2. 速度实测:小模型收益最大

在M4 Pro上的实测数据(对比PyTorch MPS):

模型

MLX速度

PyTorch MPS

提升倍数

YOLO26n

170.6 FPS

82.6 FPS

2.07×

YOLO26s

105.3 FPS

-

显著领先

YOLO26m

54.6 FPS

-

1.1×

结论:模型越小,MLX优势越明显。对于边缘设备、实时应用(如摄像头检测),这意味着更低的延迟和更高的帧率。

3. 精度不打折

COCO数据集验证(5000张图片):

模型

MLX精度

官方精度

差距

YOLO26n

40.2%

40.1%

+0.1%(反超)

YOLO26s

47.6%

47.8%

-0.2%

YOLO26x

56.7%

56.9%

-0.2%

最大偏差仅0.5%,完全可以替代官方版本用于生产环境。

三大核心功能

✅ 端到端目标检测(无NMS)

传统YOLO需要复杂的非极大值抑制(NMS)后处理,而YOLO26采用一对一匹配策略,检测流程更简洁,速度更快。

✅ 完整训练 pipeline

不只是推理,训练也全支持:MuSGD优化器(专为MLX设计)、EMA(指数移动平均)、学习率预热与调度、早停机制。

✅ 多目标跟踪(ByteTrack/BoT-SORT)

内置两种主流跟踪算法,配备纯MLX实现的卡尔曼滤波器。MOT17数据集测试:MLX跟踪速度37.2 FPS,比PyTorch CPU快4.5倍。

5分钟上手体验

第一步:环境准备(Mac用户专属)

# 克隆项目git clone https://github.com/thewebAI/yolo-mlx.gitcd yolo-mlx# 创建虚拟环境python3 -m venv .venv && source .venv/bin/activate# 安装依赖pip install -e .pip install -e ".[convert]"

第二步:下载模型(自动转换PyTorch权重)

# 一键下载所有官方权重bash scripts/download_yolo26_models.sh# 转换为MLX格式(.npz)yolo-mlx converters convert models/yolo26n.pt -o models/yolo26n.npz --verify

第三步:运行检测(3行代码)

from yolo26mlx import YOLOmodel = YOLO("models/yolo26n.npz")results = model.predict("your_image.jpg", conf=0.25)results[0].save() # 自动保存标注结果

摄像头实时检测

# 0表示默认摄像头,show=True实时显示results = model.track(0, conf=0.25, show=True)

性能对比图表

推理加速对比(MLX vs PyTorch):

对比CPU:最高3.6倍加速对比MPS:最高2.1倍加速(YOLO26n)

关键发现:随着模型变大(n→x),加速比逐渐下降。这说明MLX在小模型上的优化空间更大,非常适合移动端和边缘设备部署。

适合谁用?

用户类型

使用场景

推荐理由

Mac开发者

本地AI开发

摆脱PyTorch MPS的各种bug,原生加速更稳定

视频创作者

自动标注、跟踪

实时处理4K视频,CPU占用低

科研人员

模型训练

训练速度提升2-4倍,节省大量时间

嵌入式开发者

边缘设备部署

小模型170+ FPS,满足实时性要求

⚠️ 注意事项仅限Apple Silicon:必须M1/M2/M3/M4芯片,Intel Mac不支持Python 3.10+:需要较新的Python版本MLX 0.30.3+:框架版本要求较新权重转换:首次使用需要将官方.pt文件转换为.npz格式 项目信息

GitHub地址:https://github.com/thewebAI/yolo-mlx开源协议:查看项目仓库官方文档:包含3份详细指南(推理/跟踪/训练) 小编点评

这个项目标志着Apple Silicon在AI领域的真正崛起。过去我们用Mac跑AI,要么忍受CPU的龟速,要么忍受MPS的各种兼容性问题。现在终于有了原生的、高性能的解决方案。

对于手握MacBook Pro、Mac Studio的开发者来说,这无疑是2026年最值得尝试的计算机视觉项目之一。无需购买昂贵的NVIDIA显卡,用你的M4 Pro就能跑出170 FPS的实时检测速度——这才是苹果芯片应有的表现。