Easy同学正在独立开发我的MacMiniM432G到了,第一时间测

艺思同学 2025-02-14 23:15:50

Easy同学正在独立开发 我的 MacMiniM4 32G 到了,第一时间测试了下 unsloth-deepseek-r1-distill-qwen-32b mlx版 ,能用但慢,内存耗费18G,输出每秒4.7~4.9Token左右。

一次性输入500Token,首字响应时间达到了10s。

4.89 tok/sec • 1617 tokens • 10.50s to first token。

32B的智商感觉好些了,写诗至少是押韵的了 [允悲]

0 阅读:22
艺思同学

艺思同学

感谢大家的关注