Easy同学正在独立开发 我的 MacMiniM4 32G 到了,第一时间测试了下 unsloth-deepseek-r1-distill-qwen-32b mlx版 ,能用但慢,内存耗费18G,输出每秒4.7~4.9Token左右。
一次性输入500Token,首字响应时间达到了10s。
4.89 tok/sec • 1617 tokens • 10.50s to first token。
32B的智商感觉好些了,写诗至少是押韵的了 [允悲]
Easy同学正在独立开发 我的 MacMiniM4 32G 到了,第一时间测试了下 unsloth-deepseek-r1-distill-qwen-32b mlx版 ,能用但慢,内存耗费18G,输出每秒4.7~4.9Token左右。
一次性输入500Token,首字响应时间达到了10s。
4.89 tok/sec • 1617 tokens • 10.50s to first token。
32B的智商感觉好些了,写诗至少是押韵的了 [允悲]
作者最新文章
热门分类
科技TOP
科技最新文章