没有GPU也可以相对较快的跑本地大模型了。上海交大搞了一个专为本地运行的系列模型

蚁工厂 2025-07-31 09:49:38

没有GPU也可以相对较快的跑本地大模型了。上海交大搞了一个专为本地运行的系列模型SmallThinker。其SmallThinker-21BA3B-Instruct版本性能和Qwen3-30BA3B相仿,CPU + 8G内存就能跑起来。在普通消费级CPU上的运行速度均超过 20 tokens/s。速度对比如图。 ​​​

0 阅读:28
蚁工厂

蚁工厂

感谢大家的关注