前几天很火的李飞飞的s1项目发了个升级版本:s1.1第一版是用Qwen2.5-

蚁工厂 2025-02-12 09:20:19

前几天很火的李飞飞的s1项目发了个升级版本: s1.1

第一版是用Qwen2.5- 32B-Instruct作为基础模型,通过蒸馏Gemini 2.0 Flash Thinking实验版,最终得到了s1模型。而s1.1就是把Gemini 2.0 Flash Thinking换成了DeepSeek r1,性能又有提升。

0 阅读:2
蚁工厂

蚁工厂

感谢大家的关注