临近端午假期,DeepSeek果然又开始搞事。就在今天凌晨,新版DeepSeek-R1正式开源了!
DeepSeek-R1-0528模型权重已上传到HuggingFace,不过模型卡暂未更新。
此次,DeepSeek-R1-0528更新核心亮点,网友做了一个浓缩版的总结:
能像谷歌模型一样深度推理文本生成优化。
更自然,格式更佳独特的推理风格。
不仅快,而且更缜密支持长时思考。
单任务处理时长可达30-60分钟。
思考时间更长,成为了全网讨论最多的一点。有网友实测后,R1思考时长超过了25分钟。另外,这似乎是唯一一个能持续正确做对「9.9- 9.11是多少」的模型。
在LiveCodeBench 基准上,DeepSeek-R1-0528性能几乎与 03-mini (High) 和 04-mini (Medium)实力相当,一举超越了 Gemini 2.5 Flash。