DeepSeek新版R1实测炸场
1. 模型更新
DeepSeek发布R1-0528版本,虽为小版本命名,但性能提升显著,接近OpenAI o3-high水平。
2. 性能亮点
• 小球弹跳实验表现优于旧版。
• 解决“9.9-9.11=?”等难题,超越Gemini 2.5 Pro、Claude 4等模型。
• 推理能力增强,支持30-60分钟长时思考,输出更自然。
3. 实测表现
• 经典题目“7米甘蔗通过2米高门”给出可行方案,思考151秒。
• 编程能力优化:Three.js模拟太阳系任务24秒完成,支持交互与光影。
• 前端设计:根据论文生成介绍网页,实用性高。
4. 版本背景
此前V3-0324升级被称“小版本”,但实测效果显著。R1-0528可能基于V3优化,引发社区对“R2”猜测。
5. 开源意义
模型以MIT协议开源,HuggingFace可下载,标志开源模型逼近闭源顶级水平。