DeepSeek-V3-0304更新细节,部分超越GPT-4.5! 早上Dee

全产业 2025-03-26 08:31:50

DeepSeek-V3-0304更新细节,部分超越GPT-4.5! 早上DeepSeek-V3-0304在Hugging Face上线时,官方没有做介绍,但是在晚上补上了。 🌟新版 V3 模型架构上和旧版V3一致,借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术【应该就是GRPO算法】,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。 🌟这下好玩了,GPT-4.5是OpenAI参数最大最贵的模型,被V3-0324在部分能力上超过,说明RL的能力真的还能再继续发掘。后续路径更清楚了,V4大概率比V3更好,R2大概率在V4基础上训练,然后V4和R2又能够互相补充,形成正向循环。国产模型值得兴奋! 🌟后续DeepSeek应该会持续补上多模态能力,以结合Agent趋势。目前软件回调也已经较为充分,继续关注相关标的: 【2C应用】金山办公、三六零、合合信息 【2B应用】汉得信息、泛微网络、鼎捷数智、用友网络、金蝶国际、中软国际、卓易信息 【数据标注】海天瑞声 【数据中台】星环科技、普元信息

0 阅读:51
全产业

全产业

感谢大家的关注