8B模型打闭源?海光DCU这次跟得太快了
商汤刚开源新一代原生多模态模型SenseNova U1,海光DCU直接Day 0跟上,国内首批适配的国产芯片厂商。四天前才刚官宣了DeepSeek V4的Day 0适配,这边商汤U1又无缝衔接上了。
不过讲真,这俩核心卖点确实有点东西:
第一,商汤这代搞了个NEO-Unify统一架构,直接干掉视觉编码器和变分自编码器,实现语言和视觉的高效协同。8B参数的小个子,图文交错理解、信息图生成的能力,大部分商用闭源模型完全不虚,关键响应速度还快。
第二,海光完成了对SenseNova U1 的适配,并针对图文交错生成、高密度信息图生成等应用进行了专项调优,据公开资料显示,海光DCU目前已与DeepSeek、Qwen、智谱等超过400个国内外主流大模型完成联合优化,基本做到了发布即适配、上线即可用。
营销、设计、商业分析这些场景,要是一键就能出专业信息图,不用再这边LLM生成文案+那边SD出图再拼接,效率拉满。国产模型+国产算力,这条路走通了才是真的大规模应用。蹲一波实测数据。