英伟达推出新模型
英伟达昨天悄悄发了个大招,推出了全新的开放式多模态大模型 Nemotron 3 Nano Omni。
这个模型最大的看点就两个字:效率。它用的是 30B 混合专家架构,直接把看视频、听声音和读文本的能力原生地揉在了一起,不需要再东拼西凑各种单独的感知小模型。官方给出的数据非常残暴:吞吐量比同类模型直接飙升了 9 倍。
在各家大模型正在疯狂打价格战的当口,英伟达掏出这么个极致追求运行效率的工具,意图非常明显:它瞄准的是企业级智能体(Agent)的落地市场。
老黄其实根本不想跟现在的模型大厂抢流量,他下场做开源模型的底层逻辑极其清晰:把这个高效的“AI大脑”白送给企业和开发者用。你们用得越爽,开发出来的复杂多模态应用越多,底层要消耗的英伟达 GPU 算力就越庞大。
这就叫“送你一副好牌,只为把你彻底留在我的牌桌上”~
