DC娱乐网

Google的Gemini Omni Flash在视频任务上拿了SOTA——图生

Google的Gemini Omni Flash在视频任务上拿了SOTA——图生视频、文生视频、视频编辑都做到了最好。

说实话Google在AI领域的节奏一直很奇怪。OpenAI和Anthropic在前面打生打死,Google在后面默默发paper。但它在视频和视觉这个方向积累很深——YouTube的数据、TPU的算力、DeepMind的研究能力,这三样加在一起让Google在视频AI上有了独特的优势。

Logan Kilpatrick(Google AI的开发者关系负责人)说这个能力即将通过API开放。等API一开,AI视频赛道的格局可能要变——目前是Runway、Pika、Sora几家在争,Google带着Gemini Omni Flash入场是降维打击。

我的关注点是:视频API的价格。目前AI视频生成的成本还是太高,做商业落地很难算过来账。如果Google能靠TPU的成本优势把视频API价格打下来,那才是真正的搅局。

你觉得AI视频什么时候能在商业上真的可用?1年?3年?5年?AI Google 视频生成 Gemini