谷歌发布NanoBanana2 刚看到 Gemini APP 里悄悄上线了 Nano Banana 2,虽然还没亲手试,但光看这个名字就很有意思。Nano 代表轻量,Banana 这个代号延续了谷歌用水果命名小模型的传统,上一代还是文本模型,这一代直接进化成图像生成,这个跨越值得聊聊。
我觉得这可能是谷歌在端侧 AI 的一次关键落子。既然叫 Nano,它大概率不是云端那种动辄几十亿参数的模型,而是专为手机本地运行设计的。这意味着你生成图片时数据不用上传,不仅更快,还更私密。想象一下,你在信号不好的地方或者飞机上,随手就能在本地画个草图让 AI 补全,这种体验只有端侧模型能实现。
从行业角度看,这是把图像生成能力从专业显卡“下沉”到每个人口袋里的尝试。以前我们讨论 Midjourney 或 Stable Diffusion,总离不开高性能 PC,但现在谷歌想在手机上复现这种能力。虽然受限于算力,生成的复杂度和分辨率可能还比不上云端,但对日常做表情包、设计简单海报、辅助创意构思来说,已经打开了很大的想象空间。
我比较好奇它和安卓系统的融合度。如果它能像现有的一些端侧功能那样,直接调用本地相册风格进行学习,或者配合手写笔做实时渲染,那就不只是个玩具,而是能提升生产力的工具了。当然,实际效果还得等实测,看它能不能在速度和画质之间找到那个舒服的平衡点。

