
文 / 道哥
来源 / 智百道
在阿里上线千问APP一天之后,11月18日,蚂蚁集团发布全模态通用AI助手灵光。
连续两天发布新产品,让大家应接不暇,不过在《智百道》看来,这并非内部赛马,而是基于不同产品差异化优势的生态卡位。

千问搭载的是自家的Qwen模型,而灵光底层模型是整合蚂蚁自研百灵模型+多家第三方模型,定位也不一样。
如果说千问是生活入口,旨在深度整合外卖点餐、旅行规划等高频场景,成为AI时代的超级APP。那么灵光扎根于支付宝服务生态,构建一个超越传统搜索与问答的“生产力入口”。据官方介绍,灵光能在移动端实现“自然语言30秒生成小应用”,首批上线三大功能“灵光对话”、“灵光闪应用”、“灵光开眼”。
那么这些功能实用起来究竟如何?《智百道》特意进行了多个维度的测评。
01 灵光闪应用:手搓APP不在话下
写段代码做一个小应用,很多Chatbot都能做,但体验往往很割裂,你得有台电脑,还得懂怎么把代码变成网页。但在灵光,这一切在手机上就能搞定,它真正把生产力装进了APP里。
比如,《智百道》要求灵光制作一个计算器,不到半分钟,对话框里直接跳出来一个可以直接按的计算器,包括加减乘除,直接可以进行简单的计算,完全不需要我去复制粘贴代码。
如果你想做个 BMI 身体指数计算器,体验更是丝滑,手指直接滑动调节身高体重,结果立马就出来了,还能告诉你,你的BMI属于哪个区间,十分实用。
不仅是工具,摸鱼小游戏也是信手拈来。
比如,数星星、贪吃蛇、扫雷都能做。特别是扫雷,它甚至细分了初、中、高三个等级,点开直接就能玩,完全就是一个成熟的小程序。
最让我惊喜的功能是“一键存储”。
以前用 AI 写的东西,划过去就找不到了。但在灵光,点击右上角的闪电图标,就能把这些 AI 生成的小工具存进“我的闪应用”,下次想用,随时调取。
当然,也有博主测评了灵光可以制作支付宝应用,《智百道》也特意给它出了个难题,做一个模拟支付宝App要能演示转账的那种。
可能是因为逻辑复杂,这次它思考了一分钟,但成品确实不错,界面像模像样,而且每个按钮真的都能点、有反应。《智百道》试着转账,也成功了,当然了,这并不是真正的钱,但是交互效果真的不错,这在目前手机端的AI产品中,确实不多见。或许我们每个人只要精通指令,都能成为一个出色的前端设计师。
02 灵光开眼:可交互的内容创作工具
如果说代码生成展现了灵光的“脑力”,那么灵光特色的“拍图识物”功能则彻底打通了物理世界与数字世界的隔阂,让彼此之间的连接充满趣味性。
在实测中,我们打开摄像头对准画面,灵光瞬间就给出了识别结果及详细的文字介绍。
比如,《智百道》在咖啡馆,让灵光识别咖啡杯,它能清楚地识别出这是皮爷咖啡和拿铁上的心形拉花。
这是在你方便看的时候,如果不方便?
如果你不方便阅读长文字,完全可以开启语音问答模式。你只管用镜头“看”,用嘴巴“问”,灵光就能通过语音实时解惑,彻底解放了双手和双眼。在《智百道》看来,这种体验在户外或移动场景下尤为实用。
为了测试识别的精准度与知识深度,《智百道》特意找来了一株并不常见的植物。 灵光不仅在准确叫出了它的学名“龙血树”,还展现出了它的百科全书体质。
对于我这个植物小白来说,认出名字只是第一步,灵光似乎洞察到了我的好奇心,在识别成功后,界面立刻浮现出多个引导性追问:“龙血树适合哪些环境生长?”“龙血树具有哪些药用价值?”。 这种引导式交互,直接将一次简单的识图,变成了一场植物学知识交互。
但灵光显然不止是做一本“百科”,毕竟官方标榜的能力是多模态,它还能在问答的基础上去创作。
看着这株龙血树,《智百道》突发奇想,能不能让静止的植物活过来?我们切换至创作模式,开启了一场整蛊实验。

输入Prompt “变成毛绒玩具,动起来”,原本以为会得到一张静态图,没想到一分钟后,灵光直接生成了一段视频:画面中原本硬朗的龙血树叶片变成了毛茸茸的质感,这个植物额花盆“长”了脚,地“走”了起来,风格十分二次元。
除了视频生成,灵光在图片编辑上的连续性体验更让我们惊喜。
我们继续对龙血树“下手”,输入prompt“变成水彩画风格,同时长出几颗榴莲”。不到一分钟,一张画风清新的水彩画便呈现在眼前,同时地面上按照我们的要求挂满了榴莲。
此时,如果想修改画面,大多数AI工具通常需要用户保存图片、重新上传、再写指令。但灵光打破了这一繁琐流程,支持多轮对话来修图。
《智百道》直接在当前对话框追加Prompt,“再加几颗苹果”。 灵光基于上一张图的修改,迅速在保留水彩风格和榴莲元素的基础上,自然地融入了绿苹果。
这种即说即改的丝滑体验,让创作不再是指令堆砌,而是更具趣味性。
03 灵光对话:拒绝纯文字,攻略更全面
很多人都试过用AI写旅行计划,但不知道你有没有这种感觉,计划看着挺满,真要用的时候还得自己二次搜索,继续做攻略。毕竟光看文字,你根本不知道这几个景点顺不顺路,还是得去查地图。
比如,我们试着问了DeepSeek和灵光同一个问题,制作一个为期四天的海口旅游计划。
DeepSeek很严谨,经过认真的思考后,列出了一二三四点,排版很尽力,但纯文字的形式终究有些枯燥。
相比较而灵光给出的答案,则更为精美。除了详细的文字介绍,它贴心地配上了景点实拍图,比如海口骑楼老街的烟火气、云洞图书馆的落日,到底实景如何,直接呈现在你眼前,真正做到了有图有真相。
但真正的大招在最后。
灵光在攻略底部生成了一张动态地图。 注意,这可不是一张看不太清的截图,而是一个能放大、能移动的实时地图组件。你可以非常直观地看到这四天都在海口的哪个区域活动,今天的路线绕不绕?景点之间相对位置是什么?一眼就能看明白。这种所见即所得的空间感,是传统Chatbot很难给到的。
在《智百道》看来,蚂蚁集团的Chatbot首秀惊喜满满,灵光让AI的价值实现了从信息提供到生产力提供的本质转变。从更深层次看,灵光从问答案到造工具,改写了AI,也改写普通人的生产力,代表着AI技术普惠化的重要方向这种以用户需求为核心、以解决实际问题为导向的产品理念,或许正是未来AI入口竞争的关键所在。
*题图由AI生成