在刚刚举办的Google I/O 2025大会上,谷歌给Gemini来了个大升级,使其正式转型为“AI操作系统”,涵盖语音、图像、视频、搜索、代码生成等多个应用场景。 以下是大会首日公布的重点内容: 一、Gemini成为AI操作系统: 1、摄像头对准物体,就能与Gemini沟通【图1】; 2、搭载最新的文生图模型Imagen4,文本更准、分辨率更高、出图更快【图2】; 3、视频配音模型Veo3,角色对白更真实了【图3】【图4】; 4、Deep Research深度研究功能,支持上传文件了,包括PDF和图片【图5】; 5、Canvas画布功能,现在能一句话生成APP并可视化了【图6】; 6、一句话生成作业题,考完直接出答案的那种【图7】; 7、通用Agent功能(即将推出),官方展示了Gemini自动浏览房源、做筛选、发送邮件等一连串操作【图8】。 二、Gemini 2.5模型升级: Gemini 2.5 Pro引入“Deep Think”推理模式,提升了复杂问题处理能力;Gemini 2.5 Flash优化多模态效率,以更低算力完成任务;新增自然语音生成功能,支持情绪表达与主动交互。 三、谷歌搜索内置Gemini: Chrome浏览器将集成Gemini,右上角点开即聊【图9】 六、Android XR与远程交互: 与Samsung、Xreal合作推出Android XR智能眼镜,具备导航、翻译、摄像等功能;Google Beam整合3D通信技术,提升远程、沉浸式交流体验。 大会第二天预期亮点: 据多方媒体报道,大会第二天,谷歌预计将介绍Android Studio中集成的Gemini能力,发布Google Cloud与Vertex AI新功能;展示Gemini在Wear OS 6与Android Auto中的应用;探讨AI安全与隐私保护等内容。
在刚刚举办的GoogleI/O2025大会上,谷歌给Gemini来了个大升级
量子位来谈科技
2025-05-21 12:14:17
0
阅读:1