ChatGPT又双叒叕更新了,这一次,OpenAI没有大谈数字和术语,而是回归到了“聊天机器人”本身。
在全场欢呼中,CTO Mira Murati走到台上,为全世界揭晓了OpenAI神秘新产品的面纱——
GPT-4o,在千呼万唤中登场了!
现场演示中,它的表现仿佛一个人正坐在旁边,和人类的对话节奏自然、融洽,完全听不出是个AI
从今夜之后,人机交互彻底进入新的时代!
这也正呼应着它名字中的玄机:「o」代表着「omni」,意味着OpenAI朝着更自然的人机交互迈出了重要一步。
在短短232毫秒内,GPT-4o就能对音频输入做出反应,平均为320毫秒。这个反应时间,已经达到了人类的级别!
而在英语文本和代码基准测试中,GPT-4o的性能与GPT-4 Turbo不相上下,并在非英语文本得到显著改进。
相较上一代GPT-Turbo,GPT-4o可谓是打通了任督二脉,各项技能融会贯通,和人的互动更灵活、更快速——换言之,更像“人”了。
用户可以以文本、音频、图像任意组合输入,得到ChatGPT实时文本、音频、图像的任意组合输出。
在交流过程中,ChatGPT不再等待若干秒才响应,而是实时回复,还能被随时打断。OpenAI的CEO山姆·奥特曼(Sam Altman)将之称为“人类级别的响应”。
当GPT-4o驱动的ChatGPT用饱含情绪的声音和人聊天,还能看、能听、能说会唱,你就知道,科幻已经照进现实了。
数据层面,根据传统基准测试,GPT-4o的性能对比GPT-4 Turbo基本都处于优势,对比其他模型更是大幅领先。
根据官网给出的资料,目前GPT-4o已经支持包括中文在内的20种语言进行音频等多模态交互。
目前,中智AI已接入GPT-4o,快来一起体验一下吧⏬
长按识别二维码
进入中智AI软件