这款AI产品爆了,没想到大模型应用爆品是耳机

爆科技 2024-07-11 16:10:42

近日,一位国外友人发布的短视频里,一句魔性的「city不city」,直接让这句中英文混搭词迅速走红。中国外交部发言人毛宁4日在例行记者会上表示,很高兴看到外国朋友们亲身感受生动真实的中国,欢迎大家来中国。

在视频中,来自美国的「保保熊」在向观众展示他在中国的旅行体验,他戴着一对酷似珍珠耳环的耳夹式耳机,惬意地走在上海的街头。在视频中,保保熊提到这款耳机还支持翻译功能,让大家听懂外国话,可以在全世界 「city city」。

图1:美国友人「保保熊」在分享中国城市体验的短视频中多次用到「city不city」

如果说ChatGPT发布的2022年是AI元年,那么2024年则是AI硬件集中爆发的一年。备受瞩目的智能硬件,正在将大模型这项新技术从虚拟带到现实。

三星在今年年初就向全球提出了关于AI的的全新战略——「AI for all」,致力于将AI技术通过手机、电脑甚至冰箱、电视等大小家电深入应用到生活场景,并从年初至今相继发布了Galaxy S24系列旗舰手机、Galaxy Z Fold 6折叠屏手机、Galaxy Watch 7智能手表、Galaxy Ring智能戒指等智能硬件设备,这些设备有了AI大模型的加持,不仅能全方位地提升用户的视听体验,还能为用户提供更加便捷、高效的生活体验。

图2:三星电子于 CES 2024 展示「AI for all」愿景,为居家带来崭新体验

而德国的三大车企——大众汽车、梅赛德斯奔驰、宝马,也在今年相继展示了带有生成式AI大模型的车型。未来,用户可以在驾驶大众汽车的过程中,使用IDA语音助手实时获取由人工智能提供的海量信息。而梅赛德斯-奔驰则推出了 MBUX 虚拟助理,可以为驾驶员提供「自然」、「可预测」、「个性化」和「有共情能力」的大模型服务。宝马集团同样推出了基于亚马逊Alexa 大语言模型的全新一代BMW智能个人助理,无需动手,即可实现情感化的人车交互。

图3:梅赛德斯-奔驰全新的MBUX 虚拟助理基于大语言模型开发,让人车语音交互更自然、更人性、更个性

此外,微软和苹果也在年中相继展示了支持大模型的个人终端设备,2024年5月,微软推出以AI为核心能力的Copilot+PC,同时推出了Surface Pro 和 Surface Laptop两款硬件,而苹果也在6月推出了个人智能化系统Apple Intelligence,为 iPhone、iPad 和 Mac 引入强大的生成式大模型。

图4:微软的Copilot+PC 是迄今为止速度最快、最具智能体验的 Windows PC。

而文章最初提到的那款很「city」的耳机,正是声智AI可穿戴设备家族的新成员——SoundAI FairyClip,这款外观模仿珍珠首饰设计的智能可穿戴耳机,在SoundAI AzeroGPT壹元大模型的加持下,采用耳机独有的语音人机交互的模式,可以实现多语翻译、语音转写、智能写作等诸多AI功能。一对小小的蓝牙耳机就能成为工作学习和生活的好伙伴,成为了中国大模型落地应用的一针强心剂。

图5:SoundAI FairyClip是行业中首次为耳夹式耳机引入声学AI技术

AzeroGPT壹元大模型可以让SoundAI FairyClip根据用户所听到的内容提供个性化的人工智能服务,借助语音转写、多语翻译、智能摘要等功能,可以将现实世界中的声音信息收集、整理、分析并最终根据用户的需求呈现出相应的文字信息或语音信息。

图6:有了AzeroGPT大模型的加持,SoundAI FairyClip 可以很多功能。

而在AzeroGPT大模型的基础上,SoundAI FairyClip还应用了声音生成计算和多模态大模型的创新方法。例如使用SoundAI FairyClip进行会议或者课堂上的实时转写,传统的方法需要先调用声学模型,将语音信息从复杂的声场环境中提取出来,再通过语音模型,让AI能将连续的语音构建为文本,提取语音中的内容、语音特征、停顿和节奏以及说话人的情感信息,再通过语言模型,根据文字进行任务处理,在AI理解单个词汇、长句意义的基础上,提高模型对不同口音和语速的适应性,使得它可以迅速get到多个说话人的核心语义,并呈现在APP中。而 SoundAI FairyClip 就可以使用融合声学、语音和语言的大模型进行准确率更高的实时转写,还可以区分多个说话人,输出对话形式的逐字稿,也可以根据预设的行业和场景,生成总结和摘要。

图7:声音生成计算和多模态大模型可以帮助SoundAI FairyClip进行区分说话人的实时转写

而这些模型都得益于声智独家的SoundAI Azero人工智能开发框架,它是一个基于AI大模型技术的综合性平台,融合行业领先的声学、语音、语言AI算法为一体模型,为AI智能硬件量身打造可灵活组合、便捷调用的AI服务,让大模型可以运行在更多的硬件终端,满足更多、更复杂的用户需求,还可以为用户提供更加个性化的服务。

图8:SoundAI Azero人工智能开发框架集声学、语音、语言AI算法为一体

作为国内率先在实际中落地应用的语言大模型,SoundAI AzeroGPT在研发伊始便着眼于大模型「解决问题」的能力,将技术研发和产品设计的重点放在实践应用的效果上。只有这样「关键时刻值得信赖」的算法才能「身经百战」,服务于二十大、北京冬奥会和冬残奥会、联合国COP15大会等众多攻坚项目。

一方面它所依赖的Azero开发框架,是由声智科技自主研发而成,拥有广泛的多领域知识,强大的语言处理能力。另一方面,AzeroGPT大模型已经在金融政务、医疗健康、智能硬件等众多行业都有成功的实践应用案例,确保了大模型的先进性与实用性。同时,声智科技还专门为AzeroGPT针对我们国家的环境和文化背景进行了优化,还加入了多种角色拟人化功能,使得它在处理不同场景下的中文内容时,更加得心应手。

图9:AzeroGPT壹元大模型已经在金融、政务、医疗、3C等多行业中落地应用

从ChatGPT开始,大模型已经从一个软件应用的形态成为了一种无处不在的生活方式。各种备受瞩目的智能硬件,正在将大模型这项新技术从虚拟带到现实。

要实现大模型真正惠及于民,并非一蹴而就,开发者不仅要追求技术革新的速度,更要从解决人们实际问题为出发点,以简单易用、高效便捷为原则。SoundAI FairyClip 目前更加聚焦于工作和学习场景,但是随着运动监测、放松电台等功能的完善,它的产品定位将更加贴近一个全时段、全场景的AI可穿戴智能耳机,陪伴用户的工作、学习、生活、运动和健康,同时也将带来更加智能和个性化的AI硬件变革。

图10:AzeroGPT壹元大模型已在声智AI声学阵列智能硬件中全面使用。

总得来说,正如比尔·盖茨最新预言所说:“耳机和眼镜才是AI硬件的重点”,AI耳机的爆发是一个积极的信号,但是大模型的发展不应只是局限于舞台上的「炫技」,只有真正扎根于大众的实际需求,切实地为工作和生活提供有效的帮助,让智慧科技让生活更美好,而不是抢夺基层民众的生存机会,只有这样,大模型才能发挥出其应用的社会价值。

0 阅读:1

爆科技

简介:爆料最新科技资讯,分享最美科技生活