这款AI产品爆了，没想到大模型应用爆品是耳机

近日，一位国外友人发布的短视频里，一句魔性的「city不city」，直接让这句中英文混搭词迅速走红。中国外交部发言人毛宁4日在例行记者会上表示，很高兴看到外国朋友们亲身感受生动真实的中国，欢迎大家来中国。

在视频中，来自美国的「保保熊」在向观众展示他在中国的旅行体验，他戴着一对酷似珍珠耳环的耳夹式耳机，惬意地走在上海的街头。在视频中，保保熊提到这款耳机还支持翻译功能，让大家听懂外国话，可以在全世界「city city」。

图1：美国友人「保保熊」在分享中国城市体验的短视频中多次用到「city不city」

如果说ChatGPT发布的2022年是AI元年，那么2024年则是AI硬件集中爆发的一年。备受瞩目的智能硬件，正在将大模型这项新技术从虚拟带到现实。

三星在今年年初就向全球提出了关于AI的的全新战略——「AI for all」，致力于将AI技术通过手机、电脑甚至冰箱、电视等大小家电深入应用到生活场景，并从年初至今相继发布了Galaxy S24系列旗舰手机、Galaxy Z Fold 6折叠屏手机、Galaxy Watch 7智能手表、Galaxy Ring智能戒指等智能硬件设备，这些设备有了AI大模型的加持，不仅能全方位地提升用户的视听体验，还能为用户提供更加便捷、高效的生活体验。

图2：三星电子于 CES 2024 展示「AI for all」愿景，为居家带来崭新体验

而德国的三大车企——大众汽车、梅赛德斯奔驰、宝马，也在今年相继展示了带有生成式AI大模型的车型。未来，用户可以在驾驶大众汽车的过程中，使用IDA语音助手实时获取由人工智能提供的海量信息。而梅赛德斯-奔驰则推出了 MBUX 虚拟助理，可以为驾驶员提供「自然」、「可预测」、「个性化」和「有共情能力」的大模型服务。宝马集团同样推出了基于亚马逊Alexa 大语言模型的全新一代BMW智能个人助理，无需动手，即可实现情感化的人车交互。

图3：梅赛德斯-奔驰全新的MBUX 虚拟助理基于大语言模型开发，让人车语音交互更自然、更人性、更个性

此外，微软和苹果也在年中相继展示了支持大模型的个人终端设备，2024年5月，微软推出以AI为核心能力的Copilot+PC，同时推出了Surface Pro 和 Surface Laptop两款硬件，而苹果也在6月推出了个人智能化系统Apple Intelligence，为 iPhone、iPad 和 Mac 引入强大的生成式大模型。

图4：微软的Copilot+PC 是迄今为止速度最快、最具智能体验的 Windows PC。

而文章最初提到的那款很「city」的耳机，正是声智AI可穿戴设备家族的新成员——SoundAI FairyClip，这款外观模仿珍珠首饰设计的智能可穿戴耳机，在SoundAI AzeroGPT壹元大模型的加持下，采用耳机独有的语音人机交互的模式，可以实现多语翻译、语音转写、智能写作等诸多AI功能。一对小小的蓝牙耳机就能成为工作学习和生活的好伙伴，成为了中国大模型落地应用的一针强心剂。

图5：SoundAI FairyClip是行业中首次为耳夹式耳机引入声学AI技术

AzeroGPT壹元大模型可以让SoundAI FairyClip根据用户所听到的内容提供个性化的人工智能服务，借助语音转写、多语翻译、智能摘要等功能，可以将现实世界中的声音信息收集、整理、分析并最终根据用户的需求呈现出相应的文字信息或语音信息。

图6：有了AzeroGPT大模型的加持，SoundAI FairyClip 可以很多功能。

而在AzeroGPT大模型的基础上，SoundAI FairyClip还应用了声音生成计算和多模态大模型的创新方法。例如使用SoundAI FairyClip进行会议或者课堂上的实时转写，传统的方法需要先调用声学模型，将语音信息从复杂的声场环境中提取出来，再通过语音模型，让AI能将连续的语音构建为文本，提取语音中的内容、语音特征、停顿和节奏以及说话人的情感信息，再通过语言模型，根据文字进行任务处理，在AI理解单个词汇、长句意义的基础上，提高模型对不同口音和语速的适应性，使得它可以迅速get到多个说话人的核心语义，并呈现在APP中。而 SoundAI FairyClip 就可以使用融合声学、语音和语言的大模型进行准确率更高的实时转写，还可以区分多个说话人，输出对话形式的逐字稿，也可以根据预设的行业和场景，生成总结和摘要。

图7：声音生成计算和多模态大模型可以帮助SoundAI FairyClip进行区分说话人的实时转写

而这些模型都得益于声智独家的SoundAI Azero人工智能开发框架，它是一个基于AI大模型技术的综合性平台，融合行业领先的声学、语音、语言AI算法为一体模型，为AI智能硬件量身打造可灵活组合、便捷调用的AI服务，让大模型可以运行在更多的硬件终端，满足更多、更复杂的用户需求，还可以为用户提供更加个性化的服务。

图8：SoundAI Azero人工智能开发框架集声学、语音、语言AI算法为一体

作为国内率先在实际中落地应用的语言大模型，SoundAI AzeroGPT在研发伊始便着眼于大模型「解决问题」的能力，将技术研发和产品设计的重点放在实践应用的效果上。只有这样「关键时刻值得信赖」的算法才能「身经百战」，服务于二十大、北京冬奥会和冬残奥会、联合国COP15大会等众多攻坚项目。

一方面它所依赖的Azero开发框架，是由声智科技自主研发而成，拥有广泛的多领域知识，强大的语言处理能力。另一方面，AzeroGPT大模型已经在金融政务、医疗健康、智能硬件等众多行业都有成功的实践应用案例，确保了大模型的先进性与实用性。同时，声智科技还专门为AzeroGPT针对我们国家的环境和文化背景进行了优化，还加入了多种角色拟人化功能，使得它在处理不同场景下的中文内容时，更加得心应手。

图9：AzeroGPT壹元大模型已经在金融、政务、医疗、3C等多行业中落地应用

从ChatGPT开始，大模型已经从一个软件应用的形态成为了一种无处不在的生活方式。各种备受瞩目的智能硬件，正在将大模型这项新技术从虚拟带到现实。

要实现大模型真正惠及于民，并非一蹴而就，开发者不仅要追求技术革新的速度，更要从解决人们实际问题为出发点，以简单易用、高效便捷为原则。SoundAI FairyClip 目前更加聚焦于工作和学习场景，但是随着运动监测、放松电台等功能的完善，它的产品定位将更加贴近一个全时段、全场景的AI可穿戴智能耳机，陪伴用户的工作、学习、生活、运动和健康，同时也将带来更加智能和个性化的AI硬件变革。

图10：AzeroGPT壹元大模型已在声智AI声学阵列智能硬件中全面使用。

总得来说，正如比尔·盖茨最新预言所说：“耳机和眼镜才是AI硬件的重点”，AI耳机的爆发是一个积极的信号，但是大模型的发展不应只是局限于舞台上的「炫技」，只有真正扎根于大众的实际需求，切实地为工作和生活提供有效的帮助，让智慧科技让生活更美好，而不是抢夺基层民众的生存机会，只有这样，大模型才能发挥出其应用的社会价值。

DC生肖网

这款AI产品爆了，没想到大模型应用爆品是耳机

爆科技