很多企业布局智能语音服务后,始终难以实现规模化推广。一方面硬件投入压力突出,传统语音识别方案依赖大量GPU服务器支撑高并发业务,大幅抬高项目开支,同时难以匹配国产化硬件环境;另一方面人机对话体验生硬,传统半双工交互只能人机轮流发言,环境噪音、用户中途补充、短暂思考停顿都会造成识别失误。讯飞星火VoiceWise从底层技术拆解两大难题,自研高性能CPU版ASR引擎,摆脱GPU依赖,完美适配政企主流国产化软硬件设施。性能层面实现大幅优化,在线短语音识别并发能力提升九成,离线录音转写吞吐量提升150%,更少服务器即可承载高峰业务流量。语音识别覆盖多语种、多方言,支持中英混说、方言转书面普通话,配套完善后处理工具优化输出文本。全双工交互模块同步补齐体验短板,设备发声时持续拾音,过滤环境杂音、设备自扰信号,精准捕捉用户打断意图,区分对话停顿与结束节点。落地实例显示,大型保险外呼七千路并发场景,该方案相比传统CPU、NPU方案分别节省近五成、超五成成本,助力银行、证券机构搭建轻量化智能语音服务链路,打通AI语音落地堵点。
#大模型国家队##全栈自主可控##语音及语言信息处理国家工程研究中心#
