联发科开源台湾在地语音识别模型,优化中英夹杂场景
联发科旗下联发创新基地(MediaTek Research)发布新一代本地化语音识别模型:Breeze ASR 25,主打台湾用语优化,并已于 HuggingFace 平台完整开源(Apache 2.0协议)。
新模型基于 OpenAI Whisper 架构改进,专为“中英夹杂语境”“台湾本地用语”“断句逻辑”训练设计:
· 相比 Whisper,整体识别精准度提升约10%;
· 中英语转换识别能力提升达56%;
· 支持本地部署,可离线运行。
开发者可将其用于语音转写、字幕生成、本地智能助理等场景,是少数真正对繁体语境进行优化的开源模型之一。
联发创新基地负责人许大山表示,当前主流模型对“在地用语”辨识率偏低,此次推出的 Breeze ASR 希望能“听得懂台湾人的说话方式”。
这也是 Breeze 系列的第二代模型。联发基地从今年起已陆续开源 TTS(文字转语音)、视觉语言、多模态推理等繁中模型,动作不断。
🟦你觉得本地模型的关键价值在哪?是更懂你,还是能离线用?
联发科 语音识别 本地模型
