联发科开源台湾在地语音识别模型,优化中英夹杂场景 联发科旗下联发创新基地(MediaTek Research)发布新一代本地化语音识别模型:Breeze ASR 25,主打台湾用语优化,并已于 HuggingFace 平台完整开源(Apache 2.0协议)。 新模型基于 OpenAI Whisper 架构改进,专为“中英夹杂语境”“台湾本地用语”“断句逻辑”训练设计: · 相比 Whisper,整体识别精准度提升约10%; · 中英语转换识别能力提升达56%; · 支持本地部署,可离线运行。 开发者可将其用于语音转写、字幕生成、本地智能助理等场景,是少数真正对繁体语境进行优化的开源模型之一。 联发创新基地负责人许大山表示,当前主流模型对“在地用语”辨识率偏低,此次推出的 Breeze ASR 希望能“听得懂台湾人的说话方式”。 这也是 Breeze 系列的第二代模型。联发基地从今年起已陆续开源 TTS(文字转语音)、视觉语言、多模态推理等繁中模型,动作不断。 🟦你觉得本地模型的关键价值在哪?是更懂你,还是能离线用? 联发科 语音识别 本地模型
联发科开源台湾在地语音识别模型,优化中英夹杂场景 联发科旗下联发创新基地(Me
游乐看科技
2025-07-03 11:27:12
0
阅读:0