开源音频AI又上新:Mistral发布Voxtral,支持多语言长音频转写

游乐看科技 2025-07-16 08:50:55

开源音频AI又上新:Mistral 发布 Voxtral,支持多语言长音频转写 Mistral 又出新动作!这家以开源模型著称的法国 AI 初创公司,刚刚发布了其首个音频模型系列 Voxtral,主打企业级长音频处理、语音交互与多语言支持。 技术亮点: · 支持转写最长 30分钟音频,基础模型为 Mistral Small 3.1,最长上下文处理能力达 40分钟 · 支持多语言(英/西/法/葡/印地语/意/德/荷),可用于转录、摘要、语音指令转API · 与 OpenAI 的 Whisper 模型相比,Voxtral 权重开放,可本地部署,强调隐私与可控性 Mistral 正在构建一个“开源可控”的 AI 替代体系,不仅是在文本大模型上,音频也开始挑战封闭体系。对政企或开发者而言,这类模型能在合规、数据主权、安全性上具备更高的自主权。 🟦 你怎么看开源语音模型的发展潜力?Whisper、Voxtral、Deepgram你更看好谁? AI音频模型 mistral Voxtral 开源模型 数码真相集

0 阅读:3
游乐看科技

游乐看科技

感谢大家的关注