开源音频AI又上新：Mistral 发布 Voxtral，支持多语言长音频转写

开源音频AI又上新：Mistral 发布 Voxtral，支持多语言长音频转写

Mistral 又出新动作！这家以开源模型著称的法国 AI 初创公司，刚刚发布了其首个音频模型系列 Voxtral，主打企业级长音频处理、语音交互与多语言支持。

技术亮点：
· 支持转写最长 30分钟音频，基础模型为 Mistral Small 3.1，最长上下文处理能力达 40分钟
· 支持多语言（英/西/法/葡/印地语/意/德/荷），可用于转录、摘要、语音指令转API
· 与 OpenAI 的 Whisper 模型相比，Voxtral 权重开放，可本地部署，强调隐私与可控性

Mistral 正在构建一个“开源可控”的 AI 替代体系，不仅是在文本大模型上，音频也开始挑战封闭体系。对政企或开发者而言，这类模型能在合规、数据主权、安全性上具备更高的自主权。

🟦 你怎么看开源语音模型的发展潜力？Whisper、Voxtral、Deepgram你更看好谁？

AI音频模型 mistral Voxtral 开源模型数码真相集

DC娱乐网

开源音频AI又上新：Mistral 发布 Voxtral，支持多语言长音频转写

热门分类