MistralLarge大模型发布,欧洲公司挺进全球AI第一梯队

开心盖土 2024-03-28 05:08:07

在AI领域,大模型的竞争一直都是焦点。近日,Mistral AI,一家立足欧洲的公司,发布大型语言模型——Mistral Large,其性能直逼GPT4。此举象征着AI竞争格局在发生微妙的变化,欧洲AI技术的新兴力量正在挤入全球AI竞争的第一梯队。

**Mistral Large:性能与创新并行**

Mistral Large 的推理准确性优于 Claude 2、Gemini Pro、GPT-3.5,推理速度超过了 GPT-4 和 Gemini Pro,它支持32k token的上下文窗口和具备细化的自定义函数调用功能,支持英语、法语、西班牙语、德语和意大利语,对语法更精确,但不支持中文。并且它不是开源模型,这次的发布公布了跑分,API和应用,但没有下载链接了。

在 MMLU 上的比较(测量大规模多任务语言理解)

Mistral Large 目前已经能在 Mistral AI 自有平台 La Plateforme 和微软 Azure 上使用。除了 Mistral Large 之外,Mistral AI 还发布了新模型 Mistral Small,针对延迟和成本进行了优化。Mistral Small 的性能优于 其开源模型Mixtral 8x7B,并且推理延迟得到了降低,提供了一种开放权重模型和旗舰模型之间的中间方案。

试用链接:http://chat.mistral.ai

但模型的定价跟GPT-4 相比并不具备优势。Mistral Large在Azure AI上的定价为:输出为0.024美元/1000 token,输入为0.008美元/1000 token。

### 数据及市场响应

Mistral Large 在多个常用基准测试中取得了优异的成绩,使其成为世界上排名第二的可通过 API 普遍使用的模型(仅次于 GPT-4)。具体基准测试结果对比如下:

推理和知识

在广泛常识、推理和知识基准上的表现对比

Mistral Large 展现出了强大的推理能力。预训练模型在标准基准上的性能仅次于GPT4

多语言能力

在 HellaSwag、Arc Challenge 和 MMLU 上法语、德语、西班牙语和意大利语的比较

Mistral Large 具有原生的多语言能力。它在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测试中明显优于 LLaMA 2 70B。

数学和编码

在流行编码和数学基准上的性能对比

Mistral Large 在编码和数学任务中能力也非常突出。

根据公布的报告,Mistral Large模型在标准的理解和生成任务中,与同类产品相比,展现了更优的性能表现。尽管在参数的数量上略低于GPT-4,但Mistral Large在多数评测中的实际表现与后者相差无几。从公布的数据看,Mistral AI在技术上已经迈入了AI领域的顶尖行列。

### 战略转变:开源到商业化

Mistral AI曾以倡导开源和强大的社区互动而著称,它的开源模型Mistral 7B和Mistral 8 x 7B在开源社区获得极大好评,其在2023年春天向投资者提出的最初方案中,批评了由美国公司主导的「正在形成的寡头垄断」,这些公司开发的是专有闭源模型。然而,新模型发布后,Mistral AI 官网悄悄把所有有关开源社区义务的内容全部撤掉了。Mistral AI的CEO Jean Dupont在接受采访时表示:“开源是美丽的乌托邦,但我们的目标是构筑一个持续成长的、有竞争力的企业。我们将继续推动AI技术的前进,但在这个过程中,我们也要确保公司的可持续发展。”现在Mistral AI开始搭建以“large,medium,small”命名的三个闭源商业模型产品线,这标志着公司从科技的自由分享走向更为谨慎、封闭的商业模式。果然是理想敌不过金钱。

### 与微软的联手与市场展望

微软已开始在Azure云平台上推广Mistral Large模型,为其增添了强大的商业支持。Mistral AI的高级副总裁Marie Curie在发布会上表示:“与微软的合作为我们提供了与世界顶级企业合作的机会。我们相信,Azure的全球覆盖将帮助我们将Mistral Large带到更多市场。”Mistral AI 对路透社表示,微软将持有该公司少数股权,但未透露细节。

与此同时,Mistral Large特别着重于适应欧洲市场的法规和文化,它的数据处理和隐私保护机制在欧盟严格的GDPR准则之下进行了优化。在一次在线数据隐私和安全研讨会上,Michael Weber,欧洲数据保护组织的前任主席表示:“Mistral Large展现了它对欧洲数据保护意识的重视,从而为用户提供了更大的信任度和安心感。”

Mistral AI公司位于法国,Mistral AI的创始成员来自谷歌旗下的DeepMind以及Meta,该公司联合创始人CEO Arthur Mensch曾在DeepMind位于巴黎的办公室工作,另外两位联合创始人Timothee Lacroix和Guillaume Lample曾在Meta位于巴黎的AI实验室工作,Meta的首席AI科学家Yann Lecun也是法国人,他领导了Meta大型语言模型的开发。

三名创始团队成员年龄都不大,三十出头,Mistral AI还拥有一个非常资深的创始顾问团队,其中一位是法国前数字事务部长塞德里克·奥(Cedric O),另两位是法国健康初创公司Alan的CEO和CTO。

从以上可以看出Mistral AI是一家彻底的法国AI公司,或者说是一家欧洲的AI公司,通过这次Mistral Large大模型的发布,Mistral AI坐实了“欧洲版OpenAI”的名头,也代表欧洲AI公司挤入了全球AI竞争的第一梯队。

0 阅读:0

开心盖土

简介:感谢大家的关注