面壁智能发布端侧大模型“面壁MiniCPM”

学学看科技 2024-02-04 06:06:05

2 月 1 日,面壁智能举办新品发布会,推出了最新的旗舰级多模态大模型 “面壁 MiniCPM”,参数规模为 20 亿,使用了 1TB 精选数据进行训练。

面壁智能 CEO 李大海在发布会上表示,MiniCPM-2B 在多项主流评测榜单、中英文平均成绩均超越了开源的 Mistral-7B,英文榜单的平均分甚至超越了 Falcon-40B、MPT-30B 等百亿参数模型。

所谓 “端侧大模型”,即模型服务部署在手机、电脑、IoT 设备等本地终端,直接由终端芯片完成推理过程,无需联网。作为一款端侧大模型,MiniCPM 声称 “跑通国际主流手机品牌与终端 CPU 芯片,老手机也无压力”,但从吞吐量来看,实际表现或许有待提升。

开源地址(内含技术报告):

MiniCPM GitHub:

OmniLMM GitHub:

0 阅读:0

学学看科技

简介:感谢大家的关注