华为盘古大模型再开源:920亿参数轻量化版本上线,大幅降低国产AI开发门槛。
6月30日,华为公众号官宣,openPangu-2.0-Flash盘古大模型全面开源上线。这款模型拥有920亿参数,主打轻量化、易部署的特点,专门适配华为昇腾AI算力,让各类企业和开发者可以低成本搭建属于自己的AI应用。
openPangu是华为主打开源的AI模型品牌,所有模型均基于昇腾原生技术完成训练和推理,为行业使用国产AI算力提供了成熟、可落地的参考方案。本次更新的openPangu-2.0系列分为两个版本,分别适配不同场景需求,采用分批开源的方式逐步开放全部能力。
此次率先上线的Flash版本实用性极强,虽然整体参数达920亿,但实际运行时仅激活60亿参数,大幅降低了对硬件设备的要求,普通多卡昇腾设备、常规消费级显卡都能流畅运行,中小型企业和普通开发团队均可轻松上手。同时模型支持512K超长文本处理,能够一次性解析几十万字内容,非常适合文档分析、离线智能服务、终端智能交互、边缘设备AI赋能等场景。
按照华为公开的开源节奏,6月30日已正式开放Flash模型的权重、推理代码和配套训推算子;主打高端复杂业务、性能更强的openPangu-2.0-Pro版本,将于7月完成开源上线;剩余全套开发组件和配套能力,会在今年下半年陆续对外开放,所有资源均可在官方代码仓库免费获取。
相较于市面上通用AI模型,这套盘古开源模型最大优势是全程适配国产昇腾算力,从训练到推理全流程深度优化,运行效率更高。以往企业开发AI应用,要么依赖海外模型,适配成本高、存在限制;要么自主调试国产算力,耗费大量人力物力。如今依托开源盘古模型,开发者可以直接复用成熟方案,快速落地AI产品。
此次开源惠及各类市场主体,中小团队可快速搭建智能客服、文本处理工具;硬件厂商可将模型植入手机、智能终端设备;科研机构也能基于完整源码开展二次创新。整体来看,华为持续开源盘古大模型,有效降低了国内AI行业的研发门槛,进一步完善国产AI软硬件生态,助力人工智能在工业、办公、消费终端等多领域普及落地。