谷歌发布轻量级开源大语言模型Gemma

谷歌发布了开源大语言模型 Gemma，这是一款轻量级、先进的开源模型，供开发者和研究人员用于 AI 构建。

Gemma 模型家族包括 2B（20 亿参数）和 7B（70 亿参数）两种尺寸，能够在不同的设备类型上运行，包括笔记本电脑、桌面电脑、IoT 设备、移动设备和云端。

性能和设计

Gemma 模型在技术和基础设施组件上与 Gemini 共享，这使得 Gemma 2B 和 7B 在其大小范围内相比其他开放模型具有最佳性能。

Gemma 模型不仅可以直接在开发者的笔记本电脑或桌面电脑上运行，而且在关键基准测试中的表现超过了更大的模型，同时遵循严格的安全和负责任输出标准。

主要特点

轻量级、高性能模型：Gemma 模型家族包括 Gemma 2B 和 Gemma 7B 两种尺寸，提供预训练和指令调优的变体，针对其大小范围内相比其他开放模型具有最佳性能。

跨框架工具链支持：支持 JAX、PyTorch 和 TensorFlow 通过原生 Keras 3.0 进行推理和监督式微调（SFT），适应多种开发需求和环境。

易于入门和集成：提供准备就绪的 Colab 和 Kaggle 笔记本，以及与 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等流行工具的集成，方便开发者快速上手。

高效的运算能力：针对多个 AI 硬件平台上进行优化，确保在 NVIDIA GPU 和 Google Cloud TPU 上的行业领先性能。通过与 NVIDIA 的合作，无论是在数据中心、云端还是本地 RTX AI PC 上，都确保了行业领先的性能和与尖端技术的集成。

Gemma 模型能够在不同的设备类型上运行，包括笔记本电脑、桌面电脑、IoT 设备、移动设备和云端。这种广泛的兼容性使得模型能够适应各种应用场景和需求。

模型地址：

博客：

DC生肖网