【EasyR1:基于veRL的高效、可扩展多模态强化学习训练框架,助力AI开发者

爱生活爱珂珂 2025-02-23 13:22:32

【EasyR1:基于veRL的高效、可扩展多模态强化学习训练框架,助力AI开发者高效训练模型。亮点:1. 支持7B模型训练,仅需8块80GB显存;2. 支持Qwen2.5等多模态模型,适配多种算法;3. 提供Docker环境,一键搭建开发环境】

'EasyR1: An efficient, scalable, multi-modality training framework for Reinforcement Learning based on veRL.'

GitHub: github.com/hiyouga/EasyR1

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注