【EasyR1:基于veRL的高效、可扩展多模态强化学习训练框架,助力AI开发者高效训练模型。亮点:1. 支持7B模型训练,仅需8块80GB显存;2. 支持Qwen2.5等多模态模型,适配多种算法;3. 提供Docker环境,一键搭建开发环境】
'EasyR1: An efficient, scalable, multi-modality training framework for Reinforcement Learning based on veRL.'
GitHub: github.com/hiyouga/EasyR1