DC娱乐网

也许 现在基于1000W Clips 的模型 再上RL 后能力上限仍然是可感知

也许 现在基于1000W Clips 的模型 再上RL 后能力上限仍然是可感知的…因为这个数据集内容丰度与真实世界【通行】相比仍然只是非常小的一部分但是再继续加数据的成本? 已经边际递增了纯胡言乱语