DC娱乐网

OpenAI员工Aidan McLaughlin对DeepSeek-R1核心强化

2025-09-28 13:01:25 蚁工厂科技

OpenAI员工Aidan McLaughlin对DeepSeek-R1核心强化学习算法GRPO的评价。

[挖鼻]技术上不好评价，但当“前沿实验室”并不公布他们的算法时这种说法毫无意义

阅读：3 点赞：0