General Reasoning,一个用于构建大型推理模型的新开源资源。网址很短:gr.inc
目前有 150 万个问题,27 万个思维链追踪(也就是各家的推理类大模型是如何回答这些问题的)。问题分类如图1 (部分)。
同时,还可以查到大模型回答这些问题准确性的排名( 如图2,目前deepseek r1排第一 ) ,以及每个大模型擅长回答哪一类的问题和不擅长回答哪一类的问题 (图3)。也许可以用这个数据来做刚发的那个分类器
General Reasoning,一个用于构建大型推理模型的新开源资源。网址很短:gr.inc
目前有 150 万个问题,27 万个思维链追踪(也就是各家的推理类大模型是如何回答这些问题的)。问题分类如图1 (部分)。
同时,还可以查到大模型回答这些问题准确性的排名( 如图2,目前deepseek r1排第一 ) ,以及每个大模型擅长回答哪一类的问题和不擅长回答哪一类的问题 (图3)。也许可以用这个数据来做刚发的那个分类器
作者最新文章
热门分类
科技TOP
科技最新文章