姚順雨推出来的那个大模型能力评测体系很有创新性,实测结果表明,LLM的内化与泛化能力其实还远远比不上人类,最顶尖LLM这方面的上限也与人类的平均水平差距很大。这是前沿探索和基础研究的事情,实际上Agentic AI时代已经到来,商业环境里LLM智商够用的。因为,在模仿式学习方面,人类的下限与LLM的平均水平差距更大。人类社会应该反思一下,怎么会创造出这么多纯粹形式主义照搬照抄的工作岗位
姚順雨推出来的那个大模型能力评测体系很有创新性,实测结果表明,LLM的内化与泛化能力其实还远远比不上人类,最顶尖LLM这方面的上限也与人类的平均水平差距很大。这是前沿探索和基础研究的事情,实际上Agentic AI时代已经到来,商业环境里LLM智商够用的。因为,在模仿式学习方面,人类的下限与LLM的平均水平差距更大。人类社会应该反思一下,怎么会创造出这么多纯粹形式主义照搬照抄的工作岗位