大模型会写论文,但它真的懂科研吗?
很多时候,AI只是在“扮演”科学家——引文献、列逻辑、排格式,看起来有模有样。但只要深究,会发现全是破绽:逻辑靠编,推导靠蒙,结论是否正确全看运气。
就在最近,此前发布过BabyVision多模态评测基准的UniPat AI,甩出了一个硬核的开源项目:
UniScientist。
这个模型参数只有30B,却可以实现“提出假设-收集证据-执行可复现的推导-迭代验证直至结论成立”这一环路的闭合。
在FrontierScience-Research和ResearchRubrics等权威科学研究榜单上,它匹敌甚至超越了参数量大一个数量级的顶尖闭源模型。 科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude