DC娱乐网

AI 可能真的快“没东西吃”了。

过去几年,大模型疯狂吞下互联网:维基百科、论文、代码、网页文本,很多高质量数据已经被反复清洗、训练和复用。研究机构估算,全球公开高质量文本大约在 300 万亿 Token 量级,而真正的问题是:越优质的数据,越早被吃完。
所以大模型下一阶段的关键,可能不只是更大参数,而是“自己给自己做饭”:
合成数据、自我训练、环境交互、Agent 生成任务数据,都会变成新的竞争焦点。
模型进化正在从“吃互联网”,转向“生产数据”。—— 相当于 6 亿部《红楼梦》