AI 可能真的快“没东西吃”了。

2026-05-27 16:37:51 安东尼404 科技

过去几年，大模型疯狂吞下互联网：维基百科、论文、代码、网页文本，很多高质量数据已经被反复清洗、训练和复用。研究机构估算，全球公开高质量文本大约在 300 万亿 Token 量级，而真正的问题是：越优质的数据，越早被吃完。
所以大模型下一阶段的关键，可能不只是更大参数，而是“自己给自己做饭”：
合成数据、自我训练、环境交互、Agent 生成任务数据，都会变成新的竞争焦点。
模型进化正在从“吃互联网”，转向“生产数据”。—— 相当于 6 亿部《红楼梦》