现代大语言模型这条路线，不能简单说是某一天突然诞生的，而且去追踪历史的话其实也没

现代大语言模型这条路线，不能简单说是某一天突然诞生的，而且去追踪历史的话其实也没太大必要性。如果从今天大家熟悉的 GPT 路线看，GPT-1 大概是 2018 年由 OpenAI 团队推出，Alec Radford 和 Ilya Sutskever 是其中非常关键的人物。它的重要意义在于，把 Transformer 架构、海量文本预训练和下游任务微调串到了一起，证明了“大模型先读大量文本，再迁移到具体任务”这条路是可行的。

但如果从“预训练—微调”这个思想源头看，同期 Jeremy Howard 和 Sebastian Ruder 的 ULMFiT 其实更早（图3），它也被一部分人视为通用语言模型迁移学习的重要起点。所以有企业宣传自己是什么首发大模型，然后试图论资排辈，其实看起来似乎比较愚蠢，且更准确地说，GPT-1理论上依然是被公认的现代 GPT 式大语言模型路线的重要起点，而 ULMFiT 则是预训练微调范式里很关键的前置探索。

回到汽车行业，今天很多车企讲的大模型，严格说已经不只是语言模型，而是多模态通用模型。它不只处理文字，还会融合语音、图像、代码、车辆数据和行业知识。但落到用户能感知的地方，最常见的还是座舱交互、语音助手、知识问答这些很简单的东西。

所以我觉得要理性看待。大模型当然有价值，但它不能替代汽车本身的底层能力。汽车的核心，依然是三电、底盘、车身、安全、热管理和可靠性。如果一个企业把座舱里“更会聊天”包装成汽车智能化的主要卖点，再拿它去讲溢价，那它确实可能成为新能源泡沫的一种新形式。因为汽车不是手机支架加聊天机器人，基础硬件和安全边界，才是真正价值基座。车评精选汽车黑科技懂车老王

DC娱乐网

现代大语言模型这条路线，不能简单说是某一天突然诞生的，而且去追踪历史的话其实也没

热门分类