现代大语言模型这条路线,不能简单说是某一天突然诞生的,而且去追踪历史的话其实也没太大必要性。如果从今天大家熟悉的 GPT 路线看,GPT-1 大概是 2018 年由 OpenAI 团队推出,Alec Radford 和 Ilya Sutskever 是其中非常关键的人物。它的重要意义在于,把 Transformer 架构、海量文本预训练和下游任务微调串到了一起,证明了“大模型先读大量文本,再迁移到具体任务”这条路是可行的。
但如果从“预训练—微调”这个思想源头看,同期 Jeremy Howard 和 Sebastian Ruder 的 ULMFiT 其实更早(图3),它也被一部分人视为通用语言模型迁移学习的重要起点。所以有企业宣传自己是什么首发大模型,然后试图论资排辈,其实看起来似乎比较愚蠢,且更准确地说,GPT-1理论上依然是被公认的现代 GPT 式大语言模型路线的重要起点,而 ULMFiT 则是预训练微调范式里很关键的前置探索。
回到汽车行业,今天很多车企讲的大模型,严格说已经不只是语言模型,而是多模态通用模型。它不只处理文字,还会融合语音、图像、代码、车辆数据和行业知识。但落到用户能感知的地方,最常见的还是座舱交互、语音助手、知识问答这些很简单的东西。
所以我觉得要理性看待。大模型当然有价值,但它不能替代汽车本身的底层能力。汽车的核心,依然是三电、底盘、车身、安全、热管理和可靠性。如果一个企业把座舱里“更会聊天”包装成汽车智能化的主要卖点,再拿它去讲溢价,那它确实可能成为新能源泡沫的一种新形式。因为汽车不是手机支架加聊天机器人,基础硬件和安全边界,才是真正价值基座。 车评精选汽车黑科技懂车老王


