token 这个翻译有个毛的热度。
主要还是当年 it 技术我没有融会贯通的时候,买了一堆什么 21 天速通 python 这种垃圾翻译书籍。
看得我怀疑人生。。。
后来发现,影响理解的最大问题是这些翻译的人太喜欢在自己没有真正搞明白原文和中文和技术的时候,造各种乱七八糟的新词了。。。
所以后来都是看原版,再后来只看 github 项目的 readme 了。
所以从信息传递的角度而言,今天翻译已经是一种低效的工作了。而且如果翻译的不好,增加新的误解,则是完完全全的负价值了。
就比如说词元这个翻译,我敢保证,以后你看 CNN 网络的时候,同样碰到 token 这个概念,而且,被翻译成了词元。。。
那你一定会问。。。
这 TM 和 “词” 有个毛的关系????
这不是语言模型啊。。。
所以差的翻译,有的时候,真的不如不翻译。