中国汉字数量变化:甲骨文中仅四千多,如何增长到今日六万?

诸史 2024-07-12 01:29:08

1985年,在湖南常德澧县城头山镇,考古发现“彭头山遗址”,距今大约9000余年,其中出土了一件非常珍贵的字符。

随后,在距今7000年以上的湖北秭归柳林溪遗址,在距今5000余年的良渚文化陶罐上,在甲骨文上,都发现了这一字符。其中,以甲骨文来看,该字符为数字“五”。

因此,数字“五”应是被中国人使用了万年的汉字,反过来说中国应有上万年的文字史。

那么,从距今万年中国汉字出现开始,一直到今天,中国汉字数量有何变化,引起变化的原因又何在?

首先,商朝之前

迄今为止,商朝之前的文字发现不多,无法判断数量情况,但其中两个发现较为特殊:

其一是安徽蚌埠双墩遗址,考古发现630个字符(下图),距今大约7300年,其中部分字符被江苏镇江、南京等先民使用,已经具备文字的特点。

其二是骨刻文,形成约在4600~3300年之间,目前发现单字数量约900个,龙山文化时期流行的文字,主要出土于山东,但在山西、陕西、内蒙等地也有发现。

文字数量变多,背后反映的是人类物质与精神活动增多,需要更多的字或词来表达,由此导致字词的增多。旧石器时代,人类没有什么多余产出,核心工作是寻找食物,想方设法活下去,当时不需要什么文字。但到了新石器时代,随着社会的进化,新事物新现象的不断涌现,尤其龙山时代系统礼乐制度的出现,需要表达的东西越来越多,文字数量必然随之增多,所谓黄帝时代仓颉造字其实是有其历史背景的,不能简单的将之归为虚构。

双墩刻符、骨刻文等文字数量,符合当时中国社会发展情况,也可以解释商朝文字数量众多的原因。

其次,商朝甲骨文

史前文字的融合与进化,最终在商朝形成了一套成熟文字系统(这不代表成熟文字系统始于商朝,只能说如今考古发现是这样)。根据甲骨文统计,甲骨文上大约一共有4500个文字,这与商朝属于广域王权、以及高度发达青铜文明的身份,显然是相符的。

如今破译的甲骨文,大概只有1600余,还有3000余未能破译。未能破译的甲骨文中,多数属于对汉字系统影响不大的地名人名等专有名词,很多应该未能传承下来,否则这些字就容易被释读了。也就是说,被传承下来的甲骨文,大概在2000个左右,这些属于常用文字。

由于甲骨文用于与沟通鬼神,日常另有简牍文书,因此如果算上未在甲骨文上出现的文字,估计商朝被传承下来的文字数量应超过2000个,可能达到3000个左右。

第三,周秦时代

西周时期,中国出现第一部“文字书”,相传西周宣王时太史作《史籀(zhòu)篇》,也是中国最早的儿童识字课本,《汉书·艺文志》称《史籀》十五篇,但史籀已经失传,究竟收录了多少个字,已经无法知道。

战国时期,中国出现第一部字辞书——《尔雅》,“尔”为近、“雅”为正,即接近雅言、雅正之言,全书收录4300多个词语,计2091个条目。清朝四库全书认为,《尔雅》是战国到西汉“递相增益而成”。总之,战国西汉时,若加上遗漏的部分,中国汉字大概有5000余。

秦朝时期,秦始皇书同文,统一列国文字后,李斯作《仓颉篇》,赵高作《爰历篇》,胡毋敬作《博学篇》,但这些都没能完整流传下来。其中,根据文献记载,仓颉篇收录3300字,但汉书又记载“太史试学童,能讽九千字以上,乃得为史”,九千字者是何书(或与八体六技有关),如今已经不得而知了。

总之,在周朝秦朝时,中华文明突飞猛进,对文字有了更多的“刚性需求”,需要更多的文字表达物质与思想,于是汉字数量出现大幅度增长。比如,“花”就是从“华”分化而来,因为“华”包含的意思太多,于是古人造出了“花”。

第四,两汉魏晋南北朝

两汉时期,中国出现了不少文字书,比如司马相如的《凡将篇》,杨雄的《仓颉训纂》(继写李斯的仓颉篇,增加了2040个字,总量为5300多,即西汉末年汉字大概5000左右),东汉蔡邕等,但其中最重要的是东汉许慎的《说文解字》。

许慎为何要写《说文解字》?原因在于当时文字没有条例,于是“学者往往诡正文,乡璧虚造不可知之书”,说到底就是当时学者故弄玄虚,造出了一些没有的文字,导致文字混乱。在这种情况下,许慎整理历代文字书,最终收录9353个字,其中大约1200个字重复,主要是同一个字的不同写法。下图,许慎雕像。

三国时期魏国张揖,整理的《广雅》收字18150个,但张揖与许慎相隔不远,文字数量不可能如此暴涨。因此,清朝学者考证认为“盖藉张揖之书以纳诸说,而实多揖所未知”,就是“递相增益而成”,但还是冠以《广雅》之名。

两汉魏晋南北朝时,中国文字书层出不穷,大概有百余部,其中南北朝时的《玉篇》,传世下来的收录了13208个字。之所以大幅度增多,原因在于翻译佛经而新造文字,以及社会变化带来的表达需要。比如,玉篇中的“身”部文字数量28个,说文解字中仅2个;珏、鼎属于后世不常用的事物,故而每部增加的数量都非常少。

第五,隋唐之后

隋唐之后,中国文字数量进一步增加,北宋《类编》收录的汉字为33190个、《集韵》收字53525个,清朝《康熙字典》共收字为46933个,新中国《汉语大字典》收字60370个,将佛经、道经和石刻资料中发现的异体字也包含在内的《中华字海》收字85568个。

相比之下,本世纪初,“全球语言监督机构”宣布:以“每98分钟出现一个新英语单词”的速度计算,英语单词量已经达到988968个。显然,今年肯定已经超过百万。从英语出现到现在,大概也就千年左右,却已经暴涨到超过百万个。

这一时期,之所以汉字数量出现暴涨,除了社会发展的表达需要之外,最主要的原因应在于佛教翻译。尤其隋唐两宋,是佛教文献翻译传抄十分频繁的时期,这一段时期汉字数量恰好出现暴涨。有兴趣的朋友可以看一看佛经,上面文字会让人怀疑自己是不是文盲,但实际上上面文字多属于形声字,是对梵语的音译。

值得一问的是,翻译佛经创造的文字,基本都是形声字,犹如西方的表音文字,如果这种传承像古希腊、古埃及等一样断绝,兼且没有文字书释意,那么今人还能读懂吗?

最后,关于本文话题,可以总结为以下两点:

首先,从史前到汉唐,中国汉字的发展,是与社会的发展相适应,随着社会表达需要而文字数量逐渐增加,最终走向成熟规范。

其次,中国文字书数量众多,举世独一无二,这是汉字一脉相承的重要原因,也是后人读懂古代文书的重要资料(比如某些生僻字,没有文字书记载,如何释读)。

当然,不知道是西方字母文字的特殊性,还是其他什么原因,它们与中国文字的发展规律不太相符。比如,古希腊文字、楔形文字、古埃及文字出现就是规范成熟、而且数量庞大,其中古希腊单词数量高达5万多个,又在没有一部当时文字书的情况下,却被西方无碍释读,还能将断绝文字的读音标出来,着实让人惊叹。

参考资料:《胡朴安——中国文字学史》等

18 阅读:4507
评论列表
  • 蓝色 48
    2024-07-13 15:36

    最后一段,正说明西方伪史

    死亡肯德基 回复: 用户10xxx05
    喷的点都不对
    用户10xxx05 回复:
    快拉倒。你以为东方儒家记载历史就正啊?
  • 2024-07-14 10:12

    充分说明了文化的先进性

    江之南 回复:
    不要理这种IP和一串数字的人他们都是拿钱办事就是为了黑中国的人!!
    用户10xxx05 回复: 江之南
    你的伪装术很差。犹太弯弯的儒式黑水哭丧队就是爱玩掩耳盗铃
  • 2024-07-14 09:33

    英语还能叫做字吗?就是符号而已

    用户10xxx05 回复:
    你以为你的不是符号啊?英语是一连串的符号,你呢是堆叠起来的符号
  • 2024-07-13 04:03

    静观西方文明坍塌,也许就在二十年后。

    兩儀式 回复:
    [得瑟]你在南非说这话,你倒是回来呀?
    用户10xxx05 回复: 兩儀式
    自恋病多的井底之蛙爱卖蠢,要理解
  • 2024-07-12 09:21

    这4500 个甲骨文只是被发现的,那没被发现的究竟有多少谁能说的清

    幸福的生活 回复:
    发现不发现,后人用字在管着哩
  • 2024-07-12 09:18

    汉字∶五万多个基本用不到;英文单词∶一百万绝对用不到!

  • 2024-07-14 09:49

    常用汉字3000字已经足够组合,同样的英语要创造很多新词汇才能适用新的事物描述。

    荒与黑皇 回复:
    然而事实是最不讲信用的就是美欧这样的国家,今天签的,明天可能就悔了,就像美国政府不知道造了多少杀戮!简直地球毒瘤!讲不讲诚信跟工具没有关系,跟道德有关系!真要耍心机玩文字游戏,英语就不能?
    用户10xxx05 回复: 荒与黑皇
    英语也可以呀,所以人家一玩不诚信就很容易被你看出来了呀。但是换成文言文 诗词来装逼忽悠,你能很容易的看出来吗?要不然怎么说博大精深呢?
  • 2024-07-14 11:45

    汉语猪,猪肉,猪心,简洁明了干脆,用在所有动物身上都行 英语猪pig 猪肉pork[得瑟]

    YY-1225 回复:
    还有[笑着哭]肉是meat
    用户13xxx78 回复:
    英语一出现即巅峰,连最简单的分类,归纳逻辑都没有:猪、猪肉、猪心,再如:木、林、森、桂、柳。这不是线性,二维的问题,是连最简单的排列组合都不会
  • 2024-07-17 11:47

    三四万个字以内足以应付一个国家或者群体的文化科技描述了,主要是文字组合,比如猪肉,猪毛,猪头……一个猪能表达很多了,组合的字跟别的字又能组合成另外的名称,其它的单字越多越烦,记那么多单字也浪费时间。

    海豚 回复:
    据说1000个常用字就能覆盖日常生活的9成以上
    萧叶 回复: 海豚
    三千
  • 2024-07-14 13:57

    我觉得汉字先进。汉字只要记住常用的几千个就随意组合不用变

    小飞 回复: 用户17xxx49
    你确定同一个字在不同语境里意思相同?
    用户17xxx49 回复:
    问题你英文光记住26个字母,还是看不懂英文,因为字母没有任何意义,但汉字不同,每个子都有意义。
  • 2024-07-14 10:58

    汉语是字,英语是词,哪有可比性。

    用户10xxx05 回复:
    是翻译成中文变成字和词了。在英语里边儿,人家的是word,你的就是画了。
  • 2024-07-14 14:14

    西方文化造假是国家主持的规模化的

    泪ゞ 柔弱了谁的心呢 回复:
    造假谁比得上美国啊[得瑟],把印第安人屠杀完了,整个感恩节[得瑟]。
    用户10xxx05 回复:
    再比如,古代版的996是福报:老儒犯错,拿小孩问责开刀。儒男犯错,拿女人甩锅开刀背黑锅。
  • 2024-07-14 14:00

    韩国一听英语词汇接近一百万个。立刻宣称英语起源于韩国。并准备年尾申遗。韩国女子大学教授除敬德同时呼吁海外韩国同胞向百度百科发起抗议,要求把英语起源改为韩国。并更正为韩国英语。

  • 2024-07-16 11:12

    汉语创造新的词只需要单个汉字组合就行了,而英语却要把字母重新组合创造词语,到时候26个字母一起拼出来个词[笑着哭][笑着哭][笑着哭][笑着哭]

  • 2024-07-17 06:59

    英语字母千年仍然是26个。至于单词,每一个英语单词都有对应的汉语词,有百万个英语单词就有百万个汉语词。[得瑟]

    用户17xxx49 回复:
    很多新造的词和词根没关系。
    和为贵 回复:
    英语低等文明文字资格和汉字相提并论?差了一个维度[呲牙笑]
  • 2024-07-12 18:05

    汉字常用三千个,你去翻翻报纸

  • 2024-08-03 09:34

    这是哪个沙雕,塞回他妈肚里回炉算了,英语的是单词,应该对应的是汉语的词组,英语只有26个字母,汉语有10000多个单字体,都不是一个级别的好不好,汉语表达的精确性英文是无可比拟的,只不过老祖宗不给力,没有全球殖民推广开而已

  • 老K 6
    2024-07-12 16:49

    26个字母怎么演变成10万多组单词和词组,而且还在迅猛增长?

    用户17xxx49 回复:
    汉字只有8种笔划,没有十几种。
    且听风吟 回复: 用户17xxx49
    你是不是想说横竖撇捺折点提钩这八种?
  • 2024-07-14 11:05

    说汉字有万年,有点吹牛了。从仓颉开始就五千年。之前的不能说是文字,只能说符号。

  • 2024-07-14 16:29

    傻逼混淆视听,拿中文字去和英文词比较

    用户10xxx05 回复:
    确实,认知低的,自恋到靠自恋病,掩耳盗铃的伪装术装B。
  • 2024-08-10 20:50

    不是不爱国,有一点要说明的是:国际合同从来不用中文,中文一个字有好多种意思,容易扯皮

  • 2024-07-15 16:56

    增加的主要是词

  • 2024-07-24 18:50

    汉字承载了华夏文明的精华。小编有点不地道,英语只是民族语种。一个是人类的文明,一个是人类的民族,完全不是一个等级的。这不是大人欺负小孩吗

  • 2024-07-14 15:00

    够用就行了吧

  • 2024-07-14 21:51

    需要增加的是读音,几万个字,有多少个是同音字没有人统计吗?

  • 2024-07-17 04:38

    中文四字成语需要多少洋文洋屁翻译?[呲牙笑]孰优孰劣,小孩子都能明白。

    泪ゞ 柔弱了谁的心呢 回复:
    你又不是外国人,你有什么资格说英语比中文好?[得瑟]
    梦境 回复:
    中文表达不精准是应为,你不是国人,国人书写后很精准
  • 2024-07-16 14:06

    6万个汉字一样碾压100万个英文单词[吃瓜]

    wizard小猪 回复:
    好像很懂一样,自己去对照一下汉字有多少个英语单词有多少?
    泪ゞ 柔弱了谁的心呢 回复: wizard小猪
    汉字常用得多少个?英文常用的多少个?自己去数数?
  • 2024-07-19 23:53

    汉语4个字翻译成外语,至少是三句话![笑着哭][笑着哭]

  • 2024-07-14 15:40

    除了汉字,其他都是二维语言,低级玩意。汉字是唯一三维语言。

  • 2024-07-14 16:07

    据说有上千个字母的单词?啥玩意?

  • 2024-07-14 14:51

    英文一个单词就一个意思,汉字可就不一定了,比如,日,太阳,白天,骂人

    度教材侵蚀国家未来 回复:
    谁跟你说英语一个单词一个意思?“man”这个就不止一个意思
    无心 回复:
    好像那个神马舅舅等的就一个单词,一个意思……。
  • 2024-07-16 15:02

    最后一句有意思了[点赞][点赞]

  • 2024-07-23 10:37

    华夏造字成功时,那可是引发了天地异像的,鬼神哭,可见,华夏文明当真是天命之地、主线剧情地。

  • 2024-07-23 13:32

    只有26个字母组合罢了

  • 2024-08-01 13:33

    英语造词太多。

  • 2024-09-12 01:53

    没有秦统一,我们的文字也许也很混乱

  • 2024-07-19 10:11

    麻烦诸位解释一下“卧槽”

  • 2024-07-25 15:37

    再发展下去36个字母都不够用了[呲牙笑]

  • 英语可以想办法改善改善即可,毕竟真正需要的新知识其实不多了。就是难度高的离谱。

  • 2024-08-16 12:09

    英语只有3百年, 美国有25%是文盲而能掌握大量词汇的不过占比13%剩下的70%的人仅仅是保证了日常极少量词汇的阅读和书写半文盲75%的人地图都找不到自己的国家美国[呲牙笑][呲牙笑][呲牙笑][呲牙笑][呲牙笑]

诸史

简介:从历史百家的角度,捕捉人生的精彩和感悟!