我们讲了很多生僻字,有的是特殊字汉字查询,有的是写某个汉字的特殊方式。虽然我们常说常用汉字只有3000个,但有些汉字可能有多种写法。
那么一共有多少个汉字呢?今天我们将讨论这个问题。
1
自古以来汉字数量
中国有五千年的历史,汉字的历史太长了,一共有多少个汉字很难说。
据学者考证,甲骨文、铜文中约有5000个汉字,我们知道的汉字有3000个左右。
我国最早的字典《说文解字》,收录了9353个汉字。
北宋《雷变》收录汉字多达33190个,清代《康熙字典》收录46933个字,是古代汉字数量最多的字典。
《汉语词典》收录56000余字,20年来最新版《新华词典》收录13000余字。
不要对这个数字感到惊讶。《现代汉语常用字表》只有3500个汉字。据《汉语与生活状况报告》显示,常用汉字2394个,占语言空间的99%。
所谓常用汉字,以庞中华的硬笔书法为例。小时候家里有这本书,妈妈逼着我去练,心里很不情愿。这本字帖是2500字。
2
不同编码标准带来的问题
在计算机普及和数字时代到来之前,我们只能以字典为标准来统计汉字的个数。
然而,数字时代到来后,除了字典,中国政府开始定期收集汉字,并将其编排在国家标准文件中。
大陆最早的标准是1980年制定的,叫GB2312,是汉字信息交换的国家代码,大陆通用。这种编码也用于新加坡等地。
台湾于 1983 年开始使用著名的“Big Five”或 big5 字体。
这两个标准深深地“伤害”了老一辈电脑游戏玩家的心。在很多三国志游戏迷的心中,曹操还有另一个名字——“成为巨人”。
其实这就是大五码里的“曹操”二字。由于标准不一致,台湾出品的游戏是在大陆电脑上运行的,所以才有了这个奇怪的名字。
为了解决这个问题,曾经有一个辅助软件,它提供了字符编码选择的功能,让一些汉字可以正确显示。
正是为了解决这些问题,1993年5月,中日韩联合研究组正式制定了CJK(中日韩统一表意文字),同年汉字查询儿童教育网,国际标准化组织发布了10646,而我国也是根据这个标准制定了GB13000。1-93。
3
汉字个数的粗略参考
为什么汉字的标准不是中国制定的,而是在国际制定之后,在国家标准之前?这是因为虽然汉字是中国的本土文字,但使用汉字的国家并不局限于中国。
最典型的是日本、韩国和越南。他们的字也叫“汉字”,或者说在字的写法、读音、字义上明显具有汉字的特点。
“秘密”这个词被选为2020年的日本人物
所以iso字库的来源也包括这些国家;此外,海外还有大量的中国古籍。各国要么有汉字文化研究机构,要么与国内汉字研究机构合作,定期向iso报告新汉字。
需要说明的是,按照国际汉字标准制定国内汉字集的做法一直沿用至今。
这对于所谓的“汉字总数”也有一个粗略的参考标准:
此外,2012年我国启动了“汉字库”项目,旨在编码30万个汉字、10万个少数民族文字、10万多个甲骨文等不常见的古文字,总字数约50万个。 .
4
汉字数量的发展
50万个汉字的数量,覆盖了历史上所有的汉字。然而,这个数字并非没有增长。
我们常说语言是一个“常规”的东西,在这方面,汉字也是类似的。比如2020年发布的iso10646扩展字符集g中,就已经包含了民间词biáng。
此外,在化工领域,也有一些新创造的汉字。2017年5月9日,新化学元素中文名称公布,两个新创字被纳入国标字,即——
这些汉字将是我们当前和未来网络通信和数字通信的基石。
5
汉字输入困难
但是,汉字多了,又要面临一个新的问题:这么多汉字怎么输入?
例如,我们经常使用拼音输入法。汉语拼音有300多个读音,gb2312时代有6000多个字。如果输入一个读音,对应的汉字平均只有二十个或三十个。
根据输入法每行显示的十个候选字符计算,翻页两三下就可以找到要输入的汉字。
然而,今天汉字的数量已经达到了90,000个,每个读音下平均有300页候选汉字。
我们是否必须翻页 300 次才能找到我们要输入的某个汉字?
我们都遇到过这样的问题。在拼音输入法下找某个词,翻到最下面也没找到。只要我们更详细地搜索,输入一个单词可能需要几分钟。
别担心,有一个很好的解决方案。我们稍后会找机会与您讨论这个问题。
扫帚字符简
汉字文化博大精深,
我们常用的汉字不到3000个;
新华字典约8000个汉字;
现在的电脑、手机等终端,
可显示约30000个汉字;
2005年国家标准GB18030-2005,
包含70,000多个汉字;
以及最新的国际标准10646,
包含90,000多个汉字。
不管有多少汉字,
如果您不知道并且无法在计算机上输入,
所有这些汉字都丢失了。
我们所要做的就是与您合作,
寻找汉字文化。
欢迎关注:曝扫把人物简。