摘要:英语的词汇量实在是太多了,新词和旧词加在一起很快就要接近100万了。由于不断出现的新词,就导致人们不断地记忆和学习。这就导致那些不是专业人士的人,面对新出现的词汇,根本什么也不会。
相比于汉语,英语存在巨大底层逻辑问题,已经是越来越广泛的共识。
不光是因为现在训练AI科技界发现英语词汇量巨大,实际上还在以前经常和汉语做对比的专家学者就发现,英语的很多词汇都属于“死词”。
英语的词汇量实在是太多了,新词和旧词加在一起很快就要接近100万了。由于不断出现的新词,就导致人们不断地记忆和学习。这就导致那些不是专业人士的人,面对新出现的词汇,根本什么也不会。
汉语在这方面虽然拥有巨大的优势,但是在现今的互联网上,英语的内容却远远超过了汉语的内容。也就是说,从语言的角度去看,英语本身的缺陷很多,可在实际应用中,英语使用的比例乃至于承载的信息和内容却在猛增。
为什么会出现这样的情况?今天就来聊一聊英语和汉语之间的不同使用情况,以及各自的优劣。
如果从语言专家的角度看,单纯的比较汉语和英语毫无意义。但是也有人认为,从语言使用的角度去看,目前世界上最有影响力的就是汉语和英语。
尤其是那些小语种的国家,他们的网民上网基本上找不到跟自己语言相同的信息和内容,因为大量的互联网信息要么是用英语传播的,要么就是用汉语传播的。所以一些国外的网民很羡慕中国人,觉得中国人不用刻意学习外语,就能够便捷地上网查询各种信息。
这在逻辑和语言的使用范围上是说得通的。还在20多年前,英语和汉语影响的人口就占到了世界人口的一半多。不管是说英语还是说汉语,交流如此频繁,所以哪怕没有对比的意义,彼此之间也会进行各种各样的比较。
这再次说明两种语言的影响力真真的很大。从入门学习的角度来看,英语的学习似乎比汉语要简单容易一些。
比如在美国,普通的高中生掌握的单词量可能就在3000左右,最多不会超过3500个。学习了这些词汇,完全能够应付日常生活需求,能够进行正常的阅读。
看起来需要掌握的词汇量不多,但是英语有一个最大的弊端,那就是如果一个人想要进行深度一点的学习或者是写作,又或者想要掌握一些专业的知识,那么常规状态下记住的那些单词就完全不够用了。
这是什么意思呢?咱们接着往下对比。
在国内,中学生和大学生掌握的汉语词汇量基本上是一致的。虽然上了大学之后会接触一些新的专业词汇,但是这些专业词汇的数量规模有限,最关键的是,哪怕是中学生,面对大学里的专业词汇,有时候也能看得懂。
但是英语就完全不一样了,中学和大学之间的课程简直是一种生物隔离,很多新的词汇,学生必须得死记硬背之后才能够进行专业学习,这就是英语的一项短板。
相比于汉语和汉字,英语的重复利用率太低,这就导致每出现一种新的事物或者是新的概念,就得用一种全新的词汇来表达,而且这个新词汇和过去的词汇往往没有任何关联。
相比之下,汉字的重复利用率则极高,从古至今积累的汉字数量数以万计,比如康熙字典里收录的汉字有4万多个,但是从古至今最常使用的汉字也就3500个左右。
你仔细想一下,不管是文史类的课程还是理工类的课程,其中的汉字和词语基本上都是最常见的。只要是能够轻松阅读的人,哪怕没有学过什么专业性的知识,也能够认识这些词汇。
举一个最简单的例子,《毛泽东选集》里一共有100多万个字,涵盖的知识面很广,但是整套选集用到的汉字还不到3000个。
再比如《毛主席语录》,薄薄的一本小册子,里面的字数很少,但是在早年学习过的人,尤其是通过这个小册子扫了盲的人,接下来看其他内容,哪怕是相对专业的内容,也完全不成问题。
这便是汉字重复利用率高的特点,好比是电脑里的压缩文件,利用汉字传播和储存的信息效率更高。这就是为什么相同的内容如果用英语书写出来,实际占用的文本文档空间就更多。
千万不要觉得这是小问题,当这些语言文字在实际社会中应用起来的时候,就会显现出很大的差异来。
不管是中国人还是美国人,学历越高,相对来说掌握的词汇量也就越大。尤其是美国人,如果上了大学,必须得掌握更多新的词汇量才能够学习下去。
所以,这样一来,美国的高中生和我国的高中生比起来,美国的高中生就是彻头彻尾的文盲,这绝不是危言耸听。
比如,同样是高中毕业,没有上大学,而是去工厂里上班,中国的高中毕业生能够看懂机械的操作说明,能够认识大量的文字介绍。
美国的毕业生,他们可能连基本的机械说明书都看不懂,因为说明书上有着太多陌生的词汇,而在高中阶段,这些新的词汇也根本学习不到。在这种情况下,为了掌握技能,看懂说明书,美国的高中生还必须得重新学习新词才行。
哪怕是大学生,如果学习的专业不一样,很多美国大学生同样是文盲,而不懂得其他专业里的词汇,中国的大学生又胜一筹。哪怕不懂得其他专业的深度知识,但是简单地交流或者是基本看懂一些书籍也是完全没问题的。
所以说,日常用英语交流的美国人,他们如果想要掌握更多的新知识,几乎每天都得学习新的词汇,而且这些新的词汇往往和老的词汇之间没有任何关联。
这就导致学习者必须死记硬背,否则你就没办法去掌握一项新的技能,哪怕不是去掌握技能,只是单纯的交流和了解信息,如果不掌握词汇,也没办法进行。
最为关键的是,随着这些词汇量越来越多,那些过时的词汇势必会被人们渐渐抛弃和遗忘。时间久了,过去的内容和信息,现代人根本没办法解读。
你去问一个英国人看看,他们现在还会说莎士比亚时代的对白吗?或者是给他们一本羊皮卷,看看他们是否看得懂上面的文字内容?大概率看不懂,因为其中有很多陌生的词汇,现代的英国人完全不解其意。
汉语则不存在这种情况,哪怕是2000多年前的历史文献,哪怕是用文言文记述的,现代人也基本上能够看得懂,至少能够认识那些词汇。
这就是英语的问题所在。由于承载信息量的能力有限,每个时期英语都得造出不同的词汇来表达某个时期的新事物和新概念。时代一直在进步,有些概念在几百年之后就会被抛弃,而代表这个概念的词汇也会被人遗忘。
所以,凡是那些说英语的专业人士,他们得随时随地掌握新的单词,有些单词是现代新造的,有些词汇则属于历史上的,必须都得记住,才能够保证自己专业的研究不会出现问题。
用英语记录的很多文献基本上就是死的,除了专业人士,普通人不要说理解,就是单纯的阅读也存在很大障碍。汉语就不存在这一点。很多历史内容,哪怕是普通人也能够通过掌握的文字了解一个大概。
这就是汉语和汉字的高效,英语不具备这种特性,以至于在现代社会,普通人每天也都得掌握一些新的词语,否则的话,你可能连国家都会混淆。
比如澳大利亚举办奥运会,有些美国人就跑到了奥地利。再比如,大量的美国人看世界地图,根本分不清那些国家的名字。因为这些国家的名字都属于新造的词汇,如果要记忆的话,还得专门去死记硬背和学习。试想一下,有多少人离开了学校还愿意去专门学习呢?
所以有人就吐槽说,英语其实是笨人的语言,在表达方面存在很大的缺陷,每出现一个新的事物或者是新的概念,就得造一个新的词汇来表达。为什么英语的词汇量越积越多?不就是因为过去多年新造出来的词汇也在增加吗?
也因此,在AI研究领域,科技界的人士就认为,汉语将会是未来最具优势的工具,因为汉语承载的信息和表达力效率更高,英语太笨、太臃肿、内容太多,最终就会拖慢效率。
虽然汉语的优势很明显,但是我们也得面对另一种现象。
网上有一个观点,互联网世界的汉语内容正在急剧萎缩,而根据全世界网页使用语言量的排序来看,排在第一位的是英语,汉语只排在了第13位。甚至于日语、土耳其语、波斯语的使用量都比汉语高。
也就是说,网络世界里的英语内容还在持续扩充,但是汉语的内容却在下降。统计数据显示,中文网页的数量2013年还可以占到4.3%,2024年就已经下降到了1.3%,中文互联网内容正在急剧萎缩。
一种观点认为,这是由于各个互联网内容生产商都在采用封闭信息的策略,比方说必须得强制登录账号才能够看到内容,如此一来就导致搜索引擎检索不到这些平台的信息,从而导致内容持续下降。
也有观点认为,中文互联网的网站数量实际上正在下降,大量的网站消失了,自然也就不存在内容了。对普通的网民来说,由于现在通过一两款网络软件就能够接收到海量的信息,由于平时不怎么使用搜索引擎,所以也就感受不到中文互联网内容的持续萎缩。
至于说英语,由于英语网站和网页的数量还在增加,所以在客观上就导致英文互联网内容的使用度越来越多,再加上英文传播和承载信息的效率原本就很低,因此在客观上就导致英文内容的实际占用规模更大。
也可以这样去理解,虽然英语有很多的缺陷,但确实有很多人在使用英语创造更多的互联网内容和信息,而且假以时日,这类信息会越来越多。
单纯从语言的使用来看,汉语的优势确实有很多,但问题就在于,如果使用汉语创造信息和内容的人在减少,如果使用汉语传播的信息在减少,哪怕汉语优势再多,也会被英语抢了风头。
所以未来围绕互联网和新科技,不能只看到汉语的使用优势,还要看到汉语的传播和使用程度。说到底,一种语言如果使用度不够的话,最终也是会被尘封起来的。
而一种语言,哪怕缺陷很多,但只要使用度很广泛,以其为载体创造的内容足够多,那么这种语言就会具备旺盛的生命力。
参考资料:
《再谈汉语和英文的比较和评价》 中国科学院 2003年5月7日
《汉语是不是AI研究的优势工具?复旦教授给出答案》 上观新闻 2025年6月13日
《中文互联网在变得越来越差吗?》 看理想 2024年6月11日
《互联网不能只让英语统治,必须改变商业模式》 财富杂志中文网 2020年12月27日
来源:科普启示录一点号