摘要:而我们古老的汉字,那由象形笔画组成的独特文字,是如何突破数字壁垒,融入这个0101的计算机世界的呢?这背后,是一场关乎技术、文化与国家未来的关键战役——748工程。
在计算机的世界里,最初只有由0和1构成的二进制语言。
而我们古老的汉字,那由象形笔画组成的独特文字,是如何突破数字壁垒,融入这个0101的计算机世界的呢?这背后,是一场关乎技术、文化与国家未来的关键战役——748工程。
计算机诞生于西方,英文作为其原生语言,率先解决了在数字世界的“表达”问题。
英文由字母组成,那么计算机硬件是如何识别这些字母的呢?
这要归功于电压的高低电平,它们可以组成逻辑门的有无开关,也就是二进制的1和0。
1960年,ASCII码应运而生,这是一套基于拉丁字母的电脑编码系统,它不仅约定了大小写字母,还囊括了0-9十个数字和一些常见符号,共128个。
例如,大写字母A,通过对应编码表,竖列的A对应0100,横列的A对应0001,组合起来,A对应的机器语言就是01000001,硬件通过高低电平的变化来识别这个字符。
最初ASCII码用7位就足够,但后来扩展到8位,8位最多可表示2的8次方,即256种符号,这不仅满足了字母和数学符号的需求,还诞生了计算机世界的基础单位——字节,1个字节等于8个比特,也就是高低电平跳8下。
有了这个知识的科普,现在想想字节跳动的名字也有一种莫名的浪漫。
而对于其他文字体系,想要进入信息技术世界,就必须拥有自己的编码集和相应的文字处理系统。日本率先启动图像信息处理系统,搞出了日文编码,解决了日文在计算机中的显示和处理问题。
如果我们不行动,那么中文可能会面临被收录在他人标准里,或者只能以拼音形式进入计算机世界,又或者只有懂英语的少数人才能使用电脑处理中文信息的困境。
在这样的紧迫形势下,1974年8月,电子工业部牵头开启了汉字信息处理系统工程,也就是748工程,下设汉字情报检索、汉字精密照排和汉字通信3个子项目。
这是一场关乎汉字命运的技术攻坚战,其重要性超乎想象,不仅是技术的较量,更关乎文化传承与国家信息主权。
748工程的台前关键人物是两院院士王选。
当时,北京大学承担了748工程中汉字精密照排系统的研制任务,王选负责总体设计。在那个我们还处于铅字印刷“铅与火”的时代,要实现印刷技术从“铅与火”走向“光与电”,做出数字存储、激光照排的印刷系统,首要任务就是让汉字走进计算机。
王选院士的字符算法成为了这一过程的关键,他的算法让汉字能够在电脑上显示和编辑,为后续的输入法、汉卡以及中文搜索等奠定了基础。可以说,这是中文计算机世界和中文互联网世界的基石。
1980年,国家标准总局发布了GB2312中文编码集,收录了6763个汉字,总量达91251个,解决了常用汉字在计算机中的编码问题。
但在当时,个人电脑尚未大量普及,对于重要单位来说,将汉字放入电脑后,印刷成为首要任务。因为信息传播主要依靠书本、报纸和各级文件,这些信息源头必须掌握在自己手中。
改革开放后,英美日等大企业纷纷向中国推销他们的照排系统,一些大报社甚至已经开始采购。面对这一局面,王选院士带领的北大团队争分夺秒,推出了华光系列机型,在全国新闻出版印刷业推广普及,成功抵御了国外照排系统的冲击,守住了信息源头。
随后,北大成立科技开发公司,即后来的北大方正,继续在中文信息处理领域深耕。
在桌面排版时代,方正推出了大量字库,几乎涵盖了所有中文显示场景,在计算机和互联网的中文应用中,北大方正成为了绕不开的存在。
从ASCII码到748工程,从王选院士的字符算法到GB2312编码集,再到北大方正的崛起,汉字在计算机世界的发展历程是一部充满挑战与突破的奋斗史。它让汉字在信息时代得以传承和发展,也让我们在计算机和互联网的浪潮中,拥有了属于自己的文化阵地。
如今,当我们在手机、电脑上自如地使用中文时,不应忘记这段汉字信息化的艰辛历程,更应铭记那些为汉字数字化付出心血的先驱们。
文本来源@基地说 的视频内容
来源:贾老师说的不假