摘要:你可能每天都在电脑上敲汉字,聊微信、写报告时手指在键盘上翻飞,拼音一输文字就跳出来,这事看起来稀松平常。
你可能每天都在电脑上敲汉字,聊微信、写报告时手指在键盘上翻飞,拼音一输文字就跳出来,这事看起来稀松平常。
可你知道吗?几十年前,西方曾笃定地认为“中文活不过互联网时代”,连联合国都有人建议放弃中文作为工作语言。
就因为26个字母搭建的数字世界,压根没给汉字留位置。那么,我们到底是怎么打破封锁,让汉字在电脑里扎下根的?
上世纪初,打字机已经在欧美普及,26个字母拼拼就能打出单词,就算不识字的人练练就会盲打。
可汉字呢?几千个方块字长得各不一样,键盘就那么大,根本装不下。
上世纪20年代,中国人试着自己做中文打字机,成品大得像庙门,得两个人推着走。
用的时候还得手动调字盘、抓字块,对准位置再按下按键,一分钟能打十几个字就算快的,跟欧美普及的英文打字机比,效率差了不止十倍。
1927年美国《生活》杂志上的“中文打字机”漫画
人家26个字母拼拼就能出单词,就算不识字的人练几天也能盲打,汉字却因为“字形太多、结构太杂”,连个合适的机械载体都找不到。
到了1940年代,IBM试着帮汉字“适配”机械打字机,结果搞出来的机器更复杂。
把36个数字键分成四组,得同时按下四个键才能打出一个汉字,而且最多只支持五千个常用字。
打字员得先背熟每个字对应的“四键组合”,再练上好几个月才能勉强上手,普通人根本学不会,最后这机器也没推广开,成了“技术鸡肋”。
等电脑时代来了,汉字的麻烦更是雪上加霜,早期电脑用的是8位字节编码,最多只能处理256个字符。
英文26个字母加标点符号轻松装下,可汉字光常用字就有七千多个,连编码的“门槛”都够不着。
台湾有个工程师搞了个IPX系统,硬是在键盘上装了两千多个按键,用的时候得像翻电话黄页似的,对着厚厚的附魔纸册找字符位置,操作起来比查字典还麻烦。
后来王选院士试着把汉字拆成笔画和部件,就算简化到极致,还是得要256个按键才能覆盖常用字,正常人的手指根本忙不过来。
更让人揪心的是文化上的动摇,1918年有人在《新青年》上喊“不废汉字,必亡其种”,说汉字太复杂,想让中国现代化就得换成拼音。
甚至到了40年代末,美国的中文学者还建议联合国把中文踢出去,理由是“没法电子处理”。
一边是技术上的“死胡同”,一边是认知上的“自我怀疑”,在新时代来临的时候,汉字真的站在了悬崖边上。
第一个破局的是王永民,1978年他在沈阳的研究所里犯愁:拼音输入总分不清同音字,比如打“yinhang”,得翻好几页才能找到“银行”,效率太低。
那时候又没触控笔,手写输入更是天方夜谭。
他盯着纸上的汉字琢磨:汉字不都是横竖撇捺拼出来的吗?能不能像拼拼图似的,把它拆成小部件,再对应到26个字母键上?
接下来的1800个日夜,他几乎住在了办公室里,光记录汉字拆分规律的卡片就写了12万张。
他把常用汉字拆成“字根”,再按笔画特点归到五个区域、26个字母键上,还编了编码规则。
比如“你”字拆成“单人旁”“尔”,对应键盘上的N、T、R三个键,最多敲四下就能出字。
1983年公开演示时,有个打字员用这套方法一分钟打出136个汉字,速度居然超过了英文打字,这就是后来火遍全国的五笔输入法。
刚好1984年中国引进了11万台个人电脑,英文输入没问题,中文却成了“盲区”,五笔一出来就成了“及时雨”。
政府办公要写报告、报社排版要输新闻、企业文书要记台账,全靠五笔处理中文。
那时候各地都办起了五笔培训班,字根口诀“王旁青头兼五一,土士二干十寸雨”成了打字员的“必修课”,不少人练到不用看屏幕,手指一按就能精准出字,彻底解决了“汉字输不进电脑”的急事。
但光“输得快”还不够,得先让电脑“认得出”汉字才行。
这时候王选团队接下了更难的活,他们没盯着英文编码死磕,反而想:既然电脑不认识汉字,那我们就给每个汉字“做张图像身份证”。
团队里的人用剪刀裁黑纸,把“人”“木”“口”这些部首拆出来,再拼出完整的汉字,拍成底片后输入电脑,一个字一个字地整理字模,硬是建起了汉字的“数字图库”。
1979年7月27日,第一张用激光照排输出的《汉字信息处理》样张印了出来,纸上的“汉字”清晰工整,这是全世界第一次让汉字在电脑里完成“识别—排版—输出”的全流程。
到了1987年,《人民日报》全线用上这套系统,以前排字得用火熔铅、铸铅字,工人师傅三班倒还赶不上出报节奏。
现在效率直接提了20倍,印刷事故少了90%,而且这套系统从硬件到软件全是国产的,没花一分钱买国外技术。
解决了“能不能用”,还得解决“好不好用”,周有光先生早年设计的汉语拼音方案,这时候派上了大用场。
用罗马字母给汉字标发音,既能帮人学汉字,又能让汉字跟26键键盘对上。
早期的智能ABC输入法虽然词库少,打个“苹果”得翻两页候选字,但也算让普通人不用背字根就能输汉字。
后来搜狗、百度这些输入法加了大数据,能根据上下文联想词语,甚至能补全整句话。
比如打“今天天气”,后面会自动跳出“真好”,输入汉字终于从“专业技能”变成了谁都会的日常操作。
国家还专门定了硬标准,GB18030-2022版收录了87887个汉字,比以前多了1.7万个生僻字。
政务系统、银行APP都得强制支持,不少因为名字里有这些生僻字,办不了身份证、开不了银行卡的人,终于不用再改名字了。
2025年初,教育部、国家语委还有中央网信办又发了文件,说要在2027年建成国家语言文字大数据中心。
把中文从简单的“写字工具”变成能存、能查、能分析的“数字资产”,汉字数字化的路这下彻底宽了。
现在再看,汉字早就不是当年那个“被数字世界排斥”的角色了,反而在技术加持下活出了新模样。
在国际上,汉字的分量越来越重,全球中文学习平台覆盖了190个国家,1600多万人在上面学中文。
中国空间站里全是中文按键,外国宇航员想上去工作,还得先学汉字,不然连操作界面都看不懂。
以前是我们跟着别人的字母标准走,现在GB18030的成果通过输入法、数据库传到国外,不少国家做中文相关的业务,都得参考我们的标准,汉字慢慢成了数字世界里的“通用语言”之一。
回头看这段横跨半个世纪的突围路,其实成功的密码一点都不复杂。
首先得有技术自立的劲儿,王永民不跟着别人搞拼音化,非要从汉字结构里找办法。
王选团队不盯着英文编码死磕,而是自己给汉字“画身份证”,都是不随大流、自己闯出路的例子。
要是当时跟着别人的标准走,可能就没有今天的中文输入法了。
然后是文化坚守,不管西方怎么说“汉字要被淘汰”,不管有人怎么喊“换成拼音更方便”,我们没放弃汉字背后的文化。
毕竟“道”“仁”这些字里的深意,诗词里的对仗、谐音,用字母根本没法完全表达,守住汉字,就是守住了中华文明的根。
最后还得靠协作,高校研究基础理论,语委制定标准,工程师把技术落地成能用的产品,少了哪一环都不行。
就像五笔输入法能普及,不光是王永民一个人的功劳,还有各地的培训班、企业的推广,大家一起把技术变成了能服务所有人的工具。
当年西方说“中文活不过互联网时代”,可现在呢?我们不光让汉字进了电脑,还让它在数字世界里活得越来越精彩。
这不是简单的技术胜利,更是一个古老文明的底气,真正的经典,从不会被时代淘汰,只会跟着时代一起成长。
而那些为汉字突围的人,那些在实验室里熬夜拼字模、在书桌前写满12万张卡片的人,他们的故事,也该被更多人记住。
来源:行走在云端的聪聪