摘要:《中国分类主题词表》Web版中国地名主题词存在收录缺失、更新滞后、名称多样、注释混乱、读音谬误、拼写失范等诸多缺憾。应完善收录范围,补充和更新地名主题词;建立统一名称标准,采用“专名+通名”全名模式;依据规范标准和权威工具书,规范读音与拼写;完善注释功能,增强
江西地名研究
关注
摘要:《中国分类主题词表》Web版中国地名主题词存在收录缺失、更新滞后、名称多样、注释混乱、读音谬误、拼写失范等诸多缺憾。应完善收录范围,补充和更新地名主题词;建立统一名称标准,采用“专名+通名”全名模式;依据规范标准和权威工具书,规范读音与拼写;完善注释功能,增强其及时性、完整性、权威性;提升款目质量,系统性纠正和规范款目,以提升其准确性、实用性和辨识度,高质量满足使用者的多元化需求。
关键词:中国分类主题词表;Web版;中国地名主题词;款目;规范化
1 引言
《中国分类主题词表》Web版(即互联网服务版,以下通称“Web版”)于2010年3月通过国家图书馆验收,在国际互联网正式发布。2014年1月更新为Web版2.1版,至今已进行了6次更新,最后一次更新时间为2021年9月。作为一个通用的数字型检索语言交换平台,Web版的开发正是顺应网络环境的新需求,借鉴国内外的理论成果和实践经验,在《中国分类主题词表》电子版先期成果和研制实践的基础上,为我国各类信息资源的组织、检索和利用提供了一个最大、最全面、可扩展更新的知识体系,在我国信息资源整合、重组、共享中发挥着不可替代的作用,并逐渐成为文献标引的主流工具。Web版提供10个检索途径,分别为全部途径、分类途径、主题途径、类号、类名、类目注释、主题词、主题词英译名、主题词拼音、主题词注释;4种匹配方式,即任意一致、完全一致、前方一致、后方一致,以供使用者可以全方位、多角度地检索Web版,彰显了其强大的实用功能。
我国的山、河、湖、海等各类自然地理实体名称和省、市、县等行政区划名称作为表示中国地名主题词(以下简称“地名词”)的专有名称,在Web版中有着广泛且大量的收录。然而,这些地名词在收录范围、名称、注释、读音、拼写等方面还存在着诸多瑕疵,亟待进一步优化和完善。遗憾的是,截至目前,在中国知网(CNKI)总库、维普中文科技期刊数据库、万方数据库中尚未发现关于Web版地名词研究的相关文献,更遑论专门性的学术著作。Web版作为重要的检索语言工具,其权威性很大程度上依赖于规范性和准确性。当前Web版地名词中存在的某些问题甚至可以用“硬伤累累”来形容,严重削弱了其整体质量、可信度与实用性。因此,开展Web版地名词的研究显得尤为必要且紧迫。其研究不仅能够填补相关领域的空白,还能为地名词的规范化建设和完善提供科学依据和技术支持,具有重要的学术价值和现实意义。
2 收录缺失与更新滞后
截至2021年9月,尽管《中国图书馆分类法》(以下简称“《中图法》”)编委会定期发布了14期有关《中国分类主题词表》(含Web版)的修订信息(其中涉及地名词修订的有11期),新增了滨海新区、雄安新区、两江新区、三沙、察雅县、岗巴县、革吉县、洛隆县、洛扎县、聂荣县、申扎县、双湖县、大足区、丰都县、青神县、盐亭县、五家渠、龙港(全国首个镇改市以及全国首个不设乡镇、街道的县级行政区域)、成都平原、黄岩岛等地名词,但增改力度明显不够,地名词缺漏和更新不及时的问题依然相当突出,亟待系统性解决。
2.1 收录缺失
位于长江中下游的中国五大淡水湖之一、安徽省境内的最大湖泊巢湖,中国道教圣地、号称“西来第一名山”的崆峒山,中华十大名山之一、中国东部最高峰的玉山,台湾地区最长的河流浊水溪,台湾地区最大天然湖泊、“八景”之最的日月潭,湖南省的第二大河流沅江,珠江流域第二大水系、广东最重要河流之一的北江等都未收录。
笔者通过查询反映县级以上行政区划变更情况更新最为及时,资料汇集最为丰富、翔实的区划地名网得知,湖北省1995年12月23日新增设的团风县,新疆维吾尔自治区2002年9月17日新增设的县级图木舒克市、2011年12月20日新增设的县级北屯市、2012年12月17日新增设的县级阿拉山口市和铁门关市、2014年6月26日新增设的县级霍尔果斯市、2015年3月16日新增设的县级可克达拉市、2016年1月7日新增设的县级昆玉市、2019年11月6日新增设的县级胡杨河市、2021年1月12日新增设的县级新星市,江西省2010年9月10日新增设的县级共青城市等,都未被Web版收录。进一步通过最权威的全国行政区划信息查询平台得知,深圳市(9个区)除宝安区外,其余的福田区、罗湖区、南山区、盐田区、龙岗区、龙华区、坪山区、光明区8个区;厦门市(7个区)除同安区外,鼓浪屿区、思明区、开元区、杏林区、湖里区、集美区6个区;南京市(11个区)的玄武区、秦淮区、建邺区、鼓楼区、浦口区、栖霞区、雨花台区7个区;武汉市(13个区)的江岸区、江汉区、汉阳区、青山区、洪山区、东西湖区、汉南区7个区;广州市(11个区)的黄埔区、海珠区两个区等大量市辖区,更是被Web版排除在外。
2.2 更新滞后
改革开放以来,我国省级以下行政区划变化之大前所未有。呈现的主要模式包括建制变更、行政区划的合并与拆分、新设立行政区、行政隶属关系变更、行政区更名等。对县级以上最新行政区划变更情况的更新不够与时俱进、反映不够充分完备,是地名词款目存在的一个十分明显而突出的问题。
2010年6月28日,北京市撤销了东城区、崇文区,设立新的北京市东城区,以原东城区、崇文区的行政区域为东城区的行政区域,撤销了北京市西城区、宣武区,设立新的北京市西城区,以原西城区、宣武区的行政区域为西城区的行政区域。但东城区与崇文区、西城区与宣武区款目却难以寻觅变更情况的相关信息,也缺少彼此之间的关联指向信息,反映既不够完整到位,也难以充分发挥其应有的功能。2015年10月13日,上海市撤销闸北区、静安区,设立新的上海市静安区,以原闸北区、静安区的行政区域为新的静安区的行政区域。2020年6月5日,山东省撤销蓬莱市、长岛县,设立烟台市蓬莱区,以原蓬莱市、长岛县的行政区域为新的蓬莱区的行政区域等,众多类似情况处理方式亦如此。
同为2015年7月23日撤县设区,天津市的宁河县由宁河县改为了宁河,而另一个同样位于天津市的静海县却未同步更改为静海区,仍旧使用静海县的名称。处理方式既不规范,也不统一。类似行政区划早已更改,但依旧还在使用旧名称的问题可谓比比皆是。如2014年,西藏自治区撤销昌都地区,设立地级昌都市;广东省撤销县级从化市,设立广州市从化区和撤销县级增城市,设立广州市增城区;山东省撤销县级文登市,设立威海市文登区;陕西省撤销高陵县,设立西安市高陵区;福建省撤销永定县,设立龙岩市永定区;贵州省撤销平坝县,设立安顺市平坝区等。2015年,新疆维吾尔自治区撤销吐鲁番地区,设立地级吐鲁番市;云南省撤销腾冲县,设立县级腾冲市;四川省撤销康定县,设立县级康定市;河北省撤销徐水县,设立保定市徐水区等。2016年,新疆维吾尔自治区撤销哈密地区,设立地级哈密市;天津市撤销蓟县,设立蓟州区;重庆市撤销武隆县,设立武隆区;黑龙江省撤销抚远县,设立县级抚远市;云南省撤销泸水县,设立县级泸水市;四川省撤销郫县,设立成都市郫都区;河北省撤销崇礼县,设立张家口市崇礼区;安徽省撤销洪泽县,设立淮安市洪泽区;江西省撤销星子县,设立县级庐山市;陕西省撤销安塞县,设立延安市安塞区等。2017年,陕西省撤销神木县,设立县级神木市;河北省撤销平泉县,设立县级平泉市;福建省撤销县级长乐市,设立福州市长乐区等。以上只是其中的一部分,但更新不及时可见一斑。
3 名称多样与注释混乱
地名词名称和注释普遍存在的问题主要体现在缺乏系统性的综合考量,导致名称和注释的不统一和不规范,进而引发地名词名称和注释的随意性和混乱性。此外,变更信息的更新不及时也是一个显著问题,这不仅使得地名词名称陈旧,也导致注释内容的不完整和不全面,从而影响了其应有的功能和实用价值的发挥。
3.1 处理随意
同为2002年9月17日设立的新疆维吾尔自治区直辖县级市图木舒克市未被收录,五家渠市缺乏注释,而阿拉尔市虽有注释,但“阿拉尔是新疆维吾尔自治区直辖县级市”的注释内容过于简略。建议增补图木舒克市款目。阿拉尔(建议采用阿拉尔市名称)注释修订为:2002年9月17日,设立县级阿拉尔市,由新疆维吾尔自治区直辖。五家渠(建议采用五家渠市名称)增补注释:2002年9月17日,设立县级五家渠市,由新疆维吾尔自治区直辖。以确保信息的完整性和准确性。
同为近年来的直辖市撤县设区,北京市通州区、延庆区、密云区缺乏注释,而昌平区、大兴区、顺义区、怀柔区、平谷区等则增加了变更情况注释。由县改为区后,天津市的宁河、重庆市的璧山、铜梁等名称都只使用了专名,与直辖市其他各区撤县设区后都使用最新更改名称全称(专名+通名区)有所差别,不够统一和专指。建议通州区、延庆区、密云区等增补变更情况注释,地名词名称则统一使用变更后的全称,如宁河区、璧山区、铜梁区这种规范称谓模式。
同为近年来撤县设市(县级)后又撤市(县级)设区的河北省唐山市丰南区、浙江省杭州市余杭区和萧山区、广东省广州市番禺区和花都区、广东省佛山市顺德区和南海区等都使用了最新更名全称(专名+通名区),并用其最新名称,统一代替原县名和原县级市名称,而河北省石家庄市藁城区、江苏省苏州市吴江区、浙江省杭州市临安区和杭州市富阳区等都只使用了专名,没有行政区划的类型通称,并用专名统一代替原县名、原县级市和最新区名,两者在名称确定上存在明显差异。其他撤地设市(地级)、撤县设市(县级)、撤县设区类型也如出一辙。上述行政区更名后,普遍增加了变更情况的注释,但详简不一、用语多样。即使同一地名注释中,也存在着尺度把握的差别。丰南区、富阳区的注释还缺少撤县设市(县级)信息,需要进一步加以增补、改进和完善。
3.2 专指性不够
巢湖注释为“1999年7月9日撤销巢湖地区和县级巢湖市,分别设立地级巢湖市和居巢区。”并用巢湖统一代替不同地理位置和范围的巢湖地区、巢湖市、居巢区,实则不妥。因为这里用与中国五大淡水湖之一同名的巢湖作为行政区划名称,专指度不够,容易混淆。虽然Web版没有收录专指湖泊的巢湖,但巢湖理应为湖泊的专属名称,具有唯一性和排他性。此处巢湖采用更为规范的“专名+行政区划(市)的通名”,冠以巢湖市的名称,彼此加以区别,实则更为妥当。同样,为了更加一目了然地将黄河上游峡谷青铜峡与地级青铜峡市、黄河中游峡谷三门峡与地级三门峡市、海河流域大清河南支水系潴龙河支流沙河与县级沙河市、松花江一级支流蛟河与县级蛟河市明显区别开来,宜统一更改为规范的青铜峡市、三门峡市、沙河市、蛟河市作为行政区划名称,以区分不同的地理位置和范围。
3.3 注释失当
注释的完整性和全面性不仅是考量和评价地名词款目编制水平的重要标准,也是为使用者提供知识点的有效手段。然而,目前地名词注释中仍存在诸多不完善之处,缺乏必要的变更时间和行政区划类型信息。较有代表性的问题包括宝坻区注释仅为“原宝坻县。”过于简略,没有注明变更时间。建议宝坻区注释可进一步细化为:2001年3月22日,撤销宝坻县,设立宝坻区。崂山区注释“1988年撤销,设立青岛市崂山区。”撤销谁?哪种行政区划类型?指代不明。实际上,崂山区注释可进一步完善为:1988年 11月17日,撤销崂山县,设立青岛市崂山区。金华县注释“2000年撤销,并入金华。”并入金华的金华是哪个行政区划层级和类型?原金华县撤销后,又是以哪种行政区划类型存在?都无从知晓。由此,金华县较为完整、规范的注释可进一步完善为:2000年12月30日,撤销金华县,设立金华市金东区。霸州注释“1990年2月撤县建市。”撤销的县如何称谓?建立的市又是哪个行政区划层级?令人困惑不解。霸州(建议采用霸州市)较为明晰、完整的注释可进一步完善为:1990年1月4日(国务院批准时间),撤销霸县,设立县级霸州市。
4 读音谬误与拼写失范
中国地名众多,每个地名都有其独特的读音和含义,承载着丰富的历史文化和语言特色。然而,由于地域方言的多样性和历史的演变,一些地名的读音有时会与该字的常用读音不同,常常被误读。这种现象在Web版地名拼音标注和拼写中也时有体现,导致了一些地名专名的汉语拼音误拼、读音误读以及相应的英译名专名拼写误拼问题。为确保地名词拼音标注和读音的准确性,Web版必须严格遵循国家制定的汉语语言文字规范标准。《汉语拼音方案》是汉字注音和拼写汉语的国家标准及国际标准,是汉语读音拼写的总规则;《汉语拼音正词法基本规则》是在《汉语拼音方案》确定的音节拼写规则基础上进一步规定的词的拼写规则;《中国地名汉语拼音字母拼写规则(汉语地名部分)》是地名拼写的详细规则,为汉语地名的准确拼写提供了细致的指导。这些规范标准在规范地名读音和拼写方面具有不可替代的重要性,是确保地名一致性和准确性的基石。严格遵循上述规范标准编纂而成的权威辞书,在规范地名读音和拼写方面同样具有毋庸置疑的依据和典范作用,而且更为直观、翔实、具体。例如印行六亿多册、全世界发行量最大的工具书《新华字典》,严格遵循上述规则标准,成为汉字读音标注的典范,为使用者提供了准确可靠的读音依据,是我国最具影响力的现代汉语字典。《辞海》是我国最具代表性的集字典、语文词典和百科词典主要功能于一体的大型综合性辞典。2022年9月《辞海》网络版重磅推出,成为我国第一部走向互联网的大型综合性辞书。《辞海》网络版以《辞海》(第七版)纸质版的内容为基础,为所有词目(近十三万条)增加了拼音标注和读音(由中央广播电视总台著名主播海霞领衔的团队朗读),方便使用者了解字词准确读音,具有极高的权威性、可靠性和实用性。
4.1 读音谬误
对照“容易读错的地名”“部分地名读音规范”“中华人民共和国县级及以上行政区划地名索引(二)”所列地名读音,Web版地名词中吴堡县中的“堡”字、珲春中的“珲”字、六安和六合中的“六”字、繁峙县中的“峙”字、洪洞县中的“洞”字、乐陵中的“乐”字、涡阳县中的“涡”字等,拼音标注未考虑到其用作地名时的读音和正常读音存在差异,均按照正常读音注音,既不符合这些地名的正确读音,也引发了英译名专名的拼写错误,进而造成了按正确拼音无法检索到相关地名的困境。例如,使用“hongtong”检索洪洞县、使用“fanshi”检索繁峙等地名时,即使采用“全部途径+任意一致”这种最宽泛的途径方式,也无法找到对应结果,严重影响了其应有功能的有效充分发挥。针对这一现象,对地名词中错读、错拼的部分进行订正和规范显得尤为必要,参见表1。
表1显示,地名读音的特殊性在于其包含的古读、生僻音、异读以及方言音较多,这增加了准确标注的难度。特别是当地名中含有多音字时,更应坚持“名从主人”的原则,即依据地名所在地的读音习惯来确定,这一点也可以通过当地政府官方网站网址的拼写得以证实。此外,部分地名读音与不用作地名时的读音有别,且不同地方习惯读法也不尽相同。例如“堡”字用于地名时,主要有bǎo、bǔ、pù3种读音;“乐”字用于地名时,主要也有lào、lè、yuè3种读音。因此,在整合地名读音规范时,应充分考虑地名的历史渊源、地域特色以及当地人的读音习惯,以确保地名标注的准确性和检索的有效性。
4.2 拼写失范
《汉语拼音方案》明确规定,ü与n、l相拼时,ü上的两点不能省略,因为u也可以与n、l相拼,省略两点后会导致混淆。而用v直接代替ü的做法容易引起误解和困惑,不符合汉语拼音的规范体系。计算机键盘虽无ü,但直接用v代替的做法不可取,这与《汉语拼音方案》“V只用来拼写外来语、少数民族语言和方言”的规定相悖。实际上,在计算机里可以找到字母ü,如用Word格式输入文字时,点击“插入”窗口,在特殊符号的拼音栏中即可找到字母ü,WPS也一样。因此,Web版地名词中凡涉及用nv、lv读音和拼写的,应一律按《汉语拼音方案》订正规范为nü(Nü)、lü(Lü)。同时,Web版中涉及nv、lv读音和拼写的其他主题词,也应照此一并改正,详见表2。
5 优化策略
出现上述诸多问题,其根本原因在于缺乏一套全面、系统的规划指导框架和科学、明晰的判定依据,直接导致了地名词收录范围、名称、注释、读音的确定和把握等方面缺乏统一遵循的规范,进而严重影响了地名词款目的整体质量。尤其值得关注的是,最近一次的更新已经过去了3年,定期更新变得难以保障,进一步加剧了地名词收录范围和注释内容完整性与时效性的不足。因此,立足于Web版地名词的当前编制现状,明确改进和完善的方向,使地名词整体质量在现有基础上得到显著提升显得尤为迫切和必要。这一有效优化举措,对其他专有名词的修订工作也具有重要的借鉴和示范价值。
5.1 完善地名词收录范围
对未被收录的我国重要山、河、湖、海等自然地理实体名称和县级以上行政区划名称予以全面补充、完善,确保Web版地名词收录的广泛性和代表性。定期对地名词信息进行动态的系统维护和实时更新,以便将国家行政区划主管部门公布的县级以上最新行政区划调整、变更信息及时纳入Web版中,使其更贴近使用者需求。
5.2 建立统一名称标准
为了避免地名词出现歧义和凌乱,应统一采用“专名+通名”的全名完整模式,即通常所说的“专名定位,通名定类”作为确定地名词名称的标准,以便清晰地表达地名词个体地理实体和通用地理实体类型,提高地名词的准确性和辨识度。特别是与境内山、水同名而设的市、县、区,无论Web版中是否收录了这些山、水名称,为了避免混淆和误解,都应加上市、县、区的通用地理实体类型。同时,地名词名称凡涉及专名变更和通名变更的,都应采用变更后的最新地名词全称模式,以维护地名词的规范性和统一性。
5.3 强化注释功能
对县级以上行政区划专名和通名有所调整和变更的地名词,应一律予以注释说明,并统一以国务院批复或批准日期为准。对新增设、被撤销或合并的地名词,也应在注释中予以注明,有内在关联的还应在C参项互为参见。同时,注重注释信息的及时性、完整性、权威性,格式、内容、用语要对应统一、精准概括、专业规范。变更信息能精确提供具体日期的,应详尽到年月日,以满足使用者了解完整知识点的需要。如丰南区,原注释“2002年2月1日,撤销县级丰南市,设立唐山市丰南区,以原县级丰南市的行政区域为丰南区的行政区域。”增改为:1994年4月5日,撤销丰南县,设立县级丰南市。2002年2月1日,撤销县级丰南市,设立唐山市丰南区。浦东新区,增注:1992年10月 11日,撤销川沙县,设立浦东新区,浦东新区的行政区域包括原川沙县,上海县的三林乡,黄浦区、南市区、杨浦区的浦东部分。2009年4月24日,撤销南汇区,并入浦东新区。增参项:C南汇区。川沙县,原注释“1993年撤销,设立浦东新区。”增改为:1992年10月11日,撤销川沙县,设立浦东新区,浦东新区的行政区域包括原川沙县,上海县的三林乡,黄浦区、南市区、杨浦区的浦东部分。南汇区,原注释“2001年1月9日撤销南汇县,设立南汇区。”增改为:2001年1月9日撤销南汇县,设立南汇区。2009年4月24日,撤销南汇区,并入浦东新区。增参项:C浦东新区。
5.4提升款目质量
对Web版地名词款目在分类、代项、属项、参项等方面存在的缺漏、错误、混乱、不对应等现象,应进行系统性地纠正和规范统一,消除著录中的不一致等瑕疵,以提升Web版地名词款目的整体质量,从而更好地满足使用者的多元化需求。
6 结语
地名词作为Web版中使用频次颇高、应用范围颇广的专有名词,其编制质量的优劣不仅直接关系到地名词应有功能的充分发挥,还影响到实际应用的效果以及使用者认可度。然而,这一至关重要的问题长期以来却并未得到相关方面的足够重视和关注。因此,加强地名词编制理论的研究,深化其实践应用的探讨,提升其标准化和规范化水平,确保地名词的完整性和时效性,以适应社会的发展,更好地满足信息资源组织、检索和利用的时代需求,已成为当前亟待解决的重要课题。
作者:钟 伟
选稿:宋柄燃
编辑:汪鸿琴
校对:王玉凤
审订:汪依婷
责编:杨 琪
来源:中国地名资讯