《现代汉语词典》试印本对领头字词的几种处理方式——语文词典编纂技术问题琐议

2013-04-02 03:38
辞书研究 2013年4期
关键词:星号词目印本

周 荐

一般认为,词典编纂技术会随着时代的发展日臻成熟。但是这种渐趋成熟的过程并非自然而然的,也不是一蹴而就的,社会的要求和需求、词典编者对词典编纂技术的艰难探索和刻苦钻研是词典编纂技术进步的原动力。一部词典,出版数十年,修订若干次,对照新版本与初版本,新版本往往较之初版本不仅词量大增,而且面貌丕变。这前后两者的不同所反映出的正是编纂方法的差异,而各位词典人在各自所处时代编纂理念的区别,亦可看出他们不同编辑思想的发展轨迹。商务印书馆的《现代汉语词典》(以下简称《现汉》)从1960年出版“试印本”到2012年出版第6版,前后历时50余载,词典编者换了几代,编纂理念自然也与时俱进地发生了不小的变化。其实,《现汉》编纂技术上的这种进步,在“试印本”出版仅仅5年后,于1965年出版的“试用本”中即表现得非常明显。在对待领头字词的处理方式上,“试用本”比之先其5年出版的“试印本”有较大的不同,“试用本”与其后出版的各个版本相比则没有根本的区别。对此进行深入的研究,可使我们对《现汉》人编辑理念的进步和《现汉》编纂技术的更新略窥一豹。

一、外来成分的标记问题

《现汉》各个版本都收录了为数可观的外来词语,其中有很多是全外来词,也有不少是半外来词。“试印本”在收立外来词的方式上与其他版本有所不同,那就是在所收外来词词目的首字上加标星号,以表明其舶来的身份,例如“欧*姆、坦*克、海*洛因、派*力司”。对此做法,“试印本”凡例之三“条目”中有如下解题的话:“……加星号(*)的,表示这个字是表音字(全条是译音词)。”“全条是译音词”这一表述是否意味着整个词是全外来词?不得而知。其实,不仅是全外来词的首字上在“试印本”中被加标上了星号,半外来词的首字上也被加标上了星号,如“纳*西族、塔*斯社、斯*拉夫人、欧*罗巴人种”。再进一步看,一些谐译词,只要词首所用汉字是弃义字,就也被加标上了星号,如“敖*包”[1]。加标这样一种符号,对于词典使用者辨识该词的全部或部分语音形式是舶来的而非本土的,无疑是很有助益的。

但是,“试印本”并未为其所收的全部外来成分加标星号。有些外来成分加标星号,有些外来成分却又不标星号,标准并不一致。

首先,单音节词的外来成分一般都不加标星号,例如“吨、氨、米2、瓦2”。但是,以“吨、氨、米2、瓦2”等为结构成分构成的多音节的半外来词,有的不加标星号,例如“吨公里、吨海里、吨位”、“氨基、氨气、氨水、氨基酸”、“米波、米突、米制”,有的却又加标星号,例如“瓦*特小时计”。可见标准并不统一。其次,一些多音节的外来成分做字条出现时,也未加标星号,例如“葡萄”。“葡萄”不但作为字头出现时不加星号,作为词干出现在其他词中,同样也不加标星号,如“葡萄干、葡萄灰、葡萄酒、葡萄球菌、葡萄胎、葡萄糖、葡萄紫”[2]。是否因为汉语古代从西域诸语言引进的外来成分和近现代由中国少数民族语言引进的外来成分早已汉化,就都不再加标星号呢?似乎也不尽然,字条“菩萨、氆氇、骆驼、袈裟”等未加标星号,而字条“南*无、噶*伦、可*汗、哈*达”却又加标星号,标准似乎也不一致。不过,比较而言,古代进入汉语的西域语言成分远不如近现代从西方进入汉语的成分更容易被“试印本”视为舶来成分,很有意思的一个例子是字条“塔”。其释义部分说明它译自梵语,其下引出的词条是“塔夫绸、塔虎脱—哈特莱法案、塔灰、塔吉克族、塔轮、塔斯社、塔塔尔族”七个,其中“塔*夫绸、塔*虎脱—哈特莱法案、塔*吉克族、塔*斯社、塔*塔尔族”五个词目的领头字“塔”都被加标星号,那是因为它们都译自西语,而“塔灰、塔轮”两个词目的领头字却未加标星号。“塔灰”的领头字“塔”是否舶来品不敢遽断,“塔轮”的领头字“塔”就是字头“塔”,来自梵语,应无疑义,但是“塔轮”的“塔”也未加标星号。当然,这并不意味着近现代从西方语言借入汉语的外来成分都被加标了星号,例如“咖*喱”加标了星号,“哔叽”就未加标星号。“哔叽”等外来成分,用以表示其外来身份的方法不是加标星号,而是“试用本”开始后的各版本中广为使用的在释义末尾以“[]”注明该外来成分之源的方法。这样不同的做法同现于“试印本”中,其理由为何,“试印本”也未予说明。其三,同类型的词目,有的加标星号,如“怒*族、瑶*族、崩*龙族、鄂*伦春族”,有的却又不加标星号,如“羌族、傣族、侗族、仡佬族”,[3]原因何在,也不得而知。第四,一些字条加标星号,但是以该字条做构件的词目有的却不再加标星号。例如:字条“啤*酒”加标星号,其所引出的词目“啤酒花”却又不加标星号;字条“咖*啡”加标星号,其所引出的词目“咖啡碱”却又不加标星号。出现上述这些情况的原因是什么,“试印本”也未予解释。

星号,无一例外地都加标在一个外来成分领头字的右肩上。这又引发了如下一些问题:第一,如果这个外来成分是个双音节的半外来词,领头字是译自外语的成分,后一字是汉语本有的,那么这个星号加标在领头字的右肩上是可以的,不会使人产生疑惑,例如“卡*片”;但是汉语中为数众多的外来成分是双音节的全外来词或超过双音节的半外来词、全外来词,此时星号加标在领头字的右肩,就易使人误以为外来成分仅仅是那个领头字,或者不大容易弄清楚那个外来成分是由几个字构成的,如“苏*打、瓦*特、乔*其纱、尼*格罗人种、匹*拉米洞、普*鲁卡因”。第二,如果一个半外来词的前半部分为本土成分,后半部分为外来成分,如“打的、南欧、西德、东南欧”,又该如何加标星号呢?从“试印本”的情况看,它所采取的是不加标星号的办法。同是外来成分,词首为外来成分的加标星号,词末为外来成分则不加标星号,标准不一,厚此薄彼,令人费解。第三,汉字文化圈中的其他一些国家创造的汉字,本也应视为不折不扣的舶来品,但是“试印本”却都未如“苏*打、瓦*特”等外来成分那样处理。如“腺体”的“腺”,是日本人造的日本“国字”,后来被借进汉语,理所当然是外来字,但是“试印本”中未加标星号。第四,汉字文化圈中的其他一些国家用汉字所造的汉字词,被引进汉语也应算作汉语外来成分,但“试印本”也不加标星号,例如来自日语的“干部、俱乐部”。

据我们分析,“试印本”中一些外来成分的领头字之所以加标星号,是为了与出现于其他词语中的一些领头的同形字区别开来。如果不加标星号且不会与其他同形字混淆而引起误解时,则不加标星号,反之,则加标。这一推测,似乎能够为多数情况所验证,但却无法说明下面例外的情形,如:字条“卡(kǎ)”所引出的“卡*巴胂、卡*宾枪、卡*车、卡*尺、卡*介苗、卡*路里、卡*片、卡*普隆、卡*其、卡*钳、卡*他、卡*特尔、卡*通”等13个词目,每个词目的首字都是外来成分,也并不存在与他字同形易混的问题,但是这13个词的首字的右肩上都被加标上了星号!

为外来成分加标星号的这一做法,商务印书馆1937年出版的《国语辞典》没有,1965年出版的《现汉》“试用本”中即被取消了,取消的理由,“试用本”也未予说明。我们以为,《现汉》“试印本”为外来成分加标星号,虽难称完善,但其思路还是有可取之处的。倘将外来成分涂以另外的颜色,以与本族语成分区别开来,这一做法还是可以考虑保留的,比照“试用本”以及之后的各版本在释义末尾以“[]”表示外来成分之源的方法,它是有着节省篇幅的所长的。

二、见于词首的同形字的标记问题

以同形字构成不同的词,此词与彼词,词内的字(语素)形同实异。为区别之,《现汉》“试印本”凡例之三“条目”中有这样的话:“如领头字是分成几条的,后面的合成词、词组、成语仍按拼音次序统一排列,以便检查,但在各条的第一个字右肩加标数码,表示属于哪个语汇组;不标的属于第一组。标2的属于第二组,标3的属于第三组,其余类推。标0(零)的表示这一条的第一字跟领头字各条都没有意义上的联系(或从现代语上看不出来)。”例如“试印本”收了“帮”,分作“帮1”“帮2”“帮3”三个字条。下辖的词语,比如“帮子”被标作“帮2子”,表示这个词里的“帮”是字头“帮2”,“帮派”被标作“帮3派”,表示这个词里的“帮”是字头“帮3”,而“帮腔”的“帮”未做任何标注,表示这个词里的“帮”是字头“帮1”;“奥援”被标作“奥0援”,表示这里的“奥”的意义跟字头“奥”的意义没有联系,或者“从现代语上看不出来”。

但是做这样的标记,“试印本”在处理的标准上并不十分一致,也存在一些问题。例如词目“俳句”被标为“俳0句”,表示“俳句”的“俳”与字条“俳”没有意义上的联系或“从现代语上看不出来”,但是字条“俳”未做任何释义,只出“见下条”三字。词目“俳优”未加标任何符号,按照“试印本”凡例中的说法,属于“第一组”,但是“见下条”三字并未为字条分出组别来,这又该如何理解?给词目首字的同形字加标这样的标记,确有让人难以把握的一面,同时也未能彻底解决全部的问题。就以“帮”字为例,它被分作三个同形字,但每一个同形字又都是有着多个义项的多义字:“帮1”有两个义项,“帮2”也有两个义项,“帮3”更有三个义项。以在词首字的右肩加标数码的办法并不能解决多义字头的义项问题。此外,还有一个难以解决的矛盾,那就是领头字与多项标注如何处理的问题。如上文列出的“苗族”例,它在“试印本”中之所以被标记成“苗0族”,或许是因为“试印本”的编者认为这里的“苗”与字头“苗”没有意义上的联系或者“从现代语上看不出来”。然而,“苗族”也是一个半外来词,按理应该与“怒*族”一样被标记成“苗*族”的,却标记成了“苗0族”。之所以如此,是“试印本”的编者不明了“苗族”的“苗”为非汉语的成分?我们宁可相信“试印本”的编者只是因为领头字的右肩只能加标一个符号,不得不在“0”“*”之中选择其一加标罢了。我们这样的推断是有理由的,因为一个字要标注的话,可以或需要加上多项标注的字,绝非少数。

这一为不同词中的同形字加注标记的做法,到“试用本”被取消了,其理由词典也未予说明。

当然,“试印本”对领头字字形的这一处理方法,对我们也有启发,那就是如何处理同音的繁简体字的问题。例如今天的“后”,一简化自表示前后的“後”,一径来自后妃的“后”。但是现代词典用“后”构词时,无法使读者知晓“后妃、后宫”的“后”就是简化前的“后”,而“后辈、后尘、后盾、后汉”等的“后”却是简化前的“後”。明晓此点,可能会有助于读者加强对词义的理解,也有助于分辨简化汉字工作完成后出现的一些词所用的字究系哪一个(例如“游走”究竟是“游走”还是“遊走”)。如果我们将“试印本”对同形字做标记的方法吸收过来,对繁简体字进行标记,可能会有利于进一步完善词典的功能,大有益于读者。类似的例子不少,如“丑陋”的“丑”(简化前作“醜”)与“丑角”“丑时”的“丑”,“注释”的“注”(简化前作“註”)与“注意”的“注”,“面粉”的“面”(简化前作“#”)与“面容”的“面”,“范围”的“范”(简化前作“範”)与“范蠡”的“范”,如果我们为以简化字构成的词的首字做出标记,比如将“丑陋”标记做“丑1陋”,“丑角”标记做“丑2角”,“丑时”标记做“丑3时”,“注释”和“注意”,“面粉”和“面容”,“范围”和“范蠡”等也做出类似的标记,对读者正确理解词义、正确使用汉字或许会很有助益。

三、字头、词目是否均置“【】”内的问题

对字头、词目,《现汉》“试印本”有其独特的处理方式,与之前的《国语辞典》、之后的《现汉》“试用本”以及其他版本是不同的。《国语辞典》的处理方式是:字头不置于【】内,词目才置于【】内。自《现汉》“试用本”开始的各版本对字头、词目的处理方式与《国语辞典》一致。也就是说,独独《现汉》“试印本”标新立异,无论是字头还是词目均置于【】内,区别仅仅在于作为字头的【】和作为词目的【】,所用字号不同,字头的字号大,词目的字号小。全部的条目均置于【】内,确可使条目醒目,也不致使条目与非条目混淆。但是,从条目的角度看,字头独出,而且是以大号字列出,紧随其后的往往不是汉字(其后如果有标示异体字的汉字,也是置于圆括号内),而是汉语拼音或注音字母,因此字头与其他汉字混淆的可能性很小。容易招致混淆的是由若干汉字组成的单位——词目,而不是一般以单字独出的单位——字头。字头既然不会与其他文字形式混淆,再将其置于【】内,不但不会达至醒目的目的,反而会造成混淆,让人分辨不清字头和词目。

将字头与词目统统置于【】内,可能会造成字头、词目混淆难辨的情况。这并非危言耸听,在“试印本”里,并非仅仅是字被置于大字号的【】内成为字头,一些词也被置于大字号的【】内。或者说,被置于大字号的【】内的多数是字,但也有一些是词。“试印本”中一些单纯词的多音节成分,也被拿来用作“字头”,例如“咿呀、璎珞、喁喁、伛偻”。除此而外,一些非单纯词的多音节成分,也被拿来用作“字头”,例如“爸爸、摆子、萨满教、萨噶达娃节”也被置于大字号的【】内成为字头,只要其下不再有以其为词根构成的词的情况存在。这种事实上的字头、词目混淆的做法,就造成了更为奇怪的现象:“悖”是作为字头列出的,其下还有一个“悖晦”,也是作为字头列出的,但字头“悖晦”领起的词目却是“悖谬、悖入、悖出”;“漠”是字头,引出词目“漠然、漠视”,但是“漠漠”却又作字头列出;“荏”是字头,“荏苒”仍是字头;“依”是字头,“依稀”也是字头;“犹”是字头,“犹豫”也是字头;“蚩”作字头,“蚩蚩蝇”也作字头。

让整个多音单纯词充当字头,这在“试印本”里不在少数。“试印本”凡例三“条目”4中有如下的话:“多音单词也可以作领头字,如【蝴蝶】领‘蝴蝶花’、‘蝴蝶结’。用多音单词第一字构成的条目,排在多音单词后,如【螳螂】领‘螳臂当车’。”“试印本”有的多音单纯词只是作为一个孤零零的字头存在,并不领起任何词目,如“缱绻、蜣螂、蔷薇、憔悴、骎骎、蜻蛉、蜻蜓、犰狳、氍毹、魍魉”。这有一定道理,因为既然上列词都仅仅是一个孤零零的存在,再在它们之上为其设立一个字头,殊无必要。需要考虑的只是,“缱绻”等是作为字头出现合适还是作为词目出现合适。“试印本”中一些单音节字头领起词目是可以理解的,例如字头“笤”,只领起词目“笤帚”,字头“菟”只领起词目“菟丝子”,字头“蕹”只领起词目“蕹菜”,字头“齆”只领起词目“齆鼻”。“试印本”一些多音节“字头”领起词目也不难理解,例如字头“珊瑚”领起词目“珊瑚虫、珊瑚岛、珊瑚礁”。但是“试印本”对另外一些字头、词目的处理方式却令人难以理解,例如字头“射”领起词目“射程、射电天文学、射电望远镜、射击、射猎、射门、射手、射线、射影”,但又独立一个字头“射干”于“射程”诸词目之外;字头“堂”领起词目“堂房、堂倌、堂会、堂客、堂上、堂屋”,但又在“堂房”诸词目之外独立出“堂皇、堂堂”两个字头;“区”立为字头,领起“区别、区分、区划、区域、区域规划”诸词目,但“区区”又立为字头,不领起任何词目;“跷”立为字头,领起“跷工、跷跷板”诸词目,“跷蹊”又被立为字头,却无被领起的词目;“切”立为字头,领起“切齿、切当、切肤之痛、切合”等11个词目,“切末”又被立为字头,却无被领起的词目;“菠”立为字头,领起词目“菠菜”,紧随其后“菠萝”又被立为字头,领起词目“菠萝蜜”。更令人费解的是,“试印本”为“菩萨”立字头,但“菩萨”所领起的词目却是“菩提树”。

我们上文中的“可以理解”“难以理解”,是因受《现汉》“试用本”之后各版本影响而形成的习惯性认知所得出的结论。“可以理解”,并非一定合理;“难以理解”,未必就不合理。以字头“笤、菟、蕹、齆”为例,它们各只领起一个词目“笤帚、菟丝子、蕹菜、齆鼻”,这种字头、词目的分立究竟有多大意义和价值,实在值得研究,它们或可像“缱绻、蜣螂、蔷薇、憔悴”一样干脆直接立为字头,不需将词目的首字提取出来另立一个单字字头了。联绵词旧称联绵字,这表明在古人心目中,它们因连缀成义而不能分释,与单字无异。既如此,“缱绻、蜣螂、蔷薇、憔悴”等立为字头,并无任何不妥。明乎此,“射干”于“射程”诸词目之外另立为字头,“跷蹊”在字头“跷”领起“跷工、跷跷板”诸词目之后又被立为字头,就不足为怪了。

以上我们谈到的对字头、词目的处理方式,仅见于《现汉》“试印本”。“试印本”之前的《国语辞典》没有此种处理方式,表明“试印本”独辟蹊径的探索精神;“试印本”之后的各个版本以及其他辞书无此种处理方式,表明《现汉》勤于反省、勇于纠错的精神。然而,我们不能仅简单地做出上述认识后即止,而应将思考引向深入:为何《现汉》“试印本”会有那些独特的思考和尝试?那些独特的处理方式是不是一无可取?有无可借鉴之处?《现汉》是个系列性产品,其生命已存在、绵延了半个多世纪,1960年的“试印本”正是整个《现汉》的基础,1965年“试用本”之后的诸个版本,又无一不是充分汲取了“试印本”的养分,在其基础上发展起来的。因此,毫不夸张地说,《现汉》“试印本”对字条、词目独特的处理方式,不仅对《现汉》未来进一步的修订有着重大的参考价值,对于我们今天各类语文辞书的编纂也具有较大的借鉴意义。认真对待前人留给我们的宝贵的文化遗产,去芜存菁,发扬光大,这对我们词典编纂技术的大踏步前进,对我们早日实现词典强国梦,可能会很有裨益。

附 注

[1]谐译词被加标星号的问题比较复杂,如是双字格的谐译词,没有前字表音后字表意区别的,就不加标星号,例如“引得”的领头字“引”“绷带”的领头字“绷”的右肩均未加标星号,而超过双字格的谐译词,有的也不加标星号,例如“爱美的”,有的却又加标星号,例如“盖*世太保”。

[2]但是“葡萄胎”一词,却标为“葡萄*胎”,而“葡萄干、葡萄灰、葡萄酒、葡萄球菌、葡萄糖、葡萄紫”却又未如此标示,理由为何,不得而知。

[3]更耐人寻味的是“苗族”的“苗”的右肩上加标的是0,成为“苗0族”,这样一来以“族名+族”构成的同类型的词就有了三种不同的标注方式。

1.黄建华.词典论(修订版).上海:上海辞书出版社,2001.

2.李尔钢.现代辞典学.上海:汉语大词典出版社,2002.

3.雍和明,罗振跃,张相明.中国辞典史论.北京:中华书局,2006.

4.张志毅,张庆云.词汇语义学与词典编纂.北京:外语教学与研究出版社,2007.

5.章宜华,雍和明.当代词典学.北京:商务印书馆,2007.

6.周 荐.汉语词汇趣说.广州:暨南大学出版社,2011.

7.周 荐.榫接与断裂——汉语字词典字条义项与词条义项关系略析.语文研究,2010(4).

8.周 荐.汉语字词典字条义项的词性标注问题.吉林大学学报,2011(2).

9.周 荐.《新编国语日报辞典》平议.语言教学与研究,2011(6).

猜你喜欢
星号词目印本
2022年国际预印本学术及社会影响力研究
《六十种曲》初印本考述
藏语传统辞书词目编排法探析
国际学术出版机构预印本政策分析*
日语中“V1+V2型复合名词”的分类
——基于《广辞苑》从有无对应动词形角度
明活字印本《适情录》排印技术考
星号标注范例
星号标注范例
《汉语大词典》漏收宋代笔记词目补释
星号标注范例