关于《近现代辞源》的编纂
黄河清
《近现代辞源》(黄河清编著,姚德怀审定,2010年6月上海辞书出版社出版, 以下简称《辞源》)的出版,受到了一些学者的关注,不少人给我们写信,有鼓励的,也有提出意见或建议的,对此我表示十分感谢!
那么,《近现代辞源》是怎样编成的,编纂过程中碰到过哪些困难,书中存在哪些问题,等等,下面我将详细地说一说,最后我还将介绍一下以后的计划。
1. 编纂方针 《辞源》不同于一般词典,具有一定的特殊性,因此其编纂方针也与别的词典不同。
1.1 明确收词对象 本人在香港中国语文学会的资助下,建有一个《近现代汉语语源数据库》(以下简称《语源库》),这项工作已做了18年,现在《语源库》收词已有76000多条,这些词大部分是明末清初到1949年以前汉语受外来文化影响而产生的词。
在2001年,我们从《语源库》里选了5000多个条目,编了一本《近现代汉语新词词源词典》(上海汉语大词典出版社出版,以下简称《词源词典》)。后来我又从《语源库》里选出9500多个条目,编了这本《辞源》。但《辞源》的收词范围与《词源词典》有所不同。《词源词典》收有两类词:一是现代词,即现在仍在使用的词;二是历史词,即现在不用但过去出现过的词。而《辞源》只收录现代词,历史词没有收录(只在相关词条里提及一下,不专门立条)。这是《辞源》与《词源词典》最大的区别。我们之所以做这样的选择,主要出于以下两方面的考虑:一、历史词数量庞大,一本中型词典难以容纳,《词源词典》虽然收了这方面的词,但其实也是挂一漏万;二、现代词与历史词相比,现代词更重要。在现代词尚未完全研究清楚的情况下,我们先去收集历史词,有点不现实;三、从词典的销售考虑,也是现代词词典要比历史词词典更受读者欢迎(事实也证明如此,《辞源》的发行量远远高于《词源词典》)。对于出版社来说,这一点很重要。
1.2 界定词语溯源范围 确定了收词对象以后,接下来的事是怎样来反映词源信息。词源考证很复杂,也很繁难。许多学者为一词的溯源而穷思极索、百转千回,虽已是人比黄花瘦,白发上额头,但仍感到自己的考证未达理想的彼岸。而《辞源》要面对的词成千上万,每个词都穷其源流,追其本原,那是一件永远无法实现的事。加之我材料有限、学识浅陋,要成就此事更是万万不能。而且这样做也是词典的体例所不容许的。因此只能凭自己能力之所及,把词语在汉语文献中我所见到的早期书证列举出来。
但是,从汉语文献中找出来的书证,只能说明这个词在汉语中的使用情况,至于这个词是来自什么语言,或者是受了什么语言的影响而产生的,是英语,还是俄语,还是日语?对于这类问题我一般不再往下探讨了。因为,如果要做,那将超出我的能力范围了,而且也是客观条件所不容许了。如《辞源》中有大量来自日语的词,对于这些词在日语中是如何起源、演变、定型,我就不再论述了。我以为这项工作应该由研究日语词语的学者来做更合适,而我的任务是把词语进入中国的情况记录下来,我只能做这方面的工作。(所以要把这部分词语的源流搞清楚,必须是研究日语和汉语的学者联合起来,日语学者负责词语在日语部分的源流,汉语学者负责词语在汉语部分的源流,只有两方结合,才能编出一部完整的词语源流词典。)
1.3 规定书证时间以年为单位 对于古汉语词,我们常常听到这样的说法,某某词见于先秦,某某词见于魏晋,某某词见于晚唐,虽然先秦、魏晋、晚唐时间跨度都很大,但古汉语从殷商到唐宋,或者到元明,时间跨度还要大,有3000多年,在这样的时间段中,能确定某个词产于某个朝代已经很不容易了。但我们研究近现代词不能这样,仅就《辞源》收词的时间跨度来说,从明末清初到1949年,才300多年,才经历明、清、民三个时期,如果我们只说某某词见于明、见于清,见于民,这样的叙述就很粗疏了。所以我们必须把时间分得更细,把300多年这个时间段,以年为单位来切分。按照这样的理念,我在词语每个书证前标上了年份。这样做的目的只有一个,就是希望把词源考证工作做得更加细致,更加精准。更有甚者,有的词语书证时间不但标注了年份,而且还标注了月份,如在“五四运动”条下,我先后配上1919年8月和10月两个书证,5月份爆发这场运动,至少在8月份已经有“五四运动”这个名称了。这样做是希望词源考证更为精准。而且我估计这个词语的书证时间还可以提前,应该在8月份以前就有这一名称了。
为词语书证标注时间是我从一些英语大词典中得到的启示,如韦伯斯特系列的词典、牛津英语大词典等,它们都有给词语标注始见年份的习惯,而且年份在不断更新,遇有新的考证,在词典修订时,这些始见年份还会有修改。但是,中国没有这样的词典,即便是台湾的《中文大辞典》,还是大陆的《汉语大词典》,都没有这样做。因此,给词语标注年份就成了我的梦想。后来我们终于有机会在《词源词典》做了尝试,从那时起,我们已决心要将这种做法进行到底,现在在《辞源》中也这样做了。
1.4 尽可能使用原始文献 从建立《语源库》那时起,我就立下一条原则,凡是别人著作中引用的材料,一律不能作为书证,《语源库》里的书证都必须从原始文献中选取。如果一本书既有初印本,又有重印本,也必须选择初印本。
1.5 尽可能使用即时性文献 一般情况下,我不在追忆性文献(如回忆录等)中摘取词语书证,而是选择即时性的文献(如日记、游记之类)来作为摘取词语书证的材料,因为追忆性语言是现在叙述过去的事情,在这类叙述中,其所使用的词语有的可能是现在的,有的可能是过去的,常常是现在词和过去词混杂在一起,要把两者区分开来很不容易。因此如果从这样的文献中选取的词语书证,要确定其时间是非常困难的。即时性文献就不存在这一问题,如日记,它就是用当天的文字记录当天发生的事情。这样摘录下来的词语书证,确定其年份很容易,也很真实。
2. 编纂中的重点
词典中每个条目一般有:词目、注音、释义、例证。规范性词典和学习性词典对于这几个项目的编写常常是顺流而下:先词目,后注音,再释义,最后才是例证。但编词源词典这样做不一定行得通,我都是倒着来,因为对于词源词典来讲,书证最为重要,我先要知道某个词语有没有书证,然后我再来确定这个词语能否立条。如果没有书证,也就等于没有词源信息,这样的条目立在词典里,与词源词典的性质不符,因此不能收录。
所以,书证是词源词典的核心。
但是,词语书证的寻找并不容易。比如说,我们要寻找“发动机”这词的书证,到哪里去找?我们首先会想到近现代有关机械、制造等方面的书籍、刊物,但收集一大堆资料,来寻找一个词,肯定不经济,这样做事倍功半。因此,我的做法是,先是心里不要假定具体的词,只能假定一个范围,即我们要收的是与外来事物有关的词语,只要符合这一条,都把它们收录进来,进入《语源库》,日积月累,时间长了,《语源库》里的条目也多了,相信“发动机”这个词的书证也有了,或许书证还不止一个。于是我们就把这些书证按时间顺序进行排列,时间早的排在前面,晚的排在后面。
如果这些工作做好了,条目最难的部分就完成了,余下的事无非是为条目配上拼音、释义等。相比之下,这些事情要容易得多了。所以,我们编《辞源》,与编规范性词典和学习性词典不同,是倒着来的。
3. 存在的问题
《辞源》出版后陆续收到了学者们的来信,他们提出了一些问题。另外,我们自己也发现一些不足,下面就词目、释义、书证等方面作一下论述。
3.1 关于词目
3.1.1
词目漏收 《辞源》漏收了许多词目。在该词典出版没多少时间,荒川清秀先生就向我指出,《辞源》漏收了“回归线”这词,朱京伟先生也转来了宫岛达夫的意见,宫岛先生指出,《辞源》漏收了参加、发展、管理、热情、正确、祖国等词。另外,我自己也发现一些漏收的词,如长桌、干潮、港澳、根性、共用、行规、钬、均沾、横向、鬣狗、龙骨、农产、庞大、全境、入库、世纪、手业、熟货、水库、睡狮、贴膏、外货、外流、外政、线毯、险滩、
腺体、小买卖、消音、学术、外用、延长、药料、翼龙、账务、猪仔、走气、最惠国,等等。其中“世纪”这词在《词源词典》已经收录过了,可是在《辞源》中竟然把它漏了。另外,干潮、钬、龙骨、农产、睡狮、消音、学术、延长等词,当时编词典时,我手头已经有很好的书证了,但不知什么原因,也漏了。这些事现在想来多少有些遗憾。但我也承认,有些词之所以漏收,那是因为还没有找到书证。
3.1.2
词目收录不平衡 作为一部词典,其收录的词语不但要有一定的量,而且要有一定的覆盖率。所谓覆盖率,就是词典中的词语对人类文化的各个领域基本上都要有所涉及。但《辞源》在这方面做得很不够,至少学科词语的分布还不均衡,如地理词语多;历史词语少;音乐词语多,美术词语少;几何词语多,代数词语少,等等。
另外,从时间段来说,《辞源》对于17世纪后半期到19世纪初和20世纪四五十年代这两段时期的词语,收录相对少了些,所收的多数是19世纪中到20世纪二三十年代这段时期的词语,特别是19世纪末至20世纪初这一二十年间的词语,虽然这段时期的新词确实比较多,但相比而言,其他时间段的词语的收录还是少了。
就语种来说,来自俄语的外来词也少了。
3.2 关于释义 《辞源》不少词目的义项未能列全,如“海绵”,这词有两义:①一种原始的多细胞动物,种类很多,多生在海底岩石中间。②用橡胶或塑料制成的多孔材料,有弹力,像海绵。但《辞源》只列了第一义项,没列第二义项。还有这样一种情况,本来词目本义出现的时间是在其比喻义之前,如“导火线”这词,“使爆炸物爆炸的引线”是本义,而“直接引起事变爆发的事件”是比喻义,从词义产生的逻辑顺序上讲,前者应该先出现,后者晚出现,然而,《辞源》为“导火线”本义所配的书证是1908年的,可是为比喻义所配的书证反而要比本义早,是1900年的,这似乎在说:“导火线”这词比喻义先出现,本义后出现,这显然有违词义演变的规律,实属本末倒置。但是,要改变这种状态,需要找到比比喻义更早的本义书证,可我还做不到这一点。
其实,在不少情况下,词目漏收,义项不全,也与“导火线”的情况一样,都受了书证的制约,没有书证,词目只能缺如,义项只能不全。但是,从严格的意义上来说,作为一本词典,常用的词以及常用的义项,必须收全,而本义和比喻义、引申义等出现的次序更不能颠倒。
3.3 关于书证
3.3.1
书证偏晚 《辞源》中的书证虽然都要比《汉语大词典》早些,但决不能因此说这些书证是最早的。事实上《辞源》中有相当一批词目其书证大有提前的可能。如“蒸馏”这词,我原以为这是一个来自日语的词,《辞源》所提供的书证选自1889年傅云龙《游历日本图经》。本以为这个书证算是早的了,因为它在20世纪初日语外来词大批涌入之前。可谁料想,后来我又发现在熊三拔《泰西水法》(1612年) 卷四中有这样一句话:“凡诸药系草木、果蓏、谷菜诸部具有水性者,皆用新鲜物料依法蒸馏得水名之为露。今所用蔷薇露,则以蔷薇花作之。其他药所作皆此类也。”这里就有“蒸馏”这词,而其意义与今义相当。这样一来,此例就比傅云龙例足足提前了227年。这一书证的发现,还能证明这词并不是日语词,而是汉语原本就有的词,至少也是日本将它借去,经过广泛使用后,又来到中国的回归词。诸如此类的例子还有很多,如《辞源》所收的安瓿、惨剧、承印、抽印、港(指香港)、隔膜、公教人员、灌输、海洛因、极大、借阅、镜片、罗马尼亚、免疫、脑力、内河、鸟瞰、奴性、欧风、气泡、全数、声浪、外流、微粒、小农、协办、游戏、涨价、招考、阻力等等,都还有更早的书证可以提前。
3.3.2
书证偏长 一般来讲,摘取一个句子来作为书证是最好的选择,如果这个句子短,那就更好了,如《辞源》“光源”条有这样一个书证:“光源,光线之来源也。”连标点符号,一共才10个字,而且读者一看就能明白词目的意义。又如“颅腔”条的书证:“头骨形成颅腔。”这就更短了,才7个字,词目的意义同样十分明白。但是这样的书证毕竟不多,大部分还是长句子。我们不能为了死扣字数,而削足适履,使用句子结构不完整的例子来作为书证。但反过来也不能因此而无端增加书证的字数,将文献中的材料作大段的引用,所以这需要把握,要恰如其分。一般来说,书证的字数最好控制在100字以内,如果超出这个数字,读者见了就不能很快找到词目,给读者增加了阅读负担。而且长长的书证还浪费了词典的篇幅。遗憾的是,《辞源》中书证冗长的条目有许多,如从犯、促进、定性分析、对流、二十四史、放映机、飞轮、飞艇、规模、公款、硅、卢布、路灯,等等,这些条目的书证字数都在100字以上。本词典的审定者姚德怀先生也向我提出过这个问题,但都因为要逐条删减例证,尚需投入很多的时间,所以最后还是没有把这个问题改过来。
3.3.3
个别书证时间有待商榷 给书证定年份,首先是要给书证的出处即文献定年份,给文献定年份有两种定法,一是按文献的写作时间定,一是按文献的刊行时间定,但有些文献写成后,并没有马上刊行,要在若干年以后才付印,中间相隔许多年,如马欢的《瀛涯胜览》就属这种情形。一般说,此书初稿写于1416年,可稿本早已不存,我们无法窥见原貌。现存的《瀛涯胜览》,都是1416年以后的抄本或刻本。从严格意义上讲,给《瀛涯胜览》定年份,应该定在1416年以后的,如1451年等,但是在《辞源》中,给《瀛涯胜览》定的年份是1416年,这是欠妥的。
3.3.4
书证未能使用繁体字 《辞源》中的书证绝大部分来自繁体字文献,但我在输入过程中,将繁体字全部转换成了简体字,这多少影响了书证材料的真实性。其实《汉语大词典》的做法可以借鉴,该书引自古籍的书证,一律采用繁体字;引自现代书籍(辛亥革命以后)的例证,一般使用简化字。我以为,辛亥革命到新中国汉字简化方案公布之前,汉语文献一般还是使用繁体字,所以这段时间里书证没有必要换成简体字,应该尊重事实,仍然使用繁体字。因此,我认为,为了尊重语言事实,摘取书证的文献如果是繁体字的,我们也用繁体字,如果是简体字的,我们也用简体字。很遗憾,《辞源》没有这样做。或许有人会说,字体的变换不会影响书证所表达的意义。这话虽有一定的道理,但我觉得这样做毕竟改变了文献的历史原貌。例如《辞源》在“镁”字条下所举的书证是:1871年傅兰雅《化学鉴原》卷一:“Magnesium,镁。”其实《化学鉴原》中Magnesium 后面的这个字是“鎂”,不是“镁”。傅兰雅当年为金属元素造字时,左边加的都是“釒”旁,不是“钅”旁。所以把繁体字改成简体字使得书证有些不真实了。
3.4 一点说明 《辞源》在封底,出版社印有几句宣传用语,这里需要说明一下。这些宣传用语中的第一句话是:本书“收词近万条,均为受西方文化影响产生的新词”,这句话不妥,《辞源》所收的词,并不都是“受西方文化影响产生的新词”,也收有土生土长的新词,所以应以《辞源·凡例》中的第一句话为准,即“本词典主要收录明末清初到1949年前后这段时期,汉语受西方文化影响而产生的词语,同时也收录了少量的本族新词。”第二句话是:“书证详细,给出始见书证,学术价值巨大。”这是出版社对书的一种宣传,也是一种溢美之辞,我应该向他们表示感谢。但问题是,这样一说,我压力就大了。其实《辞源》并没有对所有词目给出始见书证,相反有的书证还偏晚了(对于这一点我已经在上面说过了)。所以不能说《辞源》“学术价值巨大”。第三句:“语言接触研究的最佳范本”,这句话更是美誉了,“最佳范本”那已经到了至善至美的境界了,《辞源》怎能担当得起?我很担心,总有一天会有读者拿这些话来评论这本书,如果真的是这样,那我就尴尬了。