词频选取法在方言特征词研究中的运用
——“长辈亲属称谓类”方言特征词例析
(刊《厦门大学学报》2000年第3期)
苏新春[①]
厦门大学
摘要:方言特征词是当前方言词汇研究中一个富于理论意义的命题,如何提取方言特征词是其中最为关键的一环。词频选取法就是对一定范围的封闭性语料主要从构词能力的频率、地理分布的广狭、义类的词语投射三方面进行定量分析以见其特性。文章以李荣先生主编的《现代汉语方言大词典》中21个方言点的“长辈亲属称谓”类为材料,系统地运用词频统计的方法,考察了该类方言词的主要特征与分布,实证了该研究方法的价值与不足。
关键词:方言特征词 频率统计法 亲属称谓词 《现代汉语方言大词典》
中图分类号:H07 文献标识码:A 文章编号:
一、引言
方言研究近年来出现引人注目的转折,重视了对词汇的研究,尤其是词汇比较的研究。李如龙先生近年多次提出开展方言特征词的研究, [1] 体现了这一学术转折。方言的特征,不只是从语音,也会从词汇、语法上表现出来。由于词汇的表意性质,词汇差异与地域、历史、文化、习俗等关系密切,因此特征词在显示方言特点上有着独特的价值。所谓方言特征词,就是这个词语具有唯它所有,“对内一致对外排它”的属性。找出方言特征词,对认识一种方言的面貌,认识相关方言区之间的联系,无疑有着重要意义。
本文选取了长辈类亲属称谓词作为分析对象。亲属称谓词是词汇体系中一个充满文化信息的类,与本地文化中的血缘、宗法、婚姻、习俗有着密切关系;又具有相当稳定的特点(很强的传承性),不易受到其它方言的浸润;还带有封闭的特点(同类的词语数量有限)。
本文的材料分析对象来自李荣先生主编的《现代汉语方言大词典》。[2] 该词典以地点方言分卷,共41卷,每卷充分反映了一种方言的词汇全貌,收录词汇达8000-10000条。更有意义的是全书使用了统一的“词汇义类表”,便于各卷之间的比较。李荣先生在总序中说道:“凡是本方言能说的,都尽可能问清楚。这样各地的语料才能对比异同。这些语料不过是分地词典的最大公约数。各地的编者有充分的篇幅,可以广泛收罗本方言的字音与语汇。”[3]“亲属”类是《现代汉语方言大词典》30个义类中的第10类,“长辈”是“亲属”类的第1小类。本文对“长辈”这一小类的词语进行了封闭性的研究。
词典在编纂中要求尽量查核本字,这对以“形”“义”为主的计算机定量分析很有用,能最大限度地保证形义之间的对应关系。由于41卷对各大方言点反映的疏密不同,属于北方方言的有18卷,南方方言区少的只有2卷。出于对方言显示价值与数量大体平衡的考虑,本文选取了41卷中的21卷作为分析材料。
本文属于词汇领域的方言类型比较的定量研究。所运用的方法主要是词频统计法,通过对长辈类亲属称谓词的穷尽统计来发现它们在不同方言点的分布规律;通过构词能力强弱的统计来探索词语的在该方言词汇体系中的性质、地位与作用;通过词语义域的统计来观察不同方言词语的构成与表义功能。
二、21个点长辈类亲属称谓概况
表1 21个方言点收词统计
方言点 |
哈尔滨 |
西安 |
太原 |
洛阳 |
成都 |
武汉 |
扬州 |
苏州 |
金华 |
温州 |
长沙 |
娄底 |
南昌 |
黎川 |
梅县 |
于都 |
福州 |
厦门 |
海口 |
广州 |
南宁 |
21 |
收 词数 |
44 |
57 |
53 |
53 |
59 |
57 |
43 |
34 |
59 |
65 |
53 |
54 |
54 |
51 |
55 |
51 |
80 |
54 |
60 |
70 |
43 |
1137 |
21个点中,收词最多是福州80例,最少的是苏州34例。21个点的总收词次为1137个,平均每个方言点54.14个。不算重复出现的次数,词语数是616个。
表2 复现率词语
词语数(个) |
1 |
3 |
6 |
6 |
3 |
10 |
26 |
24 |
38 |
70 |
432 |
616 |
复现次数(次) |
14 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
|
复现总次数(次) |
14 |
30 |
54 |
48 |
21 |
60 |
130 |
96 |
114 |
140 |
432 |
1137 |
上表中,616是总词语数,1137是总出现词次数,平均每个词的复现率为1.84次。复现2次以上的有184个词语,复现词次共为705次。复现1次的有432个词语。复现次数最高的为14次,1个词。
复现次数最高的词是“长辈”,出现在14个方言点。它是本类的类名,不足以反映方言的共性或个性。432例只在一个方言点出现,所有词语的平均复现次数为1.84,这两个数字说明方言点的长辈类亲属称谓词分歧相当大。在2个以上的点出现的184例,平均复现率也只有3.8。分歧大显示长辈类亲属称谓词的方言个性突出。多个方言点的共有词语数量不多,184∶616,只占29.9%,这些词语对观察方言点之间的联系性很有价值。
下面是对616例称谓词在性别、父系母系、血亲与姻亲、辈分等方面所作的分类统计结果:
表3 称谓词的“系别”“辈分”
|
系
别 |
辈
分 |
|
||||||||||||||||||||||||
|
父 系 |
母系 |
姻亲 |
干亲 |
合称 |
兼系 |
高祖辈 |
曾祖辈 |
祖父辈 |
父辈 |
平辈 |
跨辈 |
|
||||||||||||||
|
男性 |
259 |
127 |
43 |
59 |
8 |
|
22 |
8 |
20 |
46 |
163 |
3 |
19 |
|||||||||||||
|
女性 |
306 |
15 |
87 |
56 |
10 |
|
38 |
4 |
20 |
61 |
186 |
1 |
34 |
|||||||||||||
|
合称 |
51 |
8 |
2 |
3 |
3 |
18 |
17 |
2 |
3 |
|
18 |
|
29 |
|||||||||||||
|
总数 |
616 |
250 |
132 |
118 |
21 |
18 |
77 |
14 |
43 |
107 |
367 |
4 |
81 |
|||||||||||||
|
616 |
616 |
|||||||||||||||||||||||||
上述统计数据中有几种现象颇为有趣:
1. 女性词与男性词优势互有。亲属关系中,女性词在“母系”和“跨系”两类中为多,男女比数为43对87、22对38,男性词的比例只占33%和37%。男性词在“父系”中略多,127对115,比例为52%。辈分关系中,女性词在“祖父辈”“父辈”和“跨辈”三类词中为多,男女词语的比例分别为46对61,163对186,19对34,男性词的比例只有43%、47%、36%。男性词只在“高祖辈”和“平辈”中占优。这种情况表明通常认为父系的称谓词分得细,母系的统称词多的观点不尽正确。男女词语的详略情况,显示出这种详略与和说话人的亲疏关系有一定联系。愈是亲近的关系,称谓词也就相应分得细密。另外可能还由于男性亲属称谓词比起女性亲属称谓词,统一、稳定的程度要高,而女性亲属称谓词因地域文化等因素的影响而显出较大的差异。
2. “父辈”的称谓词最多。辈分愈远的,词语数愈少。无论是在男性词还是女性词都表现出同样的规律。男性词“父辈”、“祖父辈”、“曾祖辈”、“高祖辈”的递增数分别是163∶46∶20∶8,女性是186∶61∶20∶4。这种现象显然与上面说到的亲缘关系的远近有直接关系。
3. 用长辈词来指称“平辈”。这是由于用孩辈的称呼最容易收到尊人谦已的效果,如“大伯爷”指丈夫的哥哥,“大伯娘”指丈夫的嫂嫂(温州),“细叔爹”指“丈夫最小的弟弟”(海口)。“大舅子”“小舅子”“舅老爷”,则用来指妻子的兄弟。“用小辈称呼”,是汉语称谓词中体现民族礼俗文化较明显的一类现象。
三、“单次呈现词”的考察
长辈类亲属称谓词中有432例只出现过一次,占到总词语数的70.1%。下面是对21个点的“单次出现”情况的调查结果:
表4: 单次呈现次
方言点 |
总收词数 |
单次出现词 |
单次词之比例 |
例
词 |
哈尔滨 |
44 |
12 |
27% |
舅奶、姥儿、老丈眼子、舅姥儿 |
西安 |
57 |
29 |
51% |
丈姑娘、姚婆子、姚爸、姑夫爷、外头大人 |
太原 |
53 |
21 |
41% |
老奶、姑姥爷、姥娘、妗妗、后爸爸 |
洛阳 |
53 |
12 |
24% |
达达儿、后爹、妠、位爷、婆儿婆儿 |
成都 |
49 |
15 |
10% |
亲翁、老人公、老人婆、祖祖、两孃孃 |
武汉 |
56 |
27 |
48% |
亲娘热老子、家公爹爹、姨家家、帅爹爹 |
扬州 |
43 |
8 |
19% |
晚老子、姨丈人、叔丈人、婆太太、大妈妈 |
苏州 |
34 |
10 |
29% |
娘姨、惹姆、嬤嬤、好伯、亲婆 |
金华 |
59 |
8 |
14% |
姨爷、亲爷佬儿、亲妈、太太公 |
温州 |
65 |
38 |
58% |
妗婆娘、大姥、舅舅儿、大爸、琐娘、嬭 |
长沙 |
53 |
25 |
47% |
完姑妈、娭乸、姑娭乸、继爷、满姑妈 |
娄底 |
54 |
29 |
55% |
姨唧、伯唧、大唧、寄爷子、嫚嫚 |
南昌 |
54 |
15 |
26% |
母娘、母舅、太阿公、舅阿公 |
黎川 |
51 |
19 |
37% |
丈儿公、妗儿、契娘、渠屋爷、叔儿崽 |
梅县 |
55 |
23 |
39% |
公太、婆太、媴、丈里婆、继父爷、细姆 |
于都 |
51 |
37% |
爷老、母母、表公公、乸、婆奶、新母 |
|
福州 |
80 |
48 |
60% |
|
厦门 |
54 |
18 |
33% |
娘爸、母姨、娘嬭、太妈、母妗、亲姆 |
海口 |
60 |
36 |
60% |
家翁、婶姩、伯爹、认母、饲妈、叔爸 |
广州 |
70 |
16 |
23% |
家公、大妗有、阿嫲、老豆、外父 |
南宁 |
43 |
13 |
30% |
亲家奶、妗娘、契妈、后老娘、外父老 |
总数 |
1138 |
433 |
38% |
|
单次呈现词占词语总数最高的为60%,最低的为10%,平均为38%。30%以上的有13个点,50%以上的依次是“海口”、“福州”、“温州”、“娄底”、“西安”5个点。所占比例最小的依次是“成都”、“金华”、“扬州”、“广州”、“洛阳”。单次率愈高显示该方言特征愈明显。
“单次呈现词”中蕴藏着很有区别意义的语料。例如:
福州话中以“依”为词头的有13个:“依爸”“依伯”“依爹”“依公”“依家”“依妗”“依舅”“依妈”“依母”“依奶”“依婶”“依爷”“依姨”。其中只有“依妈”又见于娄底方言点。
娄底话中以“唧”为词尾的称谓语。如“太唧”(曾祖父)、“太太唧”(高祖父)、“外太唧”(母之祖父)、“伯唧”(伯母)、“叔唧”(叔父)、“婶唧”(叔母)、“大唧”(父之姐)、“姨唧”(母之妹),共8例。“唧”当为“子”字。“子”字在616例中共有26例,散布在10个点中,其中娄底话就有9例,独见者有5例。再加上8例“唧”字,可以说娄底话的“唧”“子”词尾是它的一大特色。
海口话中以“姩”为词素的词。如“官姩”(丈夫的母亲)、“大伯姩”(大伯母)、“伯姩”(伯母;舅舅)、“婶姩”(叔母)、“大姩”(大老婆;丈夫大哥之妻);“妗姩”(舅母)。
以“满”字为词头的词只见于梅县话和长沙话。如“满舅”(最小的舅舅)、“满姨”(最小的姨母)、“满叔”(最小的叔叔)、“满姑”(最小的姑姑)/“满姑妈”(最小的姑妈)、“满满”(叔叔)。
西安话因受到回民语言的影响,存在不少回语借词。如“姨那”(姨母)、“姨夫把”(姨夫)、“姑拿”(姑母)、“姑夫把”(姑夫)、“芽芽”(唯一的“叔母”)、“达达”(唯一的“叔父”)、“外把”(外祖父)、“拿拿”(祖母)、“把把”(祖父)、“达”(父亲)、“外拿”(外祖母)。
广州话中指父亲的“老豆”。
上述种种语例,都是富于区别价值的方言特征词。
把只在一个方言点出现的“单次呈现词”看作就是该方言点的特征词,在理论上是讲得通的。而实际运用中,“单次呈现词”并不都能成为方言特征词。原因有多种:
首先,编纂者对“方言词”的范围理解不一,运用尺度不一,导致对普通话词语的收录不一。在其它方言卷不收普通话词语的情况下,收了的反而是“单次呈现”。如“曾祖父”“曾祖母”(长沙)、“祖父”“祖母”“继父”(成都)、“养母”“姑母”(南宁)、“表舅”(福州)、“姨母”(海口)、“舅父”(广州)、“舅外公”“老人家”(娄底)、“干妈”“干爸”(西安)、“父母”(南昌)、“姻亲”(梅县),都是使用范围相当广的普通话词语。
其次,有的词结构稍有不同,也会出现个体差异。如南昌话中的“姑娘”与“大姑娘”,“老丈母娘”(哈尔滨)与“丈母娘”。
再次,对排行的序称词有的收,有的不收。如黎川话中就收了“二姑”“二大姑”“二大姨”“二叔”“二公”“二舅”等词,扬州话收了“二爷”(指二叔),温州话收了“二大”(指二叔父)。
又次,由于缺乏平行比较,分布在几个方言点中的方言词,也会出现有的点收,有的没收的情况。如黎川卷收了“奶爷”,南昌卷却没收。
另外,由于编纂者调查的细致程度不一,漏收本方言点已存在词语的现象也常有出现。
以上种种原因,都使得“单次呈现词”与方言特征词之间远不能划等号。因此必须对《现代汉语方言大词典》中“亲属”类“长辈”小类的“单次出现”词语进行严格的筛选、甄别。这不仅要与周边的相关方言卷相对照,有的还须再作实地考察,经过仔细的斟酌,才能使“单次呈现词”具有方言特征词的意义。只是这样就超出了本文研究的旨义,故所作的甄别主要限于词典的文本范围内。
四、表方言亲疏关系的特征词分析
下面对一些能反映相关方言区亲疏关系的词语进行分析。运用的方法主要是单音语素义项分析法、构词能力分析法、同义类的词语投影法。
1.“爷”字分析
“爷”在汉语中是一个有较长历史的父亲称呼语。《辞源》记载了它的“父亲”与“尊人之称”两个义。[4]《汉语大字典》收录的义项比较齐,共有五个义项。1).“父亲”义。释义为“《玉篇·父部》:‘爷,俗为父爷字。’《篇海类编·人物类·父部》:‘爷,俗呼父为爷。’”2).“祖父”义,释义为“方言。祖父。明·沈榜的《宛署杂记·民风二·方言》:‘祖曰爷。’按:今多叠用,称祖父或与祖父辈相同、年龄相仿的男子为爷爷。”[5 ]可见“父亲”和“祖父”义,当初都是作为俗义、方言义而出现,“祖父”义比“父亲”义晚起。其它的三个义项是非亲属称谓义,“对长一辈或年长男子的尊称”、“旧时对主人、上官或尊贵者的称呼”、“迷信的人对神佛的称呼”,本文略去不论。
在21个方言点中,用“爷”构成表示亲属关系的合成词共有65个,涉及的亲属关系很广。从辈分看,“父辈”30例,“祖父辈”20例,“曾祖辈”4例,“高祖辈”2例,“同辈”1例,“兼辈”8例。从关系看,“父系”24例,“母系”11例,“姻亲”14例,“兼系”13例,“干亲”3例。可以说“爷”是表示男性长辈的一个非常多见,构成能力相当强,分布地区很广的一个基本语素。表5中的数据反映了这种情况。
表5: “爷”字分布地区
北方 |
吴 |
湘 |
赣 |
客 |
闽 |
粤 |
||||||||||||||
哈尔滨 |
西安 |
太原 |
洛阳 |
成都 |
武汉 |
扬州 |
苏州 |
金华 |
温州 |
长沙 |
娄底 |
南昌 |
黎川 |
梅县 |
于都 |
福州 |
厦门 |
海口 |
广州 |
南宁 |
8 |
6 |
12 |
3 |
5 |
5 |
4 |
2 |
9 |
11 |
11 |
10 |
8 |
5 |
3 |
3 |
1 |
0 |
0 |
6 |
3 |
这组数据显示“爷”分布地区的广泛性,唯在闽方言的“厦门”“海口”两个点是空白。“福州”有1例,考虑到它收的称谓词最多,有80例,1例所占的比例相当低,可以说闽方言是较少用到“爷”字的。前面说到“爷”字的出现比较晚,而闽方言恰恰是一种古老的方言。
将“爷”的表义功能进一步细分,可以发现它构成的合成词所表示的男性长辈亲属关系共有25种。如“伯父”、“夫之父”、“夫之舅”、“夫之兄”、“父母”、“父亲”、“干爸”、“高祖父”、“公公”、“姑父”、“姑公”、“姑外公”、“继父”、“舅父”、“舅公”、“奶爷”、“亲家公”、“叔公”、“外曾祖父”、“外祖父”、“姨父”、“姨公”、“岳父”、“曾祖父”、“祖父”。值得注意的是它表示“父亲”义的情况。表“父亲”义的“爷”字词有9个:“爷”、“亲爷”、“爷老子”、“爷儿”、“爷老”、“爷老倌”、“家爷”、“依爷”、“渠屋爷”。分布情况如下表:
表6: 表父亲义的“爷”分布情况
北 |
吴 |
湘 |
赣 |
客 |
闽 |
|||||
武汉 |
苏州 |
金华 |
温州 |
长沙 |
娄底 |
南昌 |
黎川 |
梅县 |
于都 |
福州 |
1 |
1 |
3 |
1 |
3 |
3 |
3 |
2 |
1 |
1 |
1 |
爷 |
爷 |
爷、亲爷、 爷爷 |
亲爷 |
爷老子、 爷老倌、 家爷 |
爷老子、爷老倌、家爷 |
爷、 亲爷、 爷老子 |
爷、渠屋爷 |
爷儿 |
爷老 |
依爷 |
11个方言点有此义,分属6个方言区。值得注意的是吴、湘、赣、客四个方言区的所有9个方言点都有此义,属于北方官话区和闽方言区的只有武汉与福州两个点分别只有一见。据此可以看出,表“父亲”义的“爷”字词是吴、湘、赣、客共有的现象。它显示出这四种方言之间有着较密切的关系,与学术界认为客赣相近,吴湘相近的传统看法相吻合。而有9例“爷”字合成词的广州却没有1个是表示“父亲”义,北方方言区的7个点都有“爷”字词,多达39例,却只有1点可见1个表“父亲”义的“爷”字词。再看单音词“爷”字,在哈尔滨、西安、太原、成都4个点都出现了,但表示的全是“祖父”义。这似乎也为《汉语大字典》的“祖父”义比“父亲”义晚起的看法提供了佐证。
2.“妗”字分析
“妗”的基本意义是“舅母”。《汉语大字典》记载了这样几条资料。《集韵·沁韵》:“妗,俗谓舅母曰妗。”宋·张耒《明道杂志》:“经传中无婶与妗字,……妗字乃舅母二合呼也。”章炳麟《新方言·释亲属》:“幽侵对转,舅妗双声。故山东谓舅妻为妗。”[6]从中可以看到“妗”是一个中古时有的俗字,不见于上古经传之书,它与“舅母”有音变关系。下面来看看它在现代各方言中的分布情况。
表7: “妗”字分布地区
北 |
吴 |
赣 |
闽 |
粤 |
|||||
西安 |
太原 |
洛阳 |
温州 |
黎川 |
厦门 |
福州 |
海口 |
广州 |
南宁 |
1 |
1 |
1 |
3 |
2 |
3 |
5 |
1 |
6 |
1 |
妗子 |
妗妗 |
妗子 |
妗娘儿、妗婆娘、阿妗 |
妗婆、妗儿 |
妗婆、阿妗、母妗 |
表妗、妗妈、依妗、娘妗、妗 |
妗姩 |
妗母、妗婆、大妗婆、妗、妗有、大妗有、 |
妗娘 |
“妗”共构成合成词19个,从出现频率来看,15例只在一个方言点出现,1例(妗婆)出现在3个点,3例(阿妗、妗子、妗)出现在2个点,共出现24次。
从表义特点来看,表示祖父辈的有四个词:“妗婆”、“大妗婆”“妗妈”、“妗婆娘”,它们还可“父系”“母系”共指,都是指“父母的舅母”。而其它15个都是只表示“舅母”(“表妗”表“表舅母”),表义范围限于“母系”、“父辈”,与前4个词形成明显差别。
从构词方法来看,“妗”充当了核心词素,或是重叠(妗妗),或是加词缀(妗子、阿妗、依妗),或是与表长辈的女性词相加(妗娘、妗母、……),有两个比较特殊,一个广州话“妗有”的“有”是母与冇同音,为避讳而说成“有”,一个是海口话中的“姩”,纯女性用字。
从地理分布来看,主要集中在闽、粤两大方言区,所有的5个点都有,而且构成的词语数量多,达14个,占总数的74%。其它地区都较少见,吴方言3个点中1个有,赣方言2个点中1个有。北方方言区的西安、洛阳、太原地理相近,分别各见1例。北方的三个点拥有2个词,而闽、粤方言的构成词语多,又说明“妗”在北方统一程度较高,在南方的构词则存在相当分散。
3.“丈夫之父亲”义的方言词语分析
“丈夫之父亲”属于姻亲中的基本关系之一。21个点中,西安、武汉、苏州、南宁没有这方面的词语。其它的17个点所使用的词语如下:
表8: “表丈夫之父亲”义的词语
北方 |
吴 |
湘 |
赣 |
客 |
闽 |
粤 |
||||||||||
哈尔滨 |
洛阳 |
成都 |
扬州 |
金华 |
温州 |
长沙 |
娄底 |
南昌 |
黎川 |
梅县 |
于都 |
福州 |
厦门 |
海口 |
广州 |
|
公公 |
公公 |
公公 |
公公 |
公 |
公 |
大官爷 |
家爷 |
家爷 |
公公 |
公儿 |
家官 |
家官 |
老官 |
家官 |
家翁 |
家公 |
|
|
|
|
|
|
|
|
|
*# |
# |
# |
|
|
/ |
*# |
|
(注:“*”表示是多义词;“#”表示只用于背称;“/”表示合称“丈夫的父母”。下同)
上述结果显示,“北方话”“湘”“赣”“客”四个方言区内部出现高度一致,差异很细微。北方话四个点的词语是“公公”,一个是“公”;湘方言都用“家爷”;赣方言用“公公”与“公儿”;客家话用“家官”,梅县点的不同在于只能用于背称。闽方言粤方言比较接近,都是偏正结构,以“公”“翁”或“官”作中心词语,前加“家”作修饰词素。内部差异比较大的是吴方言。从与北方话关系的角度来看,可以发现赣方言及吴方言中的金华点比较接近北方话。
五、综论
本文只是运用词频分析法,利用《现代汉语方言大词典》中的丰富材料进行方言特征词研究的一个例释。对长辈类亲属称谓词在地理分布、词频与构词情况上所作的初步尝试。“初步”表明研究工作还刚开始,假如对这一类的所有词语进行用词、构词、表义的统计,或是从所有的长辈亲属关系来一一考察所对应的词语,那时将会呈现出更清晰的方言特征词面貌。然这个“初步”的例释工作所表现出来的意义却是明显的:
1. 方言的特征不应该只限于语音,它还会在词汇上体现出来。尽管词汇在各方言点之间的交叉相当普遍而混杂,但由于词汇是一个表意系统,与人们的认知紧密联系在一起,词汇系统的稳定性与内在联系性又相当牢固。还由于这个表意系统与人们的观念、习俗、文化相结合,这都使得方言词汇具有自己独特的个性。因此把握方言特征词对人们全面认识一种方言的本质具有不可低估的作用。
2. 方言特征词的调查与分析,有助于对现有的看法,进行验证、补充、修正。现有的许多方言知识主要是依据对方言语音特征的认识而形成的,语音规律固然有它独特的认知价值,但对反映一种语言来说,这仍是不全面的。语音只是语言几大要素中的一个,只有当人们全面认识了语音、词汇、语法的所有规律后,才能对一种语言或方言形成完整、全面的认识。《现代汉语方言大词典》每卷有30个大义类,每个大义类大致有4个小类,假如我们能对这30个大类120个小类,或在每一大类中各选1个小义类,作同样的工作,相信那时得出的数据会更为真切。届时将数十项、数百项的调查结果,映射在语言地图上,方言之间的同语线、异语线会是相当明晰。
3. 用数量统计的方法来查寻方言特征词的作法是可行的。本文运用的方法主要是静态的词汇结构分析法:词语地域分布法与构词能力调查法。从基本词汇理论来看,这两种方法与“全民性”“极强的构词能力”相吻合。在运用过程中会表现出两种不同的操作顺序:顺向的,即从语言形式到义类;逆向的,即从义类到语言形式。静态的词汇结构分法有其不足之处,就是缺乏动态的考察,缺乏对词的使用频度和词的历史渊源的充分反映。不反映词的使用频度,就会使一个常用词与非常用词在统计过程中显示同样的价值。不反映词的历史渊源,就会使“外来词”“外来者”与“本土词”“固有者”混为一谈,而这与基本词汇理论的另一要求“极强的稳定性”密切相关。要对此弥补就得增加考辨的功夫,在平面的、统计的、定量的研究基础上,增加纵向的、分析的、定性的考证性的研究成分。但从统计研究的要求来看,词语地域分布法与构词能力调查法基本上能达到研究的目的。它比起以往对方言特征词的研究主要靠经验式的摘取方法,要客观得多,操作性也更强。
4. 《现代汉语方言大词典》为方言词汇的比较研究提供了极有价值的材料。以前的词汇研究主要是单点进行,横向比较也大都或是限于几点之间,如方言点与普通话、方言点与方言点,或是多个方言点之间少数代表词的比较。这是时代的局限。人们在对汉语方言没有全面了解,知识积累不多的年代,只能这样做。学者们的工作都得一步步地从一个点一个点的原始材料收集工作做起。《现代汉语方言大词典》的出版,既代表着方言词汇研究的一个集大成成果,也标志着方言词汇的大规模综合、比较研究时代的到来。将几十个有着统一义类安排的方言词汇系统进行横向的分析比较,它的价值远不止于方言研究,必将对汉语词汇理论、汉语的纵向历史演变与横向融合的研究产生重要影响。如此规模的研究,需要计算机为依托;语言研究的计算机时代欢迎着《现代汉语方言大词典》这样的巨著。
本文只是一个尝试。“长辈类亲属称谓词”也只是一个很小的类。第三部分曾说到,以《现代汉语方言大词典》为基本材料,尚存在诸多不足,有的不足还比较突出。然而由于统计性的研究需要相当多的数量、体系相对完整、相对封闭自足的材料,在目前来说,这部有着统一体例的词典丛书所提供的材料应该说是最好的。从统计的角度来看,个别点的漏收与失衡,一般不至产生重大的影响,因为统计讲究一个概率。象“爸爸”只在7个方言点中出现,占所调查对象的三分之一,而另一个数据,即这7个方言点散见于六大方言区,又有力地证明了它那使用地域广泛的普通话词语性质。这种广泛的“散见”,除“长辈”这个类名外,在所有的616个长辈亲属词中就以“爸爸”为最。这就是概率统计的优势。
以词典的语料来研究方言特征词,本还应从语音,或语源上加以对比、鉴别,以克服对“字”的过分依赖,加强对同源词、同音词的认定。这是在词频统计方法运用之外还应进行的工作,只是它已超出本文范围,待另行论予。
参考文献: