词频选取法在方言特征词研究中的运用
——“长辈亲属称谓类”方言特征词例析
(刊《厦门大学学报》2000年第3期)
苏新春[①]
厦门大学
摘要:方言特征词是当前方言词汇研究中一个富于理论意义的命题,如何提取方言特征词是其中最为关键的一环。词频选取法就是对一定范围的封闭性语料主要从构词能力的频率、地理分布的广狭、义类的词语投射三方面进行定量分析以见其特性。文章以李荣先生主编的《现代汉语方言大词典》中21个方言点的“长辈亲属称谓”类为材料,系统地运用词频统计的方法,考察了该类方言词的主要特征与分布,实证了该研究方法的价值与不足。
关键词:方言特征词 频率统计法 亲属称谓词 《现代汉语方言大词典》
中图分类号:H07 文献标识码:A 文章编号:
一、引言
方言研究近年来出现引人注目的转折,重视了对词汇的研究,尤其是词汇比较的研究。李如龙先生近年多次提出开展方言特征词的研究, [1] 体现了这一学术转折。方言的特征,不只是从语音,也会从词汇、语法上表现出来。由于词汇的表意性质,词汇差异与地域、历史、文化、习俗等关系密切,因此特征词在显示方言特点上有着独特的价值。所谓方言特征词,就是这个词语具有唯它所有,“对内一致对外排它”的属性。找出方言特征词,对认识一种方言的面貌,认识相关方言区之间的联系,无疑有着重要意义。
本文选取了长辈类亲属称谓词作为分析对象。亲属称谓词是词汇体系中一个充满文化信息的类,与本地文化中的血缘、宗法、婚姻、习俗有着密切关系;又具有相当稳定的特点(很强的传承性),不易受到其它方言的浸润;还带有封闭的特点(同类的词语数量有限)。
本文的材料分析对象来自李荣先生主编的《现代汉语方言大词典》。[2] 该词典以地点方言分卷,共41卷,每卷充分反映了一种方言的词汇全貌,收录词汇达8000-10000条。更有意义的是全书使用了统一的“词汇义类表”,便于各卷之间的比较。李荣先生在总序中说道:“凡是本方言能说的,都尽可能问清楚。这样各地的语料才能对比异同。这些语料不过是分地词典的最大公约数。各地的编者有充分的篇幅,可以广泛收罗本方言的字音与语汇。”[3]“亲属”类是《现代汉语方言大词典》30个义类中的第10类,“长辈”是“亲属”类的第1小类。本文对“长辈”这一小类的词语进行了封闭性的研究。
词典在编纂中要求尽量查核本字,这对以“形”“义”为主的计算机定量分析很有用,能最大限度地保证形义之间的对应关系。由于41卷对各大方言点反映的疏密不同,属于北方方言的有18卷,南方方言区少的只有2卷。出于对方言显示价值与数量大体平衡的考虑,本文选取了41卷中的21卷作为分析材料。
本文属于词汇领域的方言类型比较的定量研究。所运用的方法主要是词频统计法,通过对长辈类亲属称谓词的穷尽统计来发现它们在不同方言点的分布规律;通过构词能力强弱的统计来探索词语的在该方言词汇体系中的性质、地位与作用;通过词语义域的统计来观察不同方言词语的构成与表义功能。
二、21个点长辈类亲属称谓概况
表1 21个方言点收词统计
|
方言点 |
哈尔滨 |
西安 |
太原 |
洛阳 |
成都 |
武汉 |
扬州 |
苏州 |
金华 |
温州 |
长沙 |
娄底 |
南昌 |
黎川 |
梅县 |
于都 |
福州 |
厦门 |
海口 |
广州 |
南宁 |
21 |
|
收 词数 |
44 |
57 |
53 |
53 |
59 |
57 |
43 |
34 |
59 |
65 |
53 |
54 |
54 |
51 |
55 |
51 |
80 |
54 |
60 |
70 |
43 |
1137 |
21个点中,收词最多是福州80例,最少的是苏州34例。21个点的总收词次为1137个,平均每个方言点54.14个。不算重复出现的次数,词语数是616个。
表2 复现率词语
|
词语数(个) |
1 |
3 |
6 |
6 |
3 |
10 |
26 |
24 |
38 |
70 |
432 |
616 |
|
复现次数(次) |
14 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
|
|
复现总次数(次) |
14 |
30 |
54 |
48 |
21 |
60 |
130 |
96 |
114 |
140 |
432 |
1137 |
上表中,616是总词语数,1137是总出现词次数,平均每个词的复现率为1.84次。复现2次以上的有184个词语,复现词次共为705次。复现1次的有432个词语。复现次数最高的为14次,1个词。
复现次数最高的词是“长辈”,出现在14个方言点。它是本类的类名,不足以反映方言的共性或个性。432例只在一个方言点出现,所有词语的平均复现次数为1.84,这两个数字说明方言点的长辈类亲属称谓词分歧相当大。在2个以上的点出现的184例,平均复现率也只有3.8。分歧大显示长辈类亲属称谓词的方言个性突出。多个方言点的共有词语数量不多,184∶616,只占29.9%,这些词语对观察方言点之间的联系性很有价值。
下面是对616例称谓词在性别、父系母系、血亲与姻亲、辈分等方面所作的分类统计结果:
表3 称谓词的“系别”“辈分”
|
|
系
别 |
辈
分 |
|
||||||||||||||||||||||||
|
|
父 系 |
母系 |
姻亲 |
干亲 |
合称 |
兼系 |
高祖辈 |
曾祖辈 |
祖父辈 |
父辈 |
平辈 |
跨辈 |
|
||||||||||||||
|
男性 |
259 |
127 |
43 |
59 |
8 |
|
22 |
8 |
20 |
46 |
163 |
3 |
19 |
|||||||||||||
|
女性 |
306 |
15 |
87 |
56 |
10 |
|
38 |
4 |
20 |
61 |
186 |
1 |
34 |
|||||||||||||
|
合称 |
51 |
8 |
2 |
3 |
3 |
18 |
17 |
2 |
3 |
|
18 |
|
29 |
|||||||||||||
|
总数 |
616 |
250 |
132 |
118 |
21 |
18 |
77 |
14 |
43 |
107 |
367 |
4 |
81 |
|||||||||||||
|
616 |
616 |
|||||||||||||||||||||||||
上述统计数据中有几种现象颇为有趣:
1. 女性词与男性词优势互有。亲属关系中,女性词在“母系”和“跨系”两类中为多,男女比数为43对87、22对38,男性词的比例只占33%和37%。男性词在“父系”中略多,127对115,比例为52%。辈分关系中,女性词在“祖父辈”“父辈”和“跨辈”三类词中为多,男女词语的比例分别为46对61,163对186,19对34,男性词的比例只有43%、47%、36%。男性词只在“高祖辈”和“平辈”中占优。这种情况表明通常认为父系的称谓词分得细,母系的统称词多的观点不尽正确。男女词语的详略情况,显示出这种详略与和说话人的亲疏关系有一定联系。愈是亲近的关系,称谓词也就相应分得细密。另外可能还由于男性亲属称谓词比起女性亲属称谓词,统一、稳定的程度要高,而女性亲属称谓词因地域文化等因素的影响而显出较大的差异。
2. “父辈”的称谓词最多。辈分愈远的,词语数愈少。无论是在男性词还是女性词都表现出同样的规律。男性词“父辈”、“祖父辈”、“曾祖辈”、“高祖辈”的递增数分别是163∶46∶20∶8,女性是186∶61∶20∶4。这种现象显然与上面说到的亲缘关系的远近有直接关系。
3. 用长辈词来指称“平辈”。这是由于用孩辈的称呼最容易收到尊人谦已的效果,如“大伯爷”指丈夫的哥哥,“大伯娘”指丈夫的嫂嫂(温州),“细叔爹”指“丈夫最小的弟弟”(海口)。“大舅子”“小舅子”“舅老爷”,则用来指妻子的兄弟。“用小辈称呼”,是汉语称谓词中体现民族礼俗文化较明显的一类现象。
三、“单次呈现词”的考察
长辈类亲属称谓词中有432例只出现过一次,占到总词语数的70.1%。下面是对21个点的“单次出现”情况的调查结果:
表4: 单次呈现次
|
方言点 |
总收词数 |
单次出现词 |
单次词之比例 |
例
词 |
|
哈尔滨 |
44 |
12 |
27% |
舅奶、姥儿、老丈眼子、舅姥儿 |
|
西安 |
57 |
29 |
51% |
丈姑娘、姚婆子、姚爸、姑夫爷、外头大人 |
|
太原 |
53 |
21 |
41% |
老奶、姑姥爷、姥娘、妗妗、后爸爸 |
|
|