基于语料库的中日同源成语历时通用度考察

2020-09-10 07:22杨晔刘慧
今古文创 2020年27期
关键词:语料库

杨晔 刘慧

【摘要】关于汉、日语中的同源成语的研究已有相关研究成果。但关于某一特定来源的成语的研究鲜有涉及。而关于同源成语的研究中,其使用情况调查主要从共时的角度进行词频对比,但缺少历时考察。本文利用语料库检索和通用度概念及计算公式,对源于佛教领域的同源成语在古、近代汉日语中的使用情况进行考察。研究发现:中日两国在同源成语的使用偏好上存在一定的差异。据此,从量化和历时的角度把握同源成语在汉日语中的分布和使用特征。

【关键词】语料库;同源成语;历时对比;通用度

【中图分类号】H136           【文献标识码】A           【文章编号】2096-8264(2020)27-0084-03

基金项目:黑龙江省经济社会发展重点课题(项目编号:WY2019020-A)。

一、引言

日语中的许多成语追溯其本源,是来自中国古代汉语,如“朝秦暮楚”“落花流水”等(冯峰2002:115)。值得注意的是,在中国的成语中,有相当一部分源于佛教,有学者认为:研究成语,就不能不研究举足轻重的佛教成语(梁晓虹 1994:87)。由此笔者推测,中日同源成语中存在来源于佛教的成语。

目前学界关于中日同源成语的研究,均是针对与佛教无关的同源成语的定性研究。主要有两个方面:一是关于同源成语意义异同类型的研究,主要分为基本相同、有相同部分也有差异以及基本不同这三种情况来进行讨论(冯峰 2001);二是关于同源成语词义变化原因的研究(冯峰 2002;吴聿凡 2014 )。

纵观先行研究,可以看出,尚未有关于源于佛教的中日同源成语的研究。并且现有研究主要聚焦与共时的词义对比;缺少历时角度的定量研究。由于成语的历史性比一般语词更强,有必要从源和流两方面来考察成语的发生、发展和演变的历史与现状。

本文从历时的角度,以来源于佛教领域的中日同源成语(后文以“同源成语”形式出现)为研究对象进行考察,并通过分析各中日同源成语在古、近代汉日语中的通用程度,总结出同源成语在古、近代汉日语中的使用情况。据此,通过定量统计同源成语在汉日语中的历时分布和使用特征,进一步明确同源成语量化结构特征。

二、研究对象与研究方法

(一)研究对象

本文以朱瑞玟《佛教成语》(2003)和森章司『仏教がわかる四字熟語辞典』(2008)中收录的佛源成语为研究对象。由于以上两类词典主要对佛源成语中蕴含的佛教意义进行了解释,而对于其在汉日语中世俗意义的解释并不详尽,因此,另外选取中国佛教文化研究所《俗语佛源》(1993)和森章司『国語のなかの仏教語辞典』(1991)作为参照语料,从中选出16个同源成语(参见表1,表中空白处表示该日语词例与中文词例字形完全相同)。

(二)研究方法

本文利用陕西师范大学历史文化学院研发的汉籍全文检索系统4.20版和国立国语研究所制作的『日本語歴史コーパス』2019.3版  ,对抽取出的16个同源成语进行检索。汉籍全文检索系统收录了包括从先秦到民国时期的文史哲类文献,『日本語歴史コーパス』2019.3版收录了从奈良时代到大正时代的文史类文献。以上两种语料库所收入文献时间跨度大,利于广泛考察中日同源成语在古、近代汉日语中各个时期的使用情况。

其次,在同源成语频次的处理上,本文采用通用度概念及计算方法。通用度是词语在语言应用的各个领域里常用综合指标,可以将词语的分布率和频率两方面有机结合(尹赋庸,方世增 1994:71)。计算公式假设将全部语料分成k组,某一个词在1,2……k组的出现次数分别为n_1,n_2……n_k,那么该词的通用度值为:

T=(√(n_1 )+√(n_2 )+…+√(n_k ) )^2∕k

通用度值越大,说明該同源成语在语言应用的各领域中分布越均匀,通用程度高,可以推断该词语较为常用。通用度值越小,说明该词语在语言应用的各领域中分布越不均匀,通用程度低,可以判断该词语的使用范围有一定局限性,使用频率相对较低。

三、中日同源成语历时通用度考察

(一)汉语中的历时通用度考察

利用汉籍全文检索系统,按照时代顺序,检索出16个同源成语在汉语文献不同时代中的频数。根据同源成语在语料库中各时代的分布情况,将古、近代汉语语料按年代分为“隋唐五代”“宋辽金”“元”“明”“清”“民国”等进行考察,计算出各同源成语的通用度值,按照数值大小进行排序(参见表2)。表2显示的是同源成语在各年代汉语语料中的分布和使用频数。由表2可看出,各同源成语在古、近代汉语中的通用程度存在一定差异。该差异表现为同源成语的通用度值各不相同,在表2中,通用度值最大(值为184.539)的成语为“心猿意马”,通用度值最小(值为1.167)的成语为“以心传心”。从数值来看,“心猿意马”在古、近代汉语中的通用度值约为“以心传心”的158倍,说明“心猿意马”在古、近代汉语中的通用程度远比“以心传心”高,同源成语之间的通用程度差异之大。

另外,由表2可得,同源成语的最大通用度值的数值范围大于100,最小通用度值的数值范围小于10,为进一步分析各同源成语在汉语中通用程度的高低,根据表2中同源成语的通用度值大小,将其分为以下四个层次:通用度值大于100;通用度值在40至99之间;通用度值在10至39之间;通用度值在9以下,具体词例参见表3。以上对同源成语所划分的四个层次类别,一定程度上反映了同源成语在汉语中通用程度的高低。

从以上通用度值划分出的四个类别来看,通用度值大于100的同形佛源成语在古、近代汉语各时代的文献中,分布广泛且均匀,通用程度高,为常用词的同源成语数量较少;通用度值在40至99之间的同源成语在古、近代汉语中较为常用的同源成语数量仍较少;通用度值在10至39之间的同源成语的通用程度偏低,使用范围有一定的局限性,在古、近代汉语中较不常用。另外,表中通用度值最低的同源成语“以心传心”,只在隋唐五代这一组语料中出现,其余各年代均为0,说明该词在古、近代汉语中的分布极不均匀,使用范围上有很大的局限性,在古、近代汉语中不常用。笔者推测,造成同源成语在古、近代汉语中通用程度各不相同的原因与其词义变化程度有关。

在汉语实际使用中,一些同源成语保留原始教义,如:“以心传心”。而有些词义发生了转义。转义大多为由法义转为俗义,即从成语所表达的晦涩的佛法教义转变为易解的日常语义(张春蕾 2020:105)。在该过程中,各同源成语在古、近代汉语中的使用频数和分布范围也逐渐拉开距离。以“心猿意马”和“以心传心”为例。

“心猿意马”原为佛教用语,《大日经·住心品》中分析六十种心相,其中之一为“猿猴心”,指躁动散乱之心犹如猿猴攀缘不定,不能专注。“意”则犹如奔马,形容追逐外物,故称“意马”。佛家把“心猿意马”视为入定修道的障碍(俗语佛源 1993:69)。后来用“心猿意马”形容人的心思流动散乱,安静不下来。“心猿意马”的词义在汉语中实现了由佛教义向常用义的转变。

“以心传心”在《汉语大词典》(1997:1085)中的解释为:佛教用语,指传授禅法的一种特殊方法,即离开语言文字,以慧心相传授。笔者查阅国家语委现代汉语语料库,对“以心传心”一词进行检索,发现该词并未被收录。另外,查询北京大学CCL语料库发现,“以心传心”在现代汉语中常与“不立文字”一起搭配使用,作为禅宗教义表示不依靠文字,以心传授佛法之意。由此可见,“以心传心”不论是在词典还是实际使用中,该词一直保留其佛教义且词义未发生变化。

综上,可以看出,词义发生转义的同源成语在汉语中的通用程度高于词义未发生变化的同源成语。由此可以推断,同源成语的语义变化对其在汉语中的通用程度高低有一定影响。

(二)日语中的历时通用度考察

利用国立国语研究所『日本語歴史コーパス』,将语料按年代分为“镰仓时代”“室町时代”“江户时代”“明治时代”“大正时代”“昭和时代 ”等,检索16个同形佛源成语,并计算出每个词的通用度值。按照其通用度值大小,將同源成语分为以下四个层次,以便直观地考察各同源成语通用程度的高低:通用度值大于100;通用度值在1至99之间;通用度值在0至1之间;通用度值为0。

通用度值大于100的同源成语仅见「亀毛兎角」一例,通用度值在1至99之间的同源成语为「自由自在」「自業自得」「三千世界」「石火電光」,与通用度值在1以下的同源成语相比,通用程度偏高;通用度值在0至1之间的同源成语为「六根清浄」「意馬心猿」「不即不離」「唯我独尊」「以心伝心」,在古、近世日语中通用程度偏低;通用度值为0的同源成语为「水到渠成」「頭頭是道」「先因後果」「拕泥帯水」「単刀直入」「超凡入聖」,在16个同源成语中数量最多,说明较多数同源成语在古、近世的日语文献中使用范围极为有限,可能仅作为佛教专用语存在于汉译佛经中,不被人们所熟知和使用。由此看出,与汉语相比,同源成语在古、近代日语中分布不均匀且整体使用率偏低。

为考察同源成语在日语中的词义变化与其在日语中的通用程度的关系,笔者查阅以上16个同源成语在《广辞苑》第6版和《日本国语大辞典》第2版中的词典释义发现,在古、近代日语中通用度值为0的同源成语大多在词典中只保留其佛教基本义,即日语在接受和传承这些同源成语时,词义未发生变化,如「水到渠成」「頭頭是道」「拕泥帯水」「超凡入聖」等。在日语中通用程度高和较高的同源成语按其词典释义可以分为两类:1)在日语中有多种表达形式,如「亀毛兎角」「三千世界」。2)在词典中有多个义项,即在保留佛教基本义的基础上增添新义,如「自業自得」「石火電光」。由此可见,在古、近代日语中通用程度较高的同源成语,不论是表达形式还是语义,均变化较多;而语义自古至今只保留佛教义的同源成语,其通用程度较低。

综上,在古、近代汉日语中均有通用程度高(通用值大于100)的同源成语,且在古、近代汉语中数量较多;同源成语整体在古、近代汉语中均衡分布(通用程度高和偏高的比例占43.75%,通用程度低和偏低的比例占56.25%),在古、近代日语中呈现出两极分化的特点(通用程度高和偏高的比例占25%,通用程度低和偏低的比例占75%);汉日双语料库中通用程度高和低的同源成语不尽相同,如“龟毛兔角”在古、近代日语中的通用程度高,但在古、近世汉语中的通用程度较低。“超凡入圣”“拖泥带水”在古、近代汉语中的通用程度较高,但在古、近世日语中的通用程度低。由此可以看出中日两国在古、近代时期在同源成语的使用偏好上存在一定的差异。另外,从语义变化的角度对同源成语的通用程度进行考察发现,通用程度高的同源成语,其词义在汉日语中发生了由佛教义向通俗义的转变,通用程度低的同源成语在汉日语中多数仅保留其佛教基本义,词义未发生变化。由此推测,同形佛源成语在汉日语中的语义变化对其通用程度的高低有一定影响。

四、结语

本文利用汉日语料库和通用度概念及公式,以通用度值的相对大小对来源于佛教领域的中日同源成语在古、近代汉日语中的通用程度进行分析,考察了中日同源成语在古、近代汉日语中的使用情况。通过同源成语历时通用度的考察,一定程度地展现了中日两国在同源成语使用偏好上的差异。并初步推测同源成语的语义变化,影响其在汉日语中的通用程度。在今后的研究中,将继续利用语料库,并引入更多语料对同源成语的词义和感情色彩等方面进行进一步的对比研究,找出同源成语在中日两国的异同。

参考文献:

[1]冯峰.中日同源成语意义的异同[J].日语学习与研究,2001,(3).

[2]冯峰.中日同源成语的比较研究[J].清华大学学报(哲学社会科学版),2002,(12).

[3]新村出.广辞苑第六版[M].岩波书店,2008.

[4]梁晓虹.佛教词语的构造与汉语词汇的发展[M].北京:北京语言学院出版社,1994.

[5]罗竹凤.汉语大词典(缩印本)[M].上海:汉语大词典出版社,1997.

[6]森章司,小森英明.仏教がわかる四字熟語辞典[M].東京堂出版,2008,(8).

[7]森章司.国語のなかの仏教語辞典[M].東京堂出版,1991,(9).

[8]吴聿凡.中日同形异义四字成语的对比研究[D].长春:吉林大学,2014,(4).

[9]尹斌庸,方世增.词频统计的新概念和新方法[J].语言文字应用,1994,(5).

[10]中国佛教文化研究所编.俗语佛源[M].上海:上海人民出版社,1993.

[11]张春蕾.佛源成语的现实转义与跨文化交际[J].南京晓庄学院学报,2020,(3).

[12]朱瑞玟.佛教成语[M].上海:汉语大词典出版社,2003.

作者简介:

杨晔,女,博士,哈尔滨理工大学副教授,研究方向:语言学。

刘慧,女,哈尔滨理工大学2018级日语语言文学专业,硕士研究生在读。

猜你喜欢
语料库
语料库辅助英美文学教学模式初探
可比语料库的建立及翻译教学研究
基于语料库翻译学的广告翻译平行语料库问题研究
护理英语语料库建设探索
如何利用语料库语言学提高英语教学
浅谈语料库分类及用途
近5年语料库应用于外语教学的研究综述
国内外语料库建设研究简述
运用语料库辅助高中英语写作
关于“nothing succeeds without a strong will”的语料库研究