印地语—英语的语码混合与语码转换研究

2022-05-09 08:04高熙睿
南亚东南亚研究 2022年2期
关键词:语码混用混合

高熙睿

《印度宪法》规定,印地语是印度唯一的联邦级官方语言(Official Language),英语是唯一的联邦级辅助性官方语言(Additional Official Language)。2011年印度人口普查显示,印地语总使用人口占印度总人口比例为57.1%,是目前使用人数最多的本土语(Vernacular)。①总使用人口为以该语言为母语、第二语言和第三语言的人数总和。参见印度人口普查办公室官网:“二语和三语使用的人口统计”,https://censusindia.gov.in/2011census/C-17.html。印度存在本土语—英语混用现象,其中印地语—英语混用是最主要、最典型的。

印地语—英语混用属于语码混合(Code-mixing)与语码转换(Code-switching)的研究范畴,而非“印式/印度英语”①“印式”中的“印”是一个国别概念,指印度共和国。所以“印式英语”与“印度英语”一般等同,本文不做区分,统一称“印式英语”。的英语变体(Variety)研究范畴。印地语—英语混用包括印地语—英语语码混合、英语—印地语语码混合与印地语—英语语码转换等几种类型。研究印地语—英语混用应主要基于印地语语料,而非仅使用英语语料。语码混合指句内转换,即在印地语/英语分句中混入另一门语言的语码;语码转换指句间转换,即在印地语/英语分句后插入另一门语言的分句。笔者以为,以“印式英语”指称整个本土语—英语混用现象是概念谬误。若要用“Hinglish”指称印地语—英语混用,则应译作“印地英语”,而非“印式英语”。“印式英语”指的是英语变体在概念上更接近本文提出的英语—印地语语码混合。

本文主要研究印地语—英语语码混合和语码转换问题,总结客观规律并解释其产生机制。对该机制的认识也适用于研究其他语言中的语码混合和语码转换,可以揭示人类语言语码混合和语码转换的共性。对于指导印地语学习和印地语教学具有重要的实践意义。同时,本文主要选取印度发行量最大的《觉醒日报》(Dainik Jagran)2019年的363篇头版文章作为语料,运用社会语言学和心理语言学理论来解释印地语—英语混用现象。

一、研究现状

此前的研究对“印式英语”形成了路径依赖,但“印式英语”研究既不能揭示混用现象的成因与机制,其观点、结论和意义也值得商榷。“印式英语”的逻辑是基于国家来划分混用现象,其暗含假设多为:印度人所操的英语受母语的“消极”影响,产生了“口音”,妨碍交流。然而,这既不准确,因为缺乏语言学理论支撑;也不正确,因为不符合印度语言生活的基本事实。

“印式英语”研究路径存在的问题有三:(1)核心概念谬误。“印式英语”的基本假设是“印度诸多本土语与英语的混用现象是英语的一种印度变体,且只有这一种变体,所以使用诸多本土语的印度共和国公民,无论操何种母语,他们的英语都具有某些可以上升为‘规律’的共同特征”。上述假设能否成立尚需验证,而验证该假设需要先分类考察印度各本土语与英语的混合现象,再尝试提炼共同特征。若在验证之前就认定假设成立,那么“印式英语”就是概念谬误。这类研究在不明晰其研究对象所操母语的情况下就把它都当作英语变体,最后各自总结出的“规律”必然不尽相同,甚至相左。这恰恰说明其基本假设和研究范式存在问题。(2)强调英语变量,忽略印地语变量。“印式英语”的一个重要假设是“‘印式英语’是受本土语语音和语法影响的变体”,但在论及语音、词汇和语法等“规律”的成因时,却没有任何基于印地语(或其他本土语)的解释变量。基于经验观察归纳变体的语音和语法是一种近似模拟,对二语学习和教学均具有一定的现实意义。但若缺乏印地语变量,即使总结出接近于真实发音的“规律”,也是知其然而不知其所以然,更无法解释其他本土语书面语中的语码混合现象。(3)不符合印度语言生活事实。只停留在国别层面而不细分具体语言,忽略了印度语言的多样性、亲缘性和独特性等因素。印度的本土语分属四个语系,差异大,无法实现完全的族际互通。即便有些语言属于同一语族,发音也不同。英语变体还需假设研究对象为本土语和英语双语者,根据该假设广泛的本土语—英语混用现象意味着要有相应数量的双语者。2011年印度人口普查显示,英语总使用人口占总人口比例仅为10.6%①印度人口普查办公室官网:《2011年印度人口普查》,https://censusindia.gov.in/2011Census/C-16_25062018_NEW.pdf。,该假设与事实不符。即使为本土语、英语双语者,不同的本土语母语者所说的英语也必然会受到各自母语的影响而呈现出不同的特点。譬如孟加拉语和印地语的许多词汇相同,但语音体系并不一样,那么它们与英语的混用语发音也不尽相同,不能将印度西孟加拉邦居民和印地语带居民所操的英语笼统地称作“印式英语”。

二、印地语-英语语码混合的描写

本文选取印度阅读量最大的《觉醒日报》头版(2019年1月-2019年12月),363篇文章,近18万词汇作为印地语语料,经过认真仔细的研读和筛选,选出本文中的例句。本文的所有描写和分析也都是基于这些真实语料进行的。本文把印地语—英语语码混合定义为:采用天城体字母和印地语语法的书面语与英语语码的句内混合;英语—印地语语码混合的定义为:采用拉丁字母和英语语法的书面语与印地语语码的句内混合。英语语码的印地语语码化指拉丁字母被天城体字母以稳定的混合—转换规则转写。印地语—英语的语码混合始于英语语码的印地语语码化,包括由此导致的形位、音位融合与语法规则变化。

(一)印地语-英语语码混合的形态和语义描写

英语语码的印地语语码化是印地语—英语语码混合最大的形态特点。语言实践中存在拼合和缩写,因此需要进一步细分印地语—英语语码混合现象,以研究其形态和语义规律。依据形态变化过程,本文提出将印地语—英语语码混合分为三类:(1)转写型;(2)复合型;(3)缩写型。

在转写型语码混合中,英语语码经历且只经历拉丁字母天城体化过程。从词源看,转写型语码混合就是印地语中的英语词源词和借词,包括普通名词、专有名词、形容词、介词和动名词等词类,故最常见。如:

例句(1)中抽象名词deal(交易)和普通名词pilot(飞行员)分别转写成和词义和成分在语码混合后不变。所以语码混合不改变名词词义。

② 同上。

例(2)中形容词American、专有名词Donald Trump和Tweet转写为与原语义一样。其中较为特殊,由于受到了印地语构词法的影响,词尾是。大部分形容词在语码混合中遵循与上述其他词类一样的转写规则。如:

例(3)中形容词grey和名词coat、pant遵循同样的规则转写为,词义不变。少数情况下,转写型语码混合的语义由于被赋予印度社会、政治、文化内涵而变得丰富,是一个典型例子。该词在《印地语汉语大词典》中释义有二:④(1)大会,国会;(2)国大党。释义(1)保留了英语congress原义,而释义(2)则是印地语的特殊含义,指的是印度国民大会党(The Indian National Congress,简称Congress,国大党)。北京大学东方语言文化系印地语言文化教研室:《印地语汉语大词典》,北京大学出版社2000年版,第321页。在印地语中一般指国大党,而要指“国会、议会”时,一般使用印地语词如例(4)。意为“议会中包括国大党在内的任何反对党”。

第二种是复合型语码混合,由转写的英语语码和印地语语码组成,分为两种:(1)基于词缀;(2)通过构词法。词内混合是使用不同语言词缀的语码混合,即印地语单词与英语词缀混合或者英语单词与印地语词缀混合,产生的是新词。印地语词常借用的英语词缀有②参见戴永明:《英语对印地语词汇的影响》,《解放军外国语学院学报》,2001年第3期,第53—56页。.有许多印地语词汇可以与该词缀混合构成抽象名词、“......主义”和“......者”。但如果已有相同释义的印地语词缀,则该英语词缀使用率不高。譬如,印地语中有和等抽象名词后缀对应抽象名词后缀-dom。表示“......主义”,但在印地语中被后缀替代,一般使用。常用的派生规则还有等后缀,分别表示“......主义”和“以某事为职业的人”,所以在印地语中少见。如表示银行职员,表示法西斯主义。原因有二:首先,使用英语词缀不一定符合表达习惯,他人未必能够懂得新词;其次,造同义新词不经济。因此,上述英文词缀除了外,使用频率并不高。

词间混合的拼合词指英语语码转写后,与印地语固有语码拼合成一个语码,如:

第三种是缩写型语码混合,指经历了缩写和转写等多个过程的混合语码,是最复杂的语码混合现象,分为两类:(1)英语缩写型;(2)印地语缩写型,本文也称为“多重转写式”。英语缩写型指英语语码先按照首字母缩写,然后再将首字母转写成印地语,见下例:

第二类是印地语缩写型,即将印地语语码转写为拉丁字母后缩写,再将该缩写转写为天城体。这种语码混合经历了两次书写系统转换和一次缩写,较为复杂。以最常用的国民志愿服务团为例:

印度人名的缩写也属于缩写型语码混合。比如著名的印度教民族主义者中文译为V.D.萨瓦尔卡。其名和中间名先被拉丁化为Vināyaka Dāmodara,然后缩写取前两个字母V.D.,转写成天城体为所以写作印地语缩写型与英语缩写型形态相同,都是天城体化的拉丁字母缩写,但是一个缩写自印地语语码,一个缩写自英语语码。

此外,有一类缩写语码虽然不含英语语码,但是却借鉴了英语缩写型的形态变化方式,本文称为“迁移式缩写语码”。迁移式是印地语语码仅保留每个单词首音节,而后拼合。这类语码数量不多,但都很常用,多见于政治领域,如:团结进步联盟等。团结进步联盟全称是取每个印地语单词的首音节取

缩写型语码混合是印地语二语学习的一大难点。首先,词典几乎不收录等缩写词汇。其次,就基于英语语码的缩写型语码混合而言,诸多二语学习者多无法意识到这是英语语码的印地语转写,而会将其当作印地语词源词。即便识别出这是英语语码的天城体转写,要准确推断其全称并了解其释义,仍需要较大的印地语词汇量、较高的印地语与英语水平和对印度社会的充分了解。对于基于印地语的缩写型语码混合,读者往往能意识到是某些拉丁字母缩写的转写,但若要知道具体的拉丁字母的全称、转写自的天城体全称,则需要读者本身就掌握该名词,否则无法读懂。难以拆分是学习迁移式缩写型语码的难点,不同于基于英语和印地语的缩写型语码混合,迁移式整个语码的各个音节之间没有明晰的分界,不像前面两种可以通过读来分辨出是哪些拉丁字母的转写。迁移式只能把每个音节都拆分出来,但推测其全称仍相当困难。因此,缩写型语码混合需要大量的语言积累和较好的语感来辨别和掌握。

(二)印地语—英语语码混合的语音描写

形态转换导致了语音转换,拉丁字母的天城体字母化是印地语—英语语码混合后出现形位和音位融合的原因,也是所谓“印式口音”的来源。印地语对英语发音的这种影响(口音)不是随意而消极的,也不是天生的说话方式,而是有内在逻辑的严格发音体系,即天城体字母。

(三)印地语—英语语码混合的语法描写

若基于某种语码所作的句子成分同时存在于英语和印地语语法体系中,那么印地语—英语语码混合不改变该语码词性,譬如动词、名词、形容词。印地语很少借用英语中的不定式和分词,而多借用动词原形。英语动名词可以作主语、宾语、表语、定语与补语,但进入印地语中不能作这么多成分。①参见殷洪元:《印地语语法》,北京大学出版社1993年版。印地语—英语混合语码会被赋予阴阳性和尊称用法。印地语—英语混合语码一般默认为阳性单数名词。如例(6)中的,句中前的是,说明tape在语码混合后是阳性名词。同理,,因此bedroom在语码混合后也是阳性名词。又如:

印地语—英语语码混合的第一个词法特征是英语语码借用印地语构词法。例如,英语语码与后缀构成形容词。印地语—英语混合语码(美国的),是由America转写成,再变为后缀。印地语—英语语码混合的第二个词法特征是英语语码遵守印地语的屈折变化规则。例如,名词进入印地语后有复数和复数带后形式的屈折变化。如例(6)中是file的混合语码,说明是复数,说明是阴性。因此的屈折变化遵守了印地语以结尾的阴性名词变化规则,在词尾加复数带后形式的屈折变化见下例:

此外,当英语语码是复数名词时,混合进入印地语后保留复数名词“s”的词尾,无需变为复数带后形式。例如,这种混合所遵循的混合—转换规则与其他转写型语码混合相同。

除了阴阳性、尊称用法、构词法、复数及复数带后形式的变化,印地语—英语语码混合的另一个特点就是英语语码与印地语语码混合构成静动词④印地语中的静动词由表示主要语义的表义部分()和赋予静动词以动词特征的动词部分()两部分组成。其中,表义部分是英语语码,而动词部分仍是印地语语码。,属于复合型语码混合。如例(5)中的(不会做任何交易)。静动词的原型是是deal(交易)的转写,为表义部分;(做)是印地语语码,为动词部分,整个静动词表示“做交易”。又如例(13)中的表义部分是即英语语码receive,动词部分是整个静动词的含义是“收到”。又如例(14):

三、印地语—英语语码转换的描写

此前的研究没有注意到混用语存在书面语与口语的区别,事实上二者差别较大。标准印地语书面语由天城体书写,因此英语语码要转写,而口语中的英语语码不需要转写为天城体,只要基于对应规则直接完成音位转换,故需要区分二者。印地语—英语的句间转换(语码转换),相较于语码混合,鲜见于书面语,基本上只出现在口语中。句间转换—语码转换—口语存在对应关系,可以相互推导,这是由语言经济原则决定的。

(一)印地语—英语语码转换的形态和语义描写

印地语—英语语码转换与印地语—英语语码混合的最大形态差别在于语法,前者分句基于各自语法,而后者基于印地语语法。印地语—英语语码转换无语义变化。如《三傻大宝闹莱坞》里的一个对话轮,见例(15):

例(15)属于典型的印地语—英语语码转换对话,其中属于语码转换的分句有:a中的“Sorry sir”,b的“Sorry sir,emergency!”,c的“Settle down there!”,d的“Sir,they’re still writing”,e的“Hello! Time up!”,f的“It was an emergency,sir,please,please!”,j的“Sir please,sir!”以及l的“I will not accept your papers.”。

但语码转换和语码混合往往一起出现,本对话轮中的印地语—英语语码混合有:a中的对比发现,印地语—英语语码混合是以单词为单位的英语语码嵌入了印地语句子,书写系统发生变化,而语码转换则是在一个对话轮中英语分句和印地语的交替使用。

(二)印地语—英语语码转换的语音描写

印地语—英语语码转换很少进入书面语,意味着基本无需转写。但是,其语音特点与语码混合是一致的,因此当需要时也可以按照混合—转换规则进行转写。不具备印地语知识的受众之所以常将印地语—英语语码转换误认为英语变体,是因为印地语—英语语码转换中某些英语分句和英语语码的混合语码激活了受众的英语心理词典,且语码混合与语码转换不改变含义,因此可以理解。但是一般受众没有印地语心理词典,无法理解其中的印地语语码,又不了解天城体字母的语音体系,所以将音位融合误解为“口音”。因此,受众对于印地语—英语语码转换常产生“能够听懂一部分”或者“他/她在说英语”的感觉,但无法理解整段对话。

(三)印地语-英语语码转换的语法描写

印地语—英语语码转换中,英语分句和印地语分句分别按照各自的语法进行组织。印地语—英语语码转换的最小单位是句子,包括主句、从句、分句和整句,一般逗号、分号、句号、冒号、引号、从句引导词等可以满足语码转换的条件。印地语—英语语码转换不改变语码的词性。

此外,印地语的直接引语转换间接引语不改变从句中的人称,与英语不同。例如,直接引语从句主语都是第一人称。而英语直接引语The boy said,“I shall go.”变为间接引语则是The boy said that he would go.,从句主语从第一人称改为第三人称。因此,印地语—英语语码转换需要按照直接引语还是间接引语使用对应人称。

四、印地语—英语语码混合与语码转换的规律

印地语—英语语码混合与语码转换的规律可以从拼写和形态、语音以及语法等方面来总结。

(一)拼写和形态规律

相比于其他语言的语码混合,转写是印地语—英语的语码混合的规律。譬如汉—英的语码混合,拉丁字母进入中文时书写系统不会发生变化。例如:

(16)中日韩将积极推动2020年如期签署RCEP。①王雨萧、陈炜伟:《中日韩将积极推动2020年如期签署RCEP》,《人民日报》,2019年12月23日,第3版。

英语语码“RCEP”在与汉语语码混合后,仍然用拉丁字母拼写;但与印地语混合时,“RCEP”需要用天城体字母转写为R、C、E、P四个字母分别转写为对应字母印地语—英语语码转换中拉丁字母和天城体字母的对应关系是相对稳定的,同时,其形位和音位融合的规律也是相对固定的。

因此,单个词素、单词和词组的句内转换多见于书面印地语,而以分句为单位的句间语码转换多见于口语,语言的经济原则决定了这种分野。天城体化是一种形位融合和音位融合,但还没达到借词的程度,停留在临时借用阶段。

(二)语音规律

印地语—英语语码转换与语码混合的拼写和语音规律如表1和表2所示,其高频元音、辅音与天城体字母之间有稳定的混合—转换规则。绝大多数的英文词在混合进入印地语时,都满足上述对应关系。当有新词进入时,可以依据下列混合—转换规则来转写和预测。因此,表1和表2就是印地语—英语语码转换与语码混合的语音规律,是印地语—英语混用现象的语音根源。

表1 印地语—英语语码混合、语码转换中高频元音混合-转换规则表(部分)

表2 印地语—英语语码混合、语码转换中高频辅音混合-转换规则表(部分)

因此,所谓“印式口音”是一整套规范完整的天城体字母发音模式,具有基于语码混合和语码转换的稳定对应规则。语码混合是原因,“印式口音”是结果。印地语—英语语码混合与语码转换的发音是根据印地语天城体字母拼写发出的,经历了拼写的本土化过程,导致了音位融合。这是印地语—英语混用带来的语音变化,不以使用者为转移,任何会印地语的人(无论国籍)照着上述发音模式读出来都是所谓“印式口音”,因此不能称之为真正的口音。寻找音位融合的规律要从源头即语码混合的内在逻辑和规则上去寻找,而不是基于音位融合本身去直接归纳,这是因为此前的解释忽略了考察印地语变量。

对于整个印度的印度本土语—英语混用实践,其逻辑就是语码混合、语码转换对应规则的稳定性和对应本土语字母系统的发音,例如婆罗米字母。若要提炼“印式英语”的规律,应当在明晰了印度各本土语与英语语码混合与语码混用的具体规律后,再考察其共性,以此作为规律。

(三)语法规律

印地语—英语语码混合主要遵守印地语的语法,而英语—印地语语码混合则遵守英语的语法,印地语—英语语码转换是两种语言的分句交替使用。如果一个语码所作的句子成分在英语和印地语语法体系中都存在,那么印地语—英语语码混合不改变其词性。

印地语—英语混合语码会被赋予阴阳性和尊称用法。区分阴阳性的一个规则是结尾尾音。如果是辅音、结尾,那么一般是阳性名词,例如和如果是结尾,则一般是阴性名词,例如该规则与印地语语法一致。因此,混合语码阴阳性的选择可能参照了印地语语法。

当没有词形、人称、自然性别等判断阴阳性的标准时,英语混合语码的阴阳性规律可以借鉴与该英语词汇相对应的印地语词汇的阴阳性。例如,常被用作阴性名词,不是因为词形,而是因为process对应的印地语是阴性名词。这也是导致英语外来名词阴阳性用法混乱的主要原因——标准不一。比如class,从词形规律考虑是阳性,从对应词考虑是阴性。

英语语码借用印地语构词法是印地语—英语语码混合的第一个词法特征。英语语码使用印地语的复数、复数带后形式等屈折变化规则是印地语—英语语码混合的第二个词法特征。印地语—英语语码混合还有一个特点就是英语语码与印地语语码混合构成静动词,属于复合型语码混合。

(四)连续统理论解释

印地语母语者的混合语言实践位于印地语、印地语—英语语码混合、印地语—英语语码转换、英语—印地语语码混合和英语的连续统上,如表3所示。印地语—英语语码混合的主导语言是印地语,整体采用印地语语法与印地语架构,其使用的印地语语码比例越高,越接近纯正印地语(),反之亦然。印地语—英语语码转换的主要形式是对话中交替使用印地语和英语分句。其中,英语分句主导语言是英语,采用英语语法。英语书面语中混有拉丁字母转写的印地语词汇,本文称为英语—印地语语码混合,多见于印度英语报纸。

表3 印地语—英语混用现象的连续统

从连续统角度看,口语中的语码转换建立在语码混合的基础之上,只是另一种语码比例更高的语码混合,以至于其比例达到了采用另一种语法来组织分句的程度。语码比例继续增加就由两种语言的交替使用变为两种语言的语码混合。

依据本理论,可进一步得出结论,对于大多数印欧语系的印度本土语来说,它与英语混用的语言实践都可以用连续统理论来解释。也即,该种本土语与英语的混合实践都位于本土语、本土语—英语语码混合、本土语—英语语码转换、英语—本土语语码混合和英语的连续统上。如果一个人使用的本土语语码在总语码中比例越高,他所操的语言就越接近于纯正的本土语;相反,如果英语语码所占比例越高,就越接近于英语。只有当一个人的语码基本上100%都是英语语码,那么他才是在说英语,否则就处在印度本土语—英语的语码混合与语码转换之中。

五、结论

本文首次提出印地语—英语混用位于印地语语码和英语语码的连续统上。印地语—英语语码混合与语码转换存在稳定的转写对应规则。由于印度语言众多,“印式英语”是概念谬误。需要使用“Hinglish”来指称印地语—英语混用现象,应译为“印地英语”。印地语母语者所操混合语的发音特点不是口音,而是基于转写对应规则的天城体字母发音,不以使用者为转移。印地语—英语的混用现象来自印地语本身的混合特性。随着印度现代化进程的推进和对外交流的增加,英语新词汇会不断通过语码混合或转换进入印地语,而印地语词汇也会通过英语—印地语语码混合被英语吸纳。因此,掌握其稳定的对应转写规则对于理解新混合语码、消除交流障碍和指导印地语学习具有重要的现实意义。

猜你喜欢
语码混用混合
混合宅
双环磺草酮与吡嘧磺隆混用对稻稗的防治效果试验
一起来学习“混合运算”
语码转换探究——以情景喜剧《爱情公寓》为例
“口”“ㄙ”偏旁混用趣谈
论中英微小说语码混用现象
哈萨克民族药塔斯玛依混用辨析
报章语码转换与城市休闲文化——以杭州为例
混合所有制
高速公路客货混用复式收费系统设计