面向自然语言处理的英语中旬蜕现象研究

2019-12-16 01:48雷树杰
电脑知识与技术 2019年29期
关键词:英语

雷树杰

摘要:英语中存在很多从句和非谓语现象,这类复杂的语言结构为机器处理语言带来了较多困难。通过总结概念层次网络(hierarchical network oFconcepts,HNC)中的句蜕理论,并用这种句蜕理论来分析英语中的句蜕现象,将英语中的句蜕现象的知识和不同于中文的特点加以总结,得到了很多新的发现。该研究不仅将英语中的句蜕现象进行了总结,其分析结果还有助于将这类复杂现象进行形式化,从而帮助机器分析和处理语言,尤其是从句和很多非谓语现象这类复杂的结构。

关键词:HNC;英语;句蜕现象

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2019129-0253-03

1概述

句法分析是自然语言处理(Natural Language Processing,NLP)中非常重要和基础的任务。对一个句子的语义进行理解就必须对句子的句法结构进行正确的分析,从而一定程度上消解句子的歧义现象。而在语言中,存在大量的省略、多义和嵌套现象,这为正确分析句子提出了挑战。

语言中的嵌套现象是由于语言的递归性导致的,即一个句子成为另一个句子一部分。如果不能正确处理句子中的嵌套现象,就不能对一个句子做出正确地分析和理解。而一个句子成为另一個句子中的一部分有多种形式,可以是直接以原句子的形式进行嵌套,也可以是原句子变换一下形式后嵌套。为了处理语言的嵌套现象,HNC理论提出了句蜕理论。

HNC理论最初是针对汉语提出的一套体系,但由于其建立在概念层面,因而能很方便地迁移到其他语言中。本文将HNC理论迁移到英语中,并针对英语中的“句蜕”现象进行研究,从而为英语的自然语言处理提供支持。本文的研究方法可以很方便地迁移到其他语言中去。

2句蜕介绍

句蜕是概念层次网络理论中一个十分重要的现象。要了解句蜕,必须先了解语义块的概念。语义块也是HNC理论中的一个概念,其是指句子的下一级语义构成单位,其可以分为主语义块(句子语义必要的、主干的部分)与辅语义块(句子语义次要的、可选的成分)两类。而句蜕是指一个句子蜕化为语义块或语义块的一部分,其是语义块复杂构成的特殊形式。一般而言,大多数语言中都存在有句蜕现象。

句蜕有两种基本类型,即原型句蜕与要素句蜕。原型句蜕是指在句蜕现象中,一个句子蜕化后仍保持原来的形式,形式上和原句相同。如,在“钱学森说他爱中国”这句话中,这个句子的JK2就是由句子“他爱中国”蜕化而来,但形式上却与原句相同,是为原型句蜕。而要素句蜕是指以某个语义块要素为中心语,其他语义块为修饰语的句蜕,其中,以广义对象语义块为中心语的要素句蜕称为JK要素句蜕,以特征语义块要素为中心语的要素句蜕为EK要素句蜕。如,在“老师讲了爱中国的钱学森的故事”这句话中,这个句子的JK2是由句子“钱学森爱中国”蜕化而来,,蜕化后原句的JKl(钱学森)成为语义块的中心语,另外两个语义块JK2(中国)与EK(爱)成为修饰部分,该句为JK要素句蜕。此外,在“老师讲了爱中国的钱学森的故事”这句话中,还加了“的故事”这样一个部分,像这种在基本句蜕的前面或后面加上别的成分的现象叫作包装句蜕。其中,原型句蜕加包装成为原型包装句蜕,要素句蜕加包装称为要素包装句蜕。

句蜕现象的普遍存在为自然语言处理带来很多困扰,这是因为当存在句蜕现象时,要对一个句子进行正确的理解,就必须把句蜕当作一个句子来分析和理解,而不能仅仅作为一个定中之类的短语结构来分析和理解。只有这样,机器才能对句子结构有一个正确的分析,从而正确分析出其表达的含义。

3英语语言特点

HNC理论是黄曾阳先生针对中文提出的一套理论,但由于其上升到了概念层次,而不是局限于一个一个的词,因此,该理论可以很方便地迁移到其他语言当中,当然要根据语言特点做一定程度的修改和调整。

对于英语来说,其规则性要比中文强很多,笔者总结主要有以下几点。

一是英语的词汇之间用空格进行了分割,这样的语言特点使得英语的分词任务相对于中文来说要简单很多,其主要的着力点在于对于一些符号的处理,如“.”在文中究竟是省略形式的一部分还是句子之间的分界线。而作为自然语言处理的第一步而言,分词任务的影响不仅仅在于该任务本身,还在于分词的准确程度会直接影响到后续任务的开展。这是由于在很多时候,自然语言处理任务是一个线性流程f当然也有一些例外),而作为自然语言处理的初始任务的分词,其影响会当然地带到后续处理过程中。

二是英语存在时态和数的概念。英语中的动词会随着事件发生的时间的不同而产生形式上的变化,这虽然为学习语言带来的很多困扰和不变,但对于机器处理语言而言,这种形式上的变化其实已经将句子内涵的一些信息外显出来了。数的现象也同样如此。

三是英语中的从句一般要加从属连词,名词前也存在“the”“a”这样的标记符号。这种从属连词对于计算机而言是一种信号,可以辅助机器对语言做出正确的理解,而在中文中则不存在这种类型的标记符号。当然,在英语中,从属连词有时也可以省略,从句也可以转化为非谓语形式,这种变化上的灵活性也为机器处理语言带来很大的不确定性。

这些特点都对HNC理论向英语中的迁移带来了不同于中文的变化。其中非常重要的一个特点就是,无论是词汇用空格进行分割、存在时态和数的概念还是从句与名词前标记符号的出现,都使得英语相对于中文而言要更加形式化。对语言的理解,很大程度上取决于对句子结构的分析,而英文这样形式化强的语言,为句子结构的分析带来了很多方便之处。而HNC理论就是将模糊的语言加以形式化,正如HNC理论的创立者所说“HNC理论的目标是,以概念联想脉络为主线,建立一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式,使计算机获得消解模糊的能力。”英语形式化较强的特点使得英语在使用HNC理论方面要更加方便,我们从下文的英语中的句蜕现象的分析中就可以看出来。

4英语中的句蜕现象

句蜕现象的出现归根结底是由于语言的嵌套性所导致的。在英语中,同样存在着原型句蜕与要素句蜕两种现象。

4.1英语原型旬蜕

原型句蜕举例如下:

(1)My opinion is that you should work hard.(我的意见是你应该努力工作。)

(2)That he will come to our village tomorrow surprises us all.(他要来我们村,让我们都感到很惊讶。)

(3)When it rains,I usually go toschool by bus.(下雨时,我通常坐公共汽车去上学。)

(4)if he comes tomorrow,you will see him.(如果他明天来,你就可以看到他了。)

(5)It is very lucky that he doesnt come.(他没来真是太幸运了。

(6)He said that he was going to quit.(他说他想退出。)

从上述例子中可以看出,英语中的原型句蜕现象通常存在于主语从句(2)、宾语从句(6)、状语从句(3,4)、表语从句(1)和形式主语结构(5)中。其中,在主语从句中,则一般通过加连词“that”来进行转化;在状语从句中,则一般通过加连词“how”、“when”等来进行转化;在表语从句和宾语从句中,一般是通过加连词“that”加以转换,但宾语从句和表语从句中的连词往往可以省略;在形式主语结构中,“it”作为形式主语指代后面的不定式结构或从句,在指代从句的情况下,为原型句蜕,在指代不定式的情况下,为下面要讲的要素旬蜕。

在状语从句中,英语原型句蜕一般作为辅语义块,而在其他几种情况中,英语原型句蜕一般作为主语义块。这是英语中原型句蜕现象的句类知识。

4.2英语要素句蜕

除了原型句蜕,英语中同样存在这要素句蜕现象。要素句蜕举例如下:

(7)I think we can leave with our heads held high.(我们可以昂首离开。)

(8)With you to lead us,our group is sure to succeed.(有你帮助我们,我们团队一定会成功。)

(9)I am glad to have seen your mother.(见到你母亲我很开心。)

(10)Seeing nobody at home,she decided to leave them anote(见家里没人,她决定给他们留一张便签。)

(11)Their coming to help was a great encouragement to us.(他们的到来和帮助对我们而言是一个巨大的鼓励。)

(12)She hates people losing their mind.(她痛恨人们丢失了理智。)

(13)He sat there thinking,with his chin on his hand.(他坐在那儿沉思,她的脸颊支撑在手上。)

(14)With you helping me,I feel very obliged to you.(你幫助了我,真是太感激你了。)

(15)Theboyswho are playing football arefromClassOne.(踢足球的男孩们是一班的。)

(16)Football is a game which is liked by most boys.(足球是一项大多数男孩喜欢的运动。)

从上述例子中可以看出,英语中的要素句蜕以非谓语结构(9,10,11,12)、独立主格结构(7,13,14,8)和、定语从句(15,16)为主。在非谓语结构中,通过使用动名词结构或者不定式结构,从而将句子转化为句蜕块,其通常是EK要素句蜕。如在例9与例11中,就是将“I have seen your mother”与“They come tohelp us”转化为相应的“to have seen your mother”与“Their com-ing to help”,进而将句子转化为句蜕块;在独立主格结构中,通过“with”与非谓语形式(或者其他形式,如“名词+名词”,“名词+副词”,“名词+过去分词”等),将句子转化为句蜕块。如在例7中,就是将句子“Our heads are held high”通过“with+名词+过去分词”形式,转化成了句蜕块,在例13中,就是将句子“His chinis on his hand”通过“with+名词+介词短语”的形式,转化成了句蜕块,为EK要素句蜕;在定语从句中,通常通过加入关系词(关系代词或关系副词),从而将句子转化为定语从句形式的句蜕块。如在例15与例16中,就是将“Boys are playingfootball”与“A game is liked bv most boys”这两个句子,通过加关系词“who”与"which”的形式转化为句蜕现象。这一点与中文相似,虽然英语的定语从句中保留了原来句子的成分,但转化为定语从句后,句子的中心语发生了变化,变成了先行词,这样就构成了JK要素句蜕。

在非谓语结构中,英语要素句蜕一般为主语义块,而在独立主格结构中,英语要素句蜕一般为辅语义块。在定语从句中,英语要素句蜕也一般为主语义块。这是英语中要素句蜕的句类知识。

4.3英语包装句蜕

此外,英语中也存在包装句蜕现象。包装句蜕举例如下:

(17)The news that he will leave for Shanghai is true.(他将要去上海的消息是真的。)

(18)They were delighted at the news that their team had won.(当听到他们的球队赢了的消息时,他们欣喜若狂。)

(19)I have no idea what color she wants.(我不知道她想要什么颜色。)

从上述例子可以看出,英语包装句蜕主要存在于同位语从句中,而在英语中,能伴有同位语从句的名词通常是需要做特殊说明的名词,如idea,fact,news,hope,belief suggestion,word,thought,doubt,truth,possibility,promise,order等有一定内涵的名词。这就使得英语的包装句蜕的词也是上述这些通常需要做特殊说明的名词。而英语中能引导同位语从句的连词通常有连词that、whether,连接代词that、who,连接副词why、when、where等。值得注意的是,if并不能引导同位语从句。

在同位语从句中,从句通常是对其所修饰名词的具体说明,这样就相当于在原型句蜕的前面加上了其他成分,构成了原型包装句蜕。如在例17与例18中,“hewillleavefor Shang-haiistrue”与“theirteamhadwon”就是原型句蜕,但在这两句话中,这两个原型句蜕前面就加了“the news”作为其他成分,因此构成了原型包装句蜕。

另外一点比较重要的就是,英语中不存在要素包装句蜕,这是由于英语的语法规定所致。在英语的同位语从句中,关联词不可省略,同样,同位语从句也就不能转化为非谓语结构、独立主格结构与定语从句形式,这使得其只能是原型包装句蜕。

4.4英语句蜕块的特点

由于英语存在时态和数的概念,这使得英语句子在蜕化成句蜕块之后还必须进行时态上的变换,而中文由于没有(或较少)时态和数的形式变换,使得中文不需要考虑转换后的时态和數的变换问题。这是英语与中文一个很大的不同点。

英语中句蜕现象的时态变换主要存在于宾语从句和状语从句。其他几类句蜕现象,要么由于是非谓语形式,不存在时态变化问题,要么与原来句子一致,如定语从句和主语从句。

而在宾语从句中,主要变化在于,如果主句是过去式与将来时,则从句要根据主句的时态做出相应的调整。如表1所示。

另外一个比较特殊的就是英语中的虚拟语气。虚拟语气存在于状语从句和宾语从句当中。在状语从句中,一般由if引导,其时态变换如表2所示。

此外,在宾语从句中,当主句谓语是wish和表示“要求、建议、命令”的动词,如advise,direct,ask,demand,order,suggest等时,从句的谓语动词用"should+动词原形”,其中should可以省去。如例20。

(20)I insisted that he(should)g0with us.(我坚持让他和我们一起去。)

这是英语句蜕现象中时态的特点,这一特点不同于中文,需要我们对转化后的句蜕块的时态做出调整。

5结束语

本文以HNC理论分析英语中的句蜕现象,将句蜕这一现象迁移到英语当中,总结了英语当中句蜕现象的知识和不同于中文的特点。由于HNC理论本就是面向自然语言处理而开发的一套形式化概念体系,本文通过这样的分析,可以将英语中复杂的语言嵌套现象形式化出来,从而使得机器更好地处理和分析语言。

猜你喜欢
英语
英语
读英语
酷酷英语林
悠闲英语(86)感恩与忘恩