机译之星

1994-08-24 06:03刘志达
中国青年 1994年5期
关键词:陈肇雄计算机

刘志达

谈判在进行。

一枝笔在陈肇雄手里慢慢地转着,像是在一点点上紧发条。

对面,香港权智公司年轻的董事长谭伟豪认真地注视着这位年轻的书生。两个人的目光轻轻地搭在一起。

谭伟豪的身子稍微动了一下,说:“陈先生,请告诉我购买这项技术的价格。”

“74万。”

“可以。”谭伟豪竟毫不犹豫。

片刻,笔在陈肇雄手里停止了转动,但只是片刻,又慢慢转了起来。他又说出两个字:“美元。”

“当然。”谭伟豪先生依然不加思索。

陈肇雄手里的笔没有再停止转动:“一年为期。”

谭伟豪点头同意。

这时陈肇雄又加上一句:“只限于袖珍版系统,不包括台式和笔记本式。”

谭伟豪说:“好,我接受。我的条件是:两个月拿出软件。”

陈肇雄放下了手中的笔,笑了。谭伟豪也笑了。

两个人的目光依然搭在一起。

一个是中国科学院计算机研究所优秀的青年科学家。

一个是名列“香港十大杰出青年工业家”之榜的企业家。

在对方的眼睛中,他们分别看到了过人的智慧和气魄。

两个月后,陈肇雄从他那张旧三屉桌里,拿出几张巴掌大的软盘,这就是一年使用价值为74万美元的袖珍版智能型英汉机器翻译系统。

这是我国“863计划”实施以来一次性出口创汇最高的技术成果。时为1991年底。

这就是知识的价值。

1 自从世界上有了人,就有了人的语言。

语言是人与人之间相互交流的工具,同时,也是人与人之间相互交流的障碍。人类社会不断发展,人们享受语言这一工具带来的实惠越来越多,同时,拆除语言障碍的急迫性也就越来越强烈。

于是就有了翻译。

到整个农业时代结束,人们满足于越来越多的翻译人员的出现。机器时代的到来,使人与人之间的交流比以前更加广泛、复杂,因此,克服语言障碍的要求更加强烈。终于,有人把全面实现这一要求的希望的眼光瞄向了机器。

本世纪20年代,一个俄国人试图用机械装置自动将俄语翻译为英语,但未能成功。40年代初,美国人发明了电子计算机,美国商用机器公司即尝试用它进行自动翻译,仍未成功。50年代,曙光初现,第一个机器翻译系统问世,但是与此同时,它那十分简单的语词规则、极慢的翻译速度、很低的准确率、极高的翻译成本,也使人们陷入了渺茫之中:由于人类多种自然语言的语法、语义构造的不同和复杂,电子计算机能最终完成人脑尚需深入学习才可能实现的不同自然语言的转换吗?

70年代中期,人类进入了信息时代。人类的思想创造以各种不同的语言形式喷涌而出,人们用信息爆炸来形容这一个时代。因此,实现人类之间顺利交流完全靠人工语言互译显然已是不可能的事,这时,人们再一次把希望的目光瞄向了计算机。

机器翻译技术于是被列为21世纪世界十大科技难题的第一位。

差不多是同时,中国的一位电子计算机专家、中国科学院学部委员高庆狮教授平静地对一个24岁的青年人说:“给我搞出机器翻译来。”

这个青年人就是陈肇雄。

当时是1985年,他正在高庆狮教授门下攻读博士学位。

2 福建莆田有座壶公山,山下有条木兰溪。

1961年,陈肇雄出生在这里的青山绿水之间。

他的父亲是一个普通的乡村中学教师,母亲是农民,上有两个姐姐,下有一个弟弟、三个妹妹。沉重的生活负担,父母无法给他太多的照料,他的童年是在无拘无束的玩耍中度过的。一直到小学三年级,他整日贪玩,学习成绩十分糟糕。

祖母的一次严厉教训,使他童蒙初开。从此他开始了如饥似渴的学习。

陈肇雄学习起来不挑不拣,速度极快,课堂上的东西很快无法满足他的求知欲望,而那时课外书又非常少,几本《铁道游击队》《红旗谱》《水浒》《三国演义》被他反复读来读去。而父亲给他找来的一套《西游记》更让他如醉如痴,书中那似真似幻的仙山魔洞,奇妙多端的无穷变化,让他小小的心灵激动不已,孙悟空便成了他那时痴迷羡慕的偶像。

当陈肇雄成为中国科学院研究员时,回忆起这段时光,依然充满留恋之情。他说,我的自学能力就是在那时开始培养起来的,小学生读小说,大人又没有精力讲解,全靠自己去读懂那些大部头的书,这就是一个自学的过程。特别是像《西游记》这样的书,能引起我的丰富联想,促使我去找新的知识。

陈肇雄似乎一旦起动,马上就可以达到一种高速状态。上中学后,当时不正规的教学更无法满足他的求知欲望,他开始超过课堂进度自学数、理、化。1977年到公社中学读高中,一些老师是从大城市“下放”来的,教学水平很高,加上他的自学,他开始准备参加“文革”后的第一次高考。他有充分的信心。

但他没有考成。他的老师蔡赢洲对他说:“再等一年。你要考就考一流名牌大学,因为我教的学生就要赢过五大洲的学生!”

陈肇雄遵从了老师的教导,慢了下来。由此,陈肇雄开始了他特有的一种人生节奏。

他自己定下一个目标后,便急速前行,在即将到达时,总有种种原因让他达不到这个目标,于是慢下来,而慢的结果,是他以更快的速度超过原定的目标。这种“快—慢—快”的节奏以后便一直伴随着他的人生之路。

一年后,他以优异的成绩考入华东工学院。大学三年级时,他想报考研究生,又被老师劝止。又过了一年,他以总分最高的成绩一举考上我国当时仅有的两位计算机专业的学部委员之一、与华罗庚等同列为中国科技十杰的高庆狮教授的研究生。陈肇雄又开始了他的高速前进,提前9个月完成了硕士研究生学业。

一般情况,获得硕士学位后两年就可以评为助理研究员,但由于名额有限,他没有被评上。这似乎又慢了下来。但是当博士学位还没有读完,他已被提前评为副研究员,接着,他只用了3年时间,由于在学术上取得的重要成果,1992年10月,他成为中国科学院最年轻的研究员之一。时年31岁。

快——慢——快。

3 当高庆狮教授让陈肇雄搞机器翻译时,陈肇雄正在劲头十足地作着智能计算机逻辑程序语言的研究。这是新一代计算机的核心技术,陈肇雄是国内最早从事这个课题研究的人之一。这时,他已发表了10多篇有影响的论文,提出了“基于替换的逻辑程序实现技术”,其成果得到了北京、上海、沈阳、南京等地有关单位的推广应用。继续下去,前景已经十分乐观。而要转到差异很大的机器翻译上来,风险却很大:研究周期长,工程量大,而且在理论上尚未有突破,也许竭毕生精力都很难搞出像样的成果。

陈肇雄的人生节奏又一次出现在“慢点”上。

他果断放弃了原来的研究方向,直接踏上机译研究这一世纪性的艰难之路。

退一步并没有海阔天空,却是山重水复。

世界上的发达国家不惜以黄金的堆积试图叩开机译之门。欧共体7国联合投资3850万欧洲货币单位进行研究;日本投资高达8亿美元;美国仅在机译一项子课题的理论研究方面,就投资1600万美元。而陈肇雄的研究直到1988年被列入国家“863”高技术研究发展计划,才获得44万人民币的课题费。就是这44万,已经超过了“863”计划智能计算机主题全年经费的三分之一。

最大的困难,还在于课题本身的高难性。机译研究是涉及语言学、计算语言学、计算机科学、认识科学等多学科的综合性研究,而陈肇雄对这一课题的认识几乎是一片空白。对于他来说,没有别的办法,只有再一次拿起他的看家法宝—自学。潜下心来,从头开始读书,慢,就让他慢去吧。

这一读就是3年。

陈肇雄边读边想,这是他在小学读《西游记》时练就的功夫。他首先根据计算机的特点设计了一套计算机可以接受并能从容运用的语法,他称之为“SC文法”。接着,又为计算机编了一部特殊的词典,他把这种词典按语言、语意、常识、上下文相关等分为7个层次,形成“与sC文法相适应的层次词典结构”。但是,各种知识纷纭复杂,人不可能把所有的知识都告诉计算机,计算机如果遇到不知道的知识怎么办?能不能像人脑一样根据已经掌握的知识进行推理判断?陈肇雄说:能。可是这一个“能”字,却是他3年心血的结晶。3年后,陈肇雄终于提出了“基于不完备知识的机译分析”的理论。简单地解释,比如我们要找一个人,并不需要知道这个人的所有参数,比如找陈肇雄,到中科院计算所一问,搞机器翻译研究的、青年、福建来的博士生,别人就会知道,这是陈肇雄,而他叫什么,身高体重,面貌特征等都可以不去过问。对于计算机来说,可否也能如此呢?于是他把各种单词规定了300多种属性特征,如这个词的概念是精神的还是物质的、固体的还是气体的、在句子中是主语还是谓语、其所在的句子是在什么场合使用的等等,计算机根据这些特征,就可以准确地把这些词组成的句子的含意翻译出来。

当陈肇雄把这一切都想通了时,他实际上已完成了机器翻译向现实转化的理论建设。

1988年,陈肇雄在第12届国际计算语言学大会上宣读了关于“智能型机器翻译系统”的论文。由于他突破了国际机译界长期难以解决的复杂多义区分、上下文相关处理、多种知识交叉分析等一系列难题,引起各国专家的高度重视,大会主席兴奋地称陈肇雄“指出了一个雄心勃勃的新的发展方向”。

如果这时的陈肇雄继续发表论文,著书立说,那么成为国际机译界权威,只是一步之遥。他又一次走到了人生的“快点”上。

这时,高庆狮教授看着他的高徒,依然平静地说:“论文暂时不要再发表了,不要让关键技术流失,应该尽快把技术成果转化成产品,要让成果在国内实现产品化。”

中国人的精神智慧,要转化为中国的物质财富。

陈肇雄再一次“慢”了下来,重新走上了一条充满荆棘的艰难之路。

4 又是一个3年。

陈肇雄组织了十几位专家和一批大学毕业生,靠着“863计划”拨给的44万元有限的经费,借来一台SUN3/260工作站,便在一间简陋的机房中干了起来。

3年困苦,3年磨砺。用什么样的语言才可以让人们体会到科学创造过程中的所有艰辛?在那仅仅是为设计语言规则而堆起达3米高的稿纸中,谁能说清浸透着多少心血?

这需要精神的支持。

陈肇雄那一届毕业的计算所硕士生共36人,先后35人出国,只剩下一人,就是陈肇雄,而他是最先并且4次接到国外的邀请。

人各有志,但他不是圣人。一次,陈肇雄为各种麻烦—与科研无关却又是科研障碍的麻烦—所苦恼,他感到累了,便随手给德国的一所大学发去一份电传,表示想去学习一段时间。仅仅4个小时,对方发回电传:欢迎即来。

陈肇雄轻轻抖了抖电传纸,便放在了一边。

他的课题不能半途而废。他说:“出国不是就不爱国,但我留在国内,却实是有感情上的原因,能在国内为我们的计算机事业发展出力,我感觉更实在,更有意义。”

终于,陈肇雄的人生又进入了一个新的“快点”之上。智能型英汉翻译系统IMT/EC863于1992年通过了国家科委主持的鉴定:“应用智能型机器翻译理论体系所设计开发的IMT/EC863系统,具有软件独立于具体文种、智能化程度高、翻译速度快、占用空间小、准确率高、译文可读性好等特点。该系统在理论基础、总体设计、系统实现和应用效果等方面,总体上超过了国内外同类系统,处于国内外领先的地位。”

此消息在《光明日报》上发表后,在国内外机译界引起强烈反响。权威人士评之为“在我国高性能英汉机译系统的开发和把技术转化为生产力方面作出了突出的贡献”,“为中国机器翻译技术打入国际市场开辟了广阔的道路”。

同一年,陈肇雄组织人力,用了两个月时间,完成了袖珍型电子翻译机的软件开发,把数万个基本词汇、数十万个对应词、数十万个通用规则和特殊规则压缩到100K字节以内,能在动态存贮空间下运行,而且能在袖珍机速度限制下几秒钟内完成整句翻译,即实现了实时翻译。

香港权智公司以一年74万美元的价格购买了这一软件,生产出了世界上第一台能够完成整句翻译的袖珍型电子翻译机—快译通EC—863A.

同样年轻的谭伟豪深知这一成果的广阔商业前景,所以在第一个合同尚未期满时,又提出投资740万美元组建合资公司共同开发生产。陈肇雄提出计算所的技术使用权折股也是740万美元,占50%。这样,按照合同规定,权智公司今后10年每年至少还要交付200万美元的技术使用费,除去上交给合资双方的利润额外,不算产品销售利润,陈肇雄课题组每年至少可以拿到90多万美元!

1992年10月,合资公司成立,陈肇雄担任董事长兼总经理。

同时,中科院计算所成立了机译研究中心,陈肇雄任中心主任。

1993年,“智能型机译系统IMT/EC—863”获中国科学院科技进步一等奖。陈肇雄本人获中国科学院第三届青年科学家奖一等奖,被评为中央国家机关十大杰出青年和中国十大发明企业家之一。

那么,陈肇雄人生曲线的下一个“点”呢?

在中央电视台的一次现场直播节目中,节目主持人请他演示“快译通EC—863A”,他想了想,便迅速地输入了一串英文:“Science and technologymust be combined with market.”几秒钟后,机器显示并读出“科学技术必须与市场相结合”的汉语字样和读音,奇妙的技术赢得了观众热烈的掌声。

可以想像,机译之星下一个人生之点也许会出现在哪里。

猜你喜欢
陈肇雄计算机
中国电子科技集团有限公司
计算机操作系统
穿裙子的“计算机”
陈肇雄带队检查 部机关和在京部属高校疫情防控工作
基于计算机自然语言处理的机器翻译技术应用与简介
计算机多媒体技术应用初探
5G迎来正式商用
促进“一带一路”ICT基础设施互联互通
陈肇雄:促进产业数字化 不断催生新业态推动新发展
信息系统审计中计算机审计的应用