基于现代智能识别技术的英语机器翻译模型

2018-08-21 02:57张帆
现代电子技术 2018年16期
关键词:英语翻译

张帆

摘 要: 基于句法分析的英语机器翻译方法无法解决智能识别技术中海量英语语言的部分结构歧义导致机器翻译准确度低的问题。因此,在分析智能机器翻译工具辅助英语翻译应用的基础上,设计与实现基于现代智能识别技术的英语机器翻译模型。依据英文句子产生中文句子和对齐过程,基于英文句子获取中文句子长度、首个中文词串的链接位置,获取总体中文句子以及机器翻译对在句子中的次数。采用基于最大熵的统计机器翻译方法,通过直接最大熵模型训练得到相关参数,获取不同英语语言特征间的最佳组合方式,解决海量英语语言中的部分结构歧义问题,提高英语机器翻译的准确度。实验结果表明,所设计的英语机器翻译模型,具有较高的翻译准确度和稳定性。

关键词: 智能识别技术; 英语翻译; 机器翻译模型; 结构歧义; 最大熵; 翻译准确度

中图分类号: TN915?34; H319.3 文献标识码: A 文章编号: 1004?373X(2018)16?0151?04

Abstract: The English machine translation method based on syntactic analysis cannot resolve the problem existing in intelligent recognition technology for part of structural ambiguity in the massive English language, resulting in low accuracy of machine translation. Therefore, an English machine translation model based on modern intelligent recognition technology is designed and implemented on the basis of application analysis of intelligent machine translation tool assisted English translation. Chinese sentences and alignment process are generated based on English sentences, Chinese sentence lengths and the link position of the first Chinese word string are obtained based on English sentences, and the whole Chinese sentences and the number of machine translated sentences are obtained. The statistical machine translation method based on the maximum entropy is adopted. The best combination mode of different English language features is obtained after obtaining related parameters by means of direct maximum entropy model training, so as to resolve the problem of part of structural ambiguity in the massive English language, and improve the accuracy of English machine translation. The experimental results show that the designed English machine translation model has high translation accuracy and stability.

Keywords: intelligent recognition technology; English translation; machine translation model; structural ambiguity; maximum entropy; translation accuracy

由于全球化的高速發展,不同国家间的信息流动呈现高速性,英语成为当前国际间沟通的主要语言。当前智能识别技术在不同领域中的应用价值不断提升,基于现代智能识别技术的英语机器翻译模型,能够提高英语机器翻译效率和准确度,实现无障碍交流[1?2]。而传统基于句法分析的英语机器翻译方法,无法解决智能识别技术中的海量英语语言中的部分结构歧义问题,存在机器翻译准确度低的问题。因此,本文设计基于现代智能识别技术的英语机器翻译模型,通过直接最大熵模型,获取复杂英语句子中不同特征间的最佳组合方式,消除部分结构歧义,提高英语机器翻译的准确度[3?4]。

1 基于现代智能识别技术的英语机器翻译模型

1.1 智能机器翻译工具辅助英语机器翻译的应用

随着现代智能识别技术的发展,出现了较多的智能机器翻译工具。当前的在线机器翻译的机器翻译结果还存在一定缺陷,尤其是全文范围采用服务器对不同语言数据实施对比学习后,获取各语言间的语法以及文字相关规律,存在机器翻译效率低以及准确度低的弊端[5?6]。因此应采用其他现代智能识别技术实现英语的准确机器翻译。

1.2 现代智能识别技术下的英语机器翻译

若用户不知道“汇率”一词怎么机器翻译,则依据经验可得该单词内会存在“rate”,则在搜索引擎(如Baidu:www.baidu.com,MSN Search:http://search.msn.com/)内输入“rate率”实施检索,在检索结果内可获取准确的机器翻译:“汇率(exchange rate)”。

1.3 基于现代智能识别技术的英语机器翻译模型

通过式(8)能够实施更加有效的检索,获取高质量的英语机器翻译结果。

2 实验分析

2.1 实验一

实验语料采用的是中君公司提供的586 538句对汉英平行语料,从中任意采集1 000句对当成测试语料,2 000句对当成开发语料,剩下的当成训练语料。实验基于句子长度将测试语料分割成简单句子、一般句子以及复杂句子三种测试集,如表1所示。

采用本文方法和传统句法分析机器翻译方法,针对表1中的测试集运算BLEU值,结果如表2所示。其中,BLUE值是一种机器翻译的自动评价方法,其值越高,说明机器翻译的质量越好。分析表2可得,机器翻译简单句子时,本文方法和传统句法分析机器翻译方法的BLEU值基本一致,而机器翻译一般句子时,本文方法的BLEU略高于句法分析机器翻译方法,特别是在机器翻译复杂句子时,本文方法的BLEU远远高于句法分析机器翻译方法。因此说明,本文方法的优势是机器翻译复杂句子,复杂句子中存在大量的最高名词短语,本文方法采用基于最大熵思想的统计机器翻译方法,可获取复杂句子中不同英语语言特征间的最佳组合方式,消除部分结构歧义,提高英语机器翻译的准确度。

2.2 实验二

实验通过两个圆形描述句法分析机器翻译方法和实际机器翻译结果的概率分布。圆形中的颜色越深则说明检索范围内该处的准确机器翻译结果概率越高,进而分析不同机器翻译方法的解码性能。

将不同方法获得的概率结果映射到实际机器翻译结果中,以实现对比不同方法的检索范围。将传统句法分析机器翻译方法、基于树翻译方法和基于森林翻译方法与本文所提方法进行对比。得到如图1~图4的实验结果。其中左侧圆代表不同方法的准确翻译概率结果,右侧圆代表实际机器翻译结果的概率分布。

由图1可知,基于传统句法分析机器翻译方法检索得到的最终概率在左下角,而实际机器翻译结果概率在右上角,且该种方法无法映射到实际结果中,证明传统方法的翻译精度较差。

基于树的机器翻译方法内句法分析获取的点在实际机器翻译结果的中不是概率最高的点,如图2所示。基于树的机器翻译方法得到的结果概率虽然无法对应到实际机器翻译结果,但其可以映射到其中,但映射范围较小。

基于森林的机器翻译方法内句法分析获取的森林能够覆盖句法分析机器翻译中概率最高的范围,可获取更趋向实际机器翻译结果的最优位置的点,如图3所示。图3中,虽然该方法的映射范围较大,但其映射准确度较低。

本文机器翻译方法与实际机器翻译结果的检索范围对比如图4所示,能够看出本文采用直接最大熵方法进行句法分析检索获取的最优点是实际机器翻译结果的最优点,基本可以完全映射到实际机器翻译结果中。实验说明,传统句法分析机器翻译方法性能较差,不具有对比意义。而采用基于树的机器翻译方法、基于森林的机器翻译方法以及本文方法的解码性能逐步提升,如图5所示。

從图5中可以看出,三种方法的检索范围不断提升,本文方法的BLEU值最高,获取的规则数量高于传统基于树机器翻译方法以及基于森林机器翻译方法,具有较高的解码检索性能。

3 结 论

本文设计基于现代信息计算的英语机器翻译模型,采用直接最大熵模型得到复杂英语句子内不同特征间的最佳组合方式,解决海量英语语言中的部分结构歧义问题,提高英语机器翻译的准确度。

参考文献

[1] 赵静.基于统计的汉英机器翻译技术的研究[J].电子设计工程,2016,24(21):69?71.

ZHAO Jing. Research on the technology of C?E machine translation based on statistics [J]. Electronic design engineering, 2016, 24(21): 69?71.

[2] 宋柔,葛诗利.面向篇章机器翻译的英汉翻译单位和翻译模型研究[J].中文信息学报,2015,29(5):125?135.

SONG Rou, GE Shili. English?Chinese translation unit and translation model for discourse?based machine translation [J]. Journal of Chinese information processing, 2015, 29(5): 125?135.

[3] 唐海庆,熊德意.基于选择偏向性的统计机器翻译模型[J].北京大学学报(自然科学版),2016,52(1):127?133.

TANG Haiqing, XIONG Deyi. A selectional preference based translation model for SMT [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 127?133.

[4] 杨呈永.物联网虚假数据特征自适应检测方法仿真[J].计算机仿真,2017,34(4):276?279.

YANG Chengyong. Simulation of false data feature adaptive detection in Internet of Things [J]. Computer simulation, 2017, 34(4): 276?279.

[5] HERMANTO A, ADJI T B, SETIAWAN N A. Recurrent neural network language model for English?Indonesian machine translation: experimental study [C]// Proceedings of International Conference on Science in Information Technology. Yogyakarta: IEEE, 2016: 132?136.

[6] ESCOLANO C, COSTA?JUSS? M R, FONOLLOSA J A R. The TALP?UPC neural machine translation system for German/Finnish?English using the inverse direction model in rescoring [C]// Proceedings of 2nd Conference on Machine Translation. Copenhagen: Association for Computational Linguistics, 2017: 283?287.

[7] BASTAN M, KHADIVI S, HOMAYOUNPOUR M M. Neural machine translation on scarce?resource condition: a case?study on Persian?English [C]// Proceedings of Iranian Conference on Electrical Engineering. Tehran: IEEE, 2017: 1485?1490.

[8] 胡滨.基于信息共享空间的科技博物馆服务模式创新[J].科技通报,2015,31(11):277?282.

HU Bin. Innovation in service model of science and technology museum based on information commons [J]. Bulletin of science and technology, 2015, 31(11): 277?282.

[9] 何向真,万福成,于洪志,等.基于藏语语义分析的机器翻译技术研究[J].计算机工程与应用,2015,51(15):134?137.

HE Xiangzhen, WAN Fucheng, YU Hongzhi, et al. Machine translation technology based on Tibetan semantic parsing [J]. Computer engineering and applications, 2015, 51(15): 134?137.

[10] 高鹏,黄瑛.矿物加工工程英语的特征及翻译[J].中国科技翻译,2016,29(2):15?18.

GAO Peng, HUANG Ying. The characteristics and translation of mineral processing engineering English [J]. Chinese science & technology translators journal, 2016, 29(2): 15?18.

猜你喜欢
英语翻译
地铁站内公示语英语翻译的特点和技巧
翻译转换理论指导下的石油英语翻译
英语翻译中跨文化视角转换及翻译技巧探讨
中国谚语VS英语翻译
评《科技英语翻译》(书评)
英语翻译中跨文化视角转换及翻译技巧探讨
透视高校英语翻译教学
试论如何提高英语翻译能力
跨文化交流中的英语翻译功能研究
文化差异对大学英语翻译教学的影响分析