语料库在学术论文英文摘要写作中的应用研究

2022-05-13 13:12孔志敏
科技资讯 2022年6期
关键词:学术论文语料语料库

摘要:语料库在学术论文英文摘要写作中的应用是研究中心。根据对语料库应用现状的研究,认识到学术论文英文摘要写作中语料库的重要性。明确语料库应用研究目的,加大对语料库设计的研究力度,该文结合语料库创建现状,以新能源科技型学术论文英文摘要写作短语应用案例为基础,对英文摘要写作语料库应用关键点准确掌握,目的在于提高学术论文英文摘要写作水平。

关键词:学术论文英文摘要语料库语料采集

中图分类号:H315文献标识码:A   文章编号:1672-3791(2022)03(b)-0000-00

Title of the Article: The Application of Corpus in English Abstract Writing of Academic Papers

KONG Zhimin

(Foreign Languages College of Jiamusi University, Jiamusi, Heilongjiang  Province,154007  China)

Abstract: The application of corpus in English abstract writing of academic papers is the center of the research. According to the current research on the application status of corpus, the importance of corpus in academic English abstract writing is realized. It’s necessary to have a clear research purpose of the application of corpus, intensify the study of corpus design. To aim at the improvement of the level of academic English abstract writing, it should take the phrasesapplication cases of new energy science and technology academic English abstract writing as the basis, and connect it with the present situation of the creation of corpus to grasp the key points of corpus in English abstract writing application accurately.

Key Words:Academic papers;English abstract;Corpus;Language acquisition

1学术论文英文摘要写作中语料库应用现状

语料库从20世纪90年代已经成为语言学研究关注的焦点之一,经过不断研究创新,目前取得理想应用效果。尤其是实证性语言研究方法的应用,以语料库作为研究与应用基础,取得非常高的认可[1]。学术论文英文摘要写作中,积极应用英文语料库,帮助学术论文高效完成英文摘要写作。语料库应用当前主要包括两方面:其一为通用语料库;其二为专用语料库。其一的核心是反映不同类型语言变体,参考BROWN语料库以及ANC语料库,集中于基础性语料库的相关研究。其二的核心是对特定领域、专业性强的情况下语言变体等加以反映,参考科技领域英文、医学领域英文或者军事领域英文[2]。

2 语料库在学术论文英文摘要写作中的应用研究目的

摘要在论文中还具有预示性作用,帮助读者对学术论文的主题与核心内容有所了解。英文摘要的写作,必须与中文摘要保持平行关系,为了提高英文摘要写作水平,要科学应用语料库[3]。当前最常用的语料库为CEPAC——中外学术论文中英文摘要平行语料库。研究的目的主要是为学术论文英文摘要写作提供更多帮助,能够准确掌握英文摘要写作的关键点,并且对语类特征有所了解,科学区别中文摘要写作特征,提高英文摘要写作水平。此次研究应用的主要方法为平行语料库技术。由定性、定量两方面着手,在深入分析的同时,避免学术论文英文摘要写作中出现片面性现象[4]。加大英文摘要写作中语料库的作用价值,对英文摘要写作中语言表达进行合理规划[5]。

3语料库的设计与创建

3.1总体规划设计

语料库整体设计,明确文本相关应用与选择规则。具体包括选样规则、信息属性、收集处理、对齐处理、多层级标注处理、软件适应、撰写标注手册、自检处理、统计处理、语料检索处理等。

3.2语料采集加工

采集环节必须根据语料库设计实施的随机选样原则为前提,重视时效性,及时对语料库进行更新,同时不能忽视时效性。

纵观采集的中英文摘要内容,均属于翻译对应类型[6]。结合期刊资料整合,语料库按照学科主要划分两方面:其一是中国学术期刊——中文摘要语料库;其二是国际期刊——英文摘要语料库。随即按照实际应用要求,分别划分语料库子库。划分标准以学科为主,第一是健康与卫生科学,第二是自然、理论、工程科学,第三是人文社会科学,第四是生命与生物医学,第五是语言与文学科学。针对性地充实语料库子库,同时还要对文本内容进行核对,必须做到中英文摘要语料匹配平衡。針对语料库中的内容,突出其代表性,及时进行信息性限定,充实语料库的同时,还要做到学科、语际等可比性。

加工环节主要针对语料库中的生语料为主。首先,根据语料内容,生成独立摘要语料文档。对文档按照语料库要求排序,摘要与文档必须对立。

其次是对语料精准校对。语料采集中存在部分杂质,语料入库之前需反复校对。借鉴语料库杂质处理工作可以发现,单词或者字符非常规,存在明显的拼写错误或者符号错误等。看似杂志处理简单,但是语料资源广、类型多,因此清洁整理难度非常大。

再次是标记语料以及双语联系。语料库中包括中英文摘要内容,以同一期刊的中英文语料分别整理,建立独立文档的同时,还要保证两者的双语联系。

最后是程序开发方面。语料标注作为加工整理的重要内容,为了加快语料标注效率,方便语料库信息查新,加大文本转化程序研究,根据写作需要,及时生成需要的文本格式。当前文本转化程序常见转化格式以可机读格式为主,同时还包括人读友好格式。

元信息设置也是语料库加工处理的重要环节。利用表头文件、摘要内容两种标记结构,完成元信息设置工作。元信息设置实际实施比较复杂,以表头文件为例,涉及多项信息内容,如语料的学科门类,学科门类又划分多种类型。语言类别信息,包括中文摘要内容、英文摘要内容。

3.3语料标注设计

语料标注设计,第一要研究标注工具,这是核心内容,从属性标注角度出发,及时标注语料信息,标注软件当前所应用以德国MMAX22为主。Java环境下,MMAX22运行在的主要标注格式为xml,及时完成语料储存。

首先,将原始语料进行整理,随后完成多层级语料信息标注,将标注语料单独保存。在此基础上增加语篇标注、界面保存等功能。其次是具有突出的应用优势,不仅运行性能稳定,并且操作性非常强。最后是能够根据语料库使用需要,根据定制条件对语料展开变量应用,变量过程灵活。正因为如此,语料库中该软件得到广泛应用。第二是语料句子的对齐。语料库句子对齐的处理,根据语料内容,按照篇章级、句子级等进行层次划分。中英文摘要资料,按照句级对其的方式进行标注,同时将表述信息科学整理,并且转化语料库信息属性,为后期的应用提供方便。

4学术论文英文摘要写作中语料库的应用案例

4.1研究方法应用

学术论文摘要的地位与价值非常关键,体现着学术论文的写作水平。新能源相关研究正在不断深入,新能源技术应用越来越成熟,尤其是其中的发电领域,学术论文隶属于科技研究类型,因此英文摘要写作中必然会涉及科学英文。根据学术论文研究核心,英文摘要写作中必须对研究对象加以明确,同时涉及的设备状态以及技术等都要详细介绍,其中不会掺杂过多的点缀词汇,对名词词组应用比较多,这需要语料库给予更多支持。对于英文摘要写作中常用的基本英文词汇,科技英文词汇的特征更明显。

4.2研究结论

以中国学术论文写作,尤其是英文摘要写作习惯方面为切入点分析,首先以母语迁移的方面出发,对英文摘要写作中语料库应用以及写作要点等进行总结。第一,名词化研究。主要包括两个研究方向:其一是以某个词类型为基础,逐渐演变为名词;其二是从底层小句为基础,派生出名词。在语料库应用中,将其规划为概念隐喻范畴,实际应用中,英文短语对其来龙去脉可以不去深究,但是对构词习惯必须清晰掌握,这样才能够在论文英文摘要写作中,对词汇能够精准应用。其次,从语体方面出发研究,名词短语应用中,必须以学术论文英文摘要写作结构为基础,英文短语的应用必须能够充分表达学术论文摘要的理性经验,同时将客观形象加以展现,在发挥短语修饰作用的同时,还要将摘要中所涉及的摘要、地点、类别以及用途等充分体现,满足对科学类型学术论文摘要写作抽象性、简洁性写作需要。尤其是“设计”这类词汇,中国学者在英文论文写作中,因为对名词定语与英美学者有所差异,所以在英文短语词汇应用中,会面临强调性不足的问题,这主要因为长期的思维习惯所决定,属于母语负迁移现象的明显体现。

5结语

综上所述,对于学术论文英文摘要写作来讲,语料库的应用对摘要在语言精练以及逻辑整理等方面有重要帮助。根据对语料库的设计可以发现,其中针对英文摘要写作情况,及时收集整理大量语料,按照语料类别等加以划分归类,方便英文摘要写作词汇选择。语料库应用中,提高学术论文英文摘要写作水平,尤其是翻译教学与测试等方面,以扎实、准确的数据支撑,辅助英文摘要写作完成观点阐述。

参考文献

[1] 王娜,董建民.基于语料库分析的工科学术论文英文摘要写作模式研究——以新能源发电专业为例[J].内蒙古师范大学学报:哲学社会科学版,2019,48(3):101-107.

[2] 陈姝妍.基于语料库的中外作者学术论文英文摘要中语步对比研究[D].长春:长春理工大学,2018.

[3] 刘科成.基于语料库的汉英学术论文摘要对比研究[D].长春:东北师范大学,2016.

[4] 张大群,周佳琪.学术论文摘要英译声音的学科比较——以第一人称代词为例[J].晋中学院学报,2020,37(1):101-104.

[5] 王松.基于语料库的医学论文英文摘要现状分析[J].锦州医科大学学报:社会科学版,2019,17(2):104-107.

[6] 杨青,张瑞红,郭海波.基于语料库的农业科技论文中英摘要的语步特点对比研究[J].榆林学院学报,2020,30(1):110-114.

基金项目:2021年度黑龍江省省属高等学校基本科研业务费科研项目《学术论文摘要中“推广性”写作策略研究》(项目编号:2021-KYYWF-1368)。

作者简介:孔志敏(1978—),女,硕士,讲师,研究方向为英语语言学、翻译学。

猜你喜欢
学术论文语料语料库
2021年度《戏曲研究》优秀学术论文名单
基于语料库翻译学的广告翻译平行语料库问题研究
可比语料库构建与可比度计算研究综述
中古汉语分期研究所涉及的语料问题
运用语料库辅助高中英语写作
如何使用第二外语学习者语料
第二届“华师科技园杯”优秀学术论文2016年12月评选结果
语料库与译者培养探索
英语教学中真实语料的运用
第9卷第1-6期学术论文总目次