基于安卓平台的智能汉语口语学习应用设计研究

2020-06-19 08:50谢淑玮司徒俊鸿
科学与信息化 2020年10期

谢淑玮 司徒俊鸿

摘 要 随着移动互联网技术的迅速发展,在线汉语教学方式应运而生。高度普及的移动智能设备以及飞速发展的语音处理技术,使得计算机辅助语言学习系统越来越受青睐。本文在安卓操作系统下设计构建了智能汉语口语学习应用平台,该应用可针对汉语的口语发音特征进行细化评分,从而精确提升用户的汉语口语水平。

关键词 安卓平台;智能汉语口语学习;系统模块

1汉语口语学习的发展

1.1 汉语语音特征的研究历史

多年以来,我国学者对汉语声调特征提取、声调分类进行了大量的研究。九十年代初,赵元任先生、刘复先生等学者就开始用科学仪器对汉语声调本质和特征进行定量研究[1]。林茂灿等人对汉语语调相声调进行了分析,研究表明边界调可以区分疑问语气和陈述语气,并给出了普通话边界调的基频模式。疑问句的边界调的基频没有因为语调的作用而发生改变[2]。Fu等人对汉语声调的包络信号进行了研究。他们将语音根据频率带分成几段,去除光谱信息并保留每一段的振幅包络及周期信息,仿真结果表明汉语声调的识別率可达80%。曹阳等人提出采用决策树的聚类算法统计学习了连续语音中声调模式的分布[3]。这些研究促进了汉语语音特征识别准确性、广泛性的提高,为日后的汉语口语评判体系提供了坚实的基础。

1.2 汉语口语学习的研究现状

如图1所示,截止至2018年的数据,有关汉语口语学习的期刊论文一直都是呈上升趋势的,数量也较为可观。而关于汉语口语学习的学位论文数量达到峰值后有所下降,推测在2010年至2015年间,汉语口语学习相关的研究和应用迎来了短暂的风口,但经过三到五年的时间再进行观察,无论从产品抑或市场分析,都未出現具备足够竞争力的相关互联网产品。从以上情况分析,汉语口语学习领域未来依然具有潜力,值得投入研究开发设计产品。

2系统设计原理

2.1 口语评判

用户通过应用进行口语训练时,系统会记录期间的音频保存为文件,并对音频文件经过语音预处理(语音输入-预加重-分帧-加窗)、特征参数抽取(快速傅里叶变换,FFT-三角带通滤波-离散余弦变幻-MFCC输出)、语音分割(Viterbi解码-状态序列)、整体评分(DTW)以及声调评分(带调音节评价函数或是声调评价函数)一系列处理步骤,得到最终的得分结果。

2.2 个性化学习过程

在设计应用时,应用会在后台采集并记录用户的学习数据和改进建议,根据用户指定的难度、用户使用时的内容得分,进行分析后向用户推荐适合的课程与相关内容,从而达到更符合用户的学习进度与学习能力的需求。基于数据分析调整推荐内容,使得应用能一定程度上做到更“懂”用户。

2.3 平台内容标准化

应用中的口语学习内容可制定出一套简洁易用的规范格式,最少仅需包含文字信息与标准的口语音频录入,即可作为学习内容课程接入到应用平台,便于日后引入更多机构进行内容创作。应用提供付费接口,可实现对部分优质内容进行收费的收入模式。

3系统模块构成

3.1 安卓客户端应用模块

安卓客户端应用主要分为口语学习、字典查询、生词本、用户中心等主要功能。

口语学习是核心功能。我们可以将学习者分为三个等级,初级,中级和高级,然后根据对应的等级所具备的能力设计相应的练习,在此基础上,深入学习语音语调识别内容,实现语音评分细化到声母,韵母,声调的部分及给出建议的功能。进而促进学习者尤其是汉语非母语学习者的学习。因为汉语非母语者跟汉语母语者的发音习惯有很大的区别,所以用以中文当母语的学习者的语素库来进行语音识别会降低识别率,从而在进行分析的步骤上容易造成较大的误差。采用非母语语素库能避免这种问题。先用非母语语素库进行语音识别,再用母语语素库进行口语评分,评价本身分为两个部分,得分和详述。得分根据总体评判给出,详述则是指出用户录入的每一个字或词的发音细节如声母、韵母、声调等出现的错误进行评分。

在汉语口语学习的过程中,用户还可以快速调用字典、生词本功能进行查询、记录。同时在用户结束该活动时将数据传输到服务器的数据库上,进行数据备份。

用户中心主要是个人资料以及已购课程,钱包余额等个人信息。以及常见问题,给予学习者解决疑惑和意见反馈,给予学习者反馈通道。登录功能通过TCP/IP协议访问后端数据库,注册功能用学习者的手机号作为账号,向学习者的手机号发送信息来验证是否学习者本人后再由学习者自己输入密码进行注册。

界面美化可以吸引学习者的目光,在录音,播放音频,删除生词,转换页面等地方都可以适当加上动画效果,实现界面美化。

根据以上列出的功能,设计的智能汉语口语学习应用架构有首页(翻译、生词表以及课程)、我的课程(信息列表、列表项列出我的课程)、个人中心(登录、钱包、已购课程、常见问题、意见反馈、设置)等。

3.2 后端服务器模块

智能汉语口语学习应用的后端可以采用基于golang的beego框架编写。本应用的数据可以被分为三个表,分别是用户表,生词表,课程表,用户表和生词表是一对多的关系,用户表和课程表是一对多的关系。安卓客户端的应用程序不能自动保存sessionId,为了保持学习者的登录状态,可以进行人工保存,即在登录的时候手动保存服务器返回的sessionId,每次传输时再一起放在cookie中发过去给服务器。服务器就能区别每个学习者的会话状态。

4结束语

本文对智能汉语口语学习应用的设计过程进行了总结,该应用是典型的C/S架构应用,应用系统通过安卓平台的客户端与用户进行交互,用户在客户端进行口语学习等操作,而用户的学习进度、课程内容、生词记录等数据则发送回服务端数据库进行保存,以便用户在不同的设备使用该应用均可保留进度。前后端的同步协调,使得本文设计的应用能覆盖用户的汉语口语学习需求。

参考文献

[1] 刘俐李.汉语声调论[M].南京:南京师范大学出版社,2005:20-25.

[2] 林茂灿.汉语语调与声调[J].语言文字应用,2004(3):57-67.

[3] 曹阳,黄泰翼,徐波.基于统计方法的汉语连续语音中声调模式的研究[J]. 自动化学报,2004,30(2):191-198.