基于深度学习的智能学习平台的分析和设计

2018-02-16 17:27林碧芬
信息记录材料 2018年12期
关键词:深层深度特征

林碧芬

(福州职业技术学院 福建 福州 350000)

1 基于深度学习的搜索和预测

深度学习是一类算法集合,是机器学习的一个分支,它将特征提取和分类结合到一个框架中,用数据学习特征,是一种可以自动学习特征的方法。深度学习尝试为数据的高层次摘要进行建模,把原始的数据通过非线性的复杂模型转换为更高层次、更抽象的表达。简单来说,假设有两组神经元,一个是接受输入的信号,一个是发送输出的信号。当输入层接收到输入信号的时候,它将输入层做一个简单的修改并传递给下一层。在一个深度网络中,输入层与输出层之间可以有很多的层,算法使用多个处理层对数据进行转换,最终得到某一种判断的结果,从终端的层发送最终的输出信号。

随着人工智能和大数据的兴起,深度学习技术的发展发挥着巨大的推动作用,引领各个领域纷纷从传统方法到深度学习方法进行转变。深度学习的应用领域在不断扩大,在图像识别、语音识别、搜索引擎、机器翻译、医疗诊断、金融预测等领域都得以成功应用,并且相关方法和技术日益成熟。深度学习在图片,语音等感知领域已经处于领导地位,在自然语言处理领域也不断取得突破。

例如,搜索作为以自然语言呈现的最主要的应用,对自然语言理解以及语义匹配都有着非常高的要求,深度学习技术在搜索应用上,可应用于文本分析、语义匹配、搜索引擎排序模型等。据媒体报道,国内几个知名搜索引擎,都应用了深度学习来解决自然语言理解和语义匹配的问题,甚至深度学习技术在搜索引擎中已经起到一个重要的技术支撑作用。

而在预测方面,深度学习技术也施展着它的不凡身手。在电子商务领域,深度学习技术能够对消费者进行精准营销,为用户推荐感兴趣的产品广告;在金融领域,深度学习技术可以用来预测股价,还可以用来识别欺诈;在政务监管领域,深度学习技术能够对舆情进行监测分析,预测舆情情感走向,为政务决策提供帮助。

在教学领域,我们认为,深度学习在搜索和预测方面的作用,可以应用到学生学习平台的设计当中。应用基于深度学习的搜索和预测功能,能够帮我们设计出一个更贴合个体学习习惯的智能学习平台。

2 应用深度学习的技术可行性分析

一般来说,深度学习需要三个核心的要素:算法设计、高性能计算能力、大数据。其中,高性能计算能力属于硬件范畴,在此不进行讨论。下面就算法设计和大数据两个方面,分析一下基于深度学习的智能学习平台开发的技术可行性。

2.1 关于算法

曾经有人对深度学习的描述是:简单的说,深度学习就是一个函数集,如此而已。换句话说,深度学习主要是一些算法的集合。事实上,深度学习就是一类有效训练深层神经网络的机器学习算法。基本的深层网络模型可以分为两大类:生成模型和判别模型。生成是指从隐含层到输入数据的重构过程,而判别是指从输入数据到隐含层的归约过程。复杂的深层结构可能是一个混合模型,既包含生成模型成分,又包含判别模型成分。

无论是生成模型,还是判别模型,都包含了多种网络架构模型。生成模型主要包括受限玻耳兹曼机(RBM)、自编码器(AE)、深层信念网络(DBN)、深层玻耳兹曼机(DBM)以及和积网络(SPN)模型;判别模型主要包括深层感知器(deep MLP)、深层前馈网络(deep FNN)、卷积神经网络(CNN)、深层堆叠网络(DSN)、循环神经网络(RNN)和长短时记忆(LSTM)网络模型。而各个网络架构模型通过结合不同的算法设计,又生成多种具体的模型架构,例如CNN发展至今,出现了 Lenet、Alexnet、GoogleNet、VGG、Deep Residual Learning等模型架构。

基于各种模型和算法,深层网络能够从大量的复杂数据中学习到合适且有效的特征。应该说,任何数据都是有特征的,所以,在学习平台上处理的数据,也是有特征的。比如学习过程中的搜索数据、选择数据、练习数据、答疑数据等,都具有特征,它们的特征,能体现学生个体的学习特性。如果通过深层网络的学习,得到这些数据的特征,再通过判别模型判断学生操作的特征归类,那么就能得到一个贴合个体学习习惯的智能学习平台。

在应用深度学习的过程中,需要对模型和算法进行合理的选择。有一个简单通用的模型选择方法[1]:

本研究在教学实验中制定了考核评价标准(见表3),对学生游泳能力进行评价同时还对安全自救能力、救助能力及基本救生常识进行考核评价,并将游泳技能表现与救助能力表现整合起来,为教师游泳教学提供教学内容参考、明确学生学习的目标,进一步完善学生游泳自救与救助技能评价标准,再将标准开发为目标和监控手段,有力地提升教学质量,促使更多学生掌握游泳生存自救及救助能力。

●DBN: 通用的分类问题

●RNN: 序列化学习,时间序列

●CNN: 图像、音频、文本分类

●RBM: 特征提取

●Autoencoder: 特征提取

其中,CNN模型既包含了对特征提取的实现,也包含了对分类判别的实现,CNN能够进行文本特征提取、文本特征表示、归一化、最后进行文本分类,所以对于以文本为主要数据的学习平台来说,CNN可以作为其应用深度学习的网络模型。

2.2 关于大数据

一般认为,深度学习需要大量的数据,但是只有极少数情况下,你才能拿到足够的数据,如果真是如此,深度学习的用处有明显的局限性。

还有文章表示,应用mnist数据集的实验证明,在数据量较少时,多层神经网络的效果要比单层神经网络要好。所以当数据较少又想用深度学习来处理数据时,建议再网络模型中多搭几层[3]。

因此,对于教学中使用的学习平台来说,虽然没有大量的数据可以提供给深度学习,但是,我们依然可以使用深度学习来获得数据特征,并进行数据分类判断。

3 智能学习平台的功能设计

一般来说,学生的在线学习平台,至少应该具备以下功能:

●提供各种学习资料,学生可以按需搜索,进行自主学习;

●提供多种任务或练习,供学生进行实践操作;

●提供在线答疑功能。

结合深度学习的应用特点,以及在线学习平台的基本功能要求,针对智能化的功能设计如下。

3.1 智能搜索

每个学生的搜索习惯不同,搜索同一份资料时会使用不同的关键字,或不同的语序。对于每个学生输入的搜索内容,平台将学习其特征,从而记录每个学生的搜索习惯。依据学生的搜索习惯,在搜索时,能给出最贴合学生思路的搜索提示,实现更快捷的搜索。

3.2 智能排序

智能排序包括搜索结果的排序和操作选择的排序。

对于搜索结果来说,平台将根据学生之前对搜索结果的链接选择习惯,来进行排序。平台会将最符合学生搜索意图的结果排在最前面。

对于操作选择来说,学生会面对许多的任务列表,或练习列表。同一个知识点,可能有多个任务或练习,这些操作题目,应该按从易到难的顺序排列。而难易的程度,最开始可能由平台后台数据管理人员输入,但是,在被调用进行操作和评分之后,平台将学习它们的难易特征,然后对题目的难易程度进行实时的调整,这样的排序,对于后来的学习者,能提供更客观的选择依据。

3.3 智能纠错

学生在做题的过程中,对于同类的题目,往往会有同样的错误倾向。针对学生个体操作过程中产生的错误数据进行深度学习,能收集学生的操作错误特征,对于学生后面的操作,能进行个体错误预测,提出错误预警,或者错误提示,实现智能纠错。

3.4 智能答疑

通过深度学习,记录学生个体对问题和答案的选择匹配特征,使得平台具有自我学习的功能,并逐渐让答疑智能化,最终实现,当学生输入问题时,对应的答案不再是多个,而是将准确列出匹配问题的答案。

深度学习的发展,让很多产品实现了智能化。对于已经存在的软件平台来说,应用深度学习模型,再加上已有的数据,一样能实现智能化的升级。在软件平台设计中,如何选用深度学习的模型和算法,是值得进一步探讨的问题。

猜你喜欢
深层深度特征
根据方程特征选解法
离散型随机变量的分布列与数字特征
深度理解一元一次方程
考虑各向异性渗流的重力坝深层抗滑稳定分析
不忠诚的四个特征
深度观察
深度观察
深度观察
SAM系统对TDCS数据的优化处理与深层应用
对“医患失去信任”的深层忧虑