适应性学习系统中用户与资源画像研究

2018-11-29 18:38张羽萍

科技与创新 2018年24期

张羽萍

适应性学习系统中用户与资源画像研究

张羽萍

（同济大学经济与管理学院，上海 201805）

随着“互联网+”与教育的深度融合，适应性学习成为研究的热点。而构建适应性学习系统的核心步骤之一是构建用户和资源的画像。目前研究对于用户画像的构建还不够全面，对于资源画像的探讨更是少之又少。基于系统能收集到的静态数据（基本信息等）和动态数据（行为信息等），确定用户和资源的事实标签，在此基础上，构建模型标签，从而画出用户和资源的精准画像。

适应性学习；用户画像；资源画像；标签系统

1 引言

适应性学习系统是指在网络学习环境下，在合适的时间以合适的方式为学习者提供合适的资源，方便学习者高效学习，有利于培养学习者的自主学习能力，提高学习者学习的主动性与积极性。适应性学习系统与传统的网络学习不同，传统的网络学习系统给学习者提供的是同样的学习资源和教学策略，并没有关注到学习者自身的特点，容易造成学习者认知超载和网络迷航；而适应性学习系统会根据学习者的认知能力，动态呈现相匹配的学习内容，并根据学习者不同的学习风格和需求，提供不同的学习资源和学习活动形式，能够体现学习者的个性化特征和个性化学习行为[1]。而实现上述精准匹配和推送的前提是构建精准的用户和资源画像。本文为有效地支持学习者开展个性化学习，从标签的类型出发，构建用户与资源的标签系统，实现其画像的精准定位。

2 标签的类型

从数据提取维度来看，标签可分为事实标签、模型标签和预测标签。

2.1 事实标签

从学习系统获取数据，定性或定量描述事务的自然属性、行为属性、资源属性等，以及根据工作人员经验积累的业务规则进行筛选、分析生产的标签，比如是否为活跃用户、是否为临考生等。

2.2 模型标签

对自然属性、行为等属性的抽象和聚类，通过剖析事务的基础数据为分析对象贴上相应的总结概括性标签及指数，比如标签代表用户的兴趣、偏好、需求等，指数代表用户的兴趣程度、偏好程度、需求程度等。

2.3 预测标签

基于用户的属性、行为、信令、位置和特征，挖掘用户潜在需求，针对这些潜在需求配合策略、规则进行打标，同时结合资源的属性、特征，将其适时、适机、适景推送给用户。从数据的时效性来看，标签可分为静态属性标签和动态属性标签。

2.4 静态属性标签

长期甚至永远都不会发生改变。一些用户基本信息比如性别、出生日期，这些数据都是既定的事实，几乎不会改变。

2.5 动态属性标签

存在有效期，需要定期更新，保证标签的有效性，比如用户的偏好、用户的活跃情况。

3 基于学习大数据的学生画像机制

构建学生的标签系统时，我们先根据学生的人口属性（个人基本信息）和学习属性（行为信息）来建立事实标签，再由各个事实标签提炼出建模时的模型标签。

学生的人口属性有姓名、性别、出生年月、籍贯、民族、就读城市、学校名称、就读年级等，其中出生年龄可以确定模型标签年龄阶段、就读城市可以确定模型标签地区分布、学校名称可以确定模型标签学校级别。

学生的学习属性用户关注资源、用户搜索关键词，可以确定模型标签用户学习兴趣；学生在进入系统初始填写的风格量表可以确定学生的学习风格；根据项目之前的问卷调查结果，家长非常重视学生容易题的错误率，结合用户每天登录系统的次数和花费在学习上的时间，可以确定用户的学习态度；以往已经有很多的文献在研究如何确定学生的认知水平，大多都是根据学生做每道题的正确率来确定，本文基于大数据的视角，学生在每个资源上的花费时间及准确率都可以在大规模群体下得到排名，结合其错题的重复度可以确定学生在大数据下的认知水平；我们不可能无限制地给学生推送题目，应当根据每个学生的承受指数来确定给其推送的题目数量，因此，我们根据学生每天做题的数目、做题的正确率、在系统上花费的时间来确定学生的题海压力指数[2]。用户标签体系如表1所示。

表1 用户标签体系

模型标签（确定权重）事实标签（确定指数）人口属性（基本信息）姓名性别年龄阶段出生年月籍贯地区分布就读城市学校级别学校名称年级民族学习属性（学习行为信息）学习兴趣用户关注资源用户搜索关键词学习风格风格量表学习态度（学习投入程度）每天学习的时间每天登陆系统的次数容易题的错误率认知水平学生在每个资源上花费时间学生对每个资源的掌握程度错题的重复率题海压力指数每天做题数每天做题正确率每天在系统上学习所花时间

4 基于学习大数据的资源画像机制

资源的标签系统可以分为资源基本属性和大数据属性，基本属性下可以确定的事实标签有每个资源所属的知识点、每个资源的内容类型（例如前试、理论、实例、概念详解等）、每个资源的媒介类型（例如视频、音频、文档、幻灯片、图片等）、每个资源的初始难度（由教育专家给定）、每个资源的初始重要性（由教育考试大纲给定）。

大数据属性下，我们收集到所有学生完成该资源的时间分布和对该资源的总体掌握率，根据这两项，我们可以动态更新该资源的难度值，从而使每个资源的难度值更加精确，有利于精准推送；通过学生对每个资源的浏览次数、收藏数、分享数、评论数，同样可以动态更新资源的重要性；我们根据用户对该资源的评分、差评次数、资源自身的属性（例如画面质量、音频清晰度等）来确定资源淘汰指数，实现对资源的优胜劣汰，有利用提高个性化推送的质量；最后，根据资源评分、被评论次数、被收藏次数、被点击次数确定资源的热度。资源标签体系如表2所示。

表2 资源标签体系

模型标签（确定权重）事实标签（确定指数）资源属性所属知识点资源形式资源类型（视频、音频、图片、文本和综合多媒体等）初始难度重要性（考试需求）大数据属性难度所有学生完成该资源的时间分布所有学生对该资源的总体掌握率资源重要性浏览次数资源收藏数资源分享数资源评论数资源淘汰指数被浏览次数用户评分资源自身属性（画面质量、音频清晰度等）差评次数资源热度资源打分评论次数收藏次数点击次数

5 结束语

精准的用户与资源画像是构建适应性学习系统的基础，本文从标签系统的类别出发，详细全面地刻画了用户与资源的画像。在此基础上，下一步的研究可以为各个模型标签赋予权重，然后对用户与资源进行匹配，实现精准个性化推荐。

［1］金慕鑫，杨芍，杨金梅.适应性学习系统初探［J］.中国管理信息化，2017，20（12）：218-219.

［2］杨现民，田雪松.中国基础教育大数据2016—2017［M］.北京：科学出版社，2018.

2095－6835（2018）24－0084－02

G434

10.15913/j.cnki.kjycx.2018.24.084

张羽萍（1994—），女，经济与管理学院，硕士研究生，研究方向为管理科学与工程。

〔编辑：严丽琴〕