大数据环境下数据伦理教育思考和建议*

2020-03-09 17:03
甘肃科技纵横 2020年5期
关键词:伦理个体素养

张 娟

(四川外国语大学 图书馆,重庆 400031)

0 引言

信息技术的高速发展,推动了互联网科技与教育技术、教育理念的快速融合,带动了教育信息环境的全面变化,特别是近年来移动教育、在线教育正不断促进着传统教育模式的转型发展,教育活动逐渐呈现出过程可量化、模式个性化、管理决策精准化、评价多元化以及发展均衡化的趋势[1]。2017年新媒体联盟发布的《中国高等教育技术展望地平线区域报告》指出,如何提升个体数据素养将成为未来教育中必须应对的问题,而应对的关键措施之一就在于基于大数据环境下数据素养能力重构与角色重塑,因此对数据伦理教育的研究也成为研究的重点[2]。

1 大数据环境下数据伦理与数据素养

随着互联网时代的快速发展,各种数据呈现出飞速增长的态势,这得益于各种设施设备性能地提升,使个体数据收集、分析能力得到了较大增强,但这也造成了技术与科学研究方面的数据监管难题,使数据伦理问题成为社会发展必须要重视和解决的问题。从性质上看,大数据的透明与方便共生,受益与风险同在,其产生的目的是为了集中所有数据信息以便于研究、开发和使用。但其开发和使用本身就有争议,包括谁有资格开发、由谁使用、使用哪些数据、用户信息谁能支配、查询和使用等一系列问题,还会产生各类道德价值争议和数据焦虑。如消费信息、社交信息和网络行为信息等就容易被用户自身或数据管理方形成关联,并在一定范围内进行传播或分享,从而造成数据伦理问题[3]。由此而引发的一系列问题也催生了以《中国互联网行业自律公约》为代表的网络道德准则的出现。而数据伦理所涉及的范畴更为广泛,不仅仅是产生于大数据领域,也包括在数据素养教育所涉及的数据意识、数据利用、数据分析等多个环节上,是基于个体素养教育所引发的关于数据规范采集、应用、传递和决策范畴的整体,所以网络环境催生了大数据伦理问题的研究,也使得社会个体数据素养教育需求成为了提升数据伦理教育的重要基础。

个体的数据素养水平是关乎其能否有效的适应大数据环境、运用大数据以及发掘大数据潜在价值并应用于分析决策的重要因素。数据伦理的价值与作用在于个体能否在数据分析、传递、转换、应用与决策过程中自觉遵守相应的数据应用与分析规范,在允许的应用范畴内合理合法的传递和使用数据、进行数据分析决策。所以,数据伦理教育是数据素养教育的基本范畴,也是影响个体数据素养教育效果的重要元素。

2 数据伦理与数据伦理教育的重要性

2.1 数据伦理释义

数据伦理可以描述为个体在数据利用、解读、交流等过程中所涉及的规范与自律行为,表现为个体能够区别对待源数据和由他人编撰后产生的数据,并保证数据使用方法和使用范围的透明和诚实[4],也指个体尊重社会科学等方面的敏感和隐私信息及商业机密、专利信息等,其中学术环境、个体因素是影响数据伦理道德水平的主要因素之一[5]。数据伦理也包括对道德法规的合理正确利用,如“能够合理合法地获取并使用数据,对数据的发布与使用遵守相关社会法规与规范”[6],“尊重数据隐私、遵守数据交流的规则等”[7]。数据伦理是数据素养的准则,通常与道德一起,被表述为数据伦理道德。

数据素养既影响大学教师在数据运用、分析、决策过程中的个体行为,也直接影响大学生数据素养的形成过程,因此数据认知、采集、管理、处理、分析共享和创新等方面的能力,以及在数据使用过程中所遵守的道德与行为规范都是数据素养的重要内容[8]。所以在具体的数据伦理问题上,既要清楚的认识到数据所展示出的问题的单一性,以及数据间相关关系的局限性,不能单独依靠数据对大学生进行心理与行为画像,要注重综合运用定性与定量数据并结合大学生的其他信息来进行教育决策[9]。

2.2 数据伦理教育的重要性

从社会要求分析,数据伦理具体表现为在获取和利用、分享数据的过程中充分尊重数据来源与数据样本的隐私,在遵循相应的数据交换、分享规则的基础上合理合法的利用数据,而在数据素养的各个基础要素中,数据伦理是构建个体数据素养的基础,是个体数据素养的必然组成部分。一份针对大数据环境下大学生数据素养的调研指出,大学生个体虽然具备一定的数据使用能力,但总体上存在着数据意识薄弱,对数据的潜在含义认知有限,缺乏系统的数据分析、转化、决策能力,特别是在数据伦理问题上,普遍存在着不重视甚至忽视数据隐私的现象[10]。在数据伦理问题上,有研究显示,只有29.1%的馆员能对所用数据的出处进行规范说明,也只有30.9%的馆员会对科研数据。知识产权方面等数据进行严加保密,这表明高校图书馆员在数据伦理和数据技能方面较为薄弱[11];从学科背景上看,文科生对相关数据伦理和数据道德的认知和遵循方面要优于理科生,这表明不同的学科背景也会影响个人的数据伦理及认知[12-13];在性别上,女生的伦理意识整体强于男生[14];在受教育程度的影响下,教育者本身的受教育程度与数据素养能力呈正相关,教育者的受教育程度越高,其数据素养能力也越高;但学历与数据伦理道德没有表现出明显的相关关系,这表明数据伦理教育应当贯穿于数据素养教育的整个过程[15]。具有较高数据素养的人更能容易发现一些有实际意义的疑惑点并具有较强的数据鉴别能力,更能通过合理合法的途径采集、整理、转化和使用数据,这也是对于数据伦理道德的较为明显的遵循[16]。所以,对于个体而言,越是接触数据就越需要加强对其数据伦理道德的培养,数据伦理道德的培养是基础,而其他能力属于基本技能[17],教师作为施教者,对其的数据伦理教育应摆在首位。

3 关于数据伦理教育的建议

对于数据伦理的界定目前尚不统一,加上当前数据伦理在一定程度上与数据意识没有明确的界限,甚至被简单的划入数据意识或是数据态度范畴,这些都使数据伦理研究进度缓慢,继而造成了在数据伦理教育实施上的困惑,简单表现为教育目标、策略、方式上的不规范。以数据驱动教学为例,其侧重于对数据处理与数据应用上的教育,而对数据本身所代表的价值、学生隐私、数据应用范畴等相关问题的教育则相对薄弱。因此,数据意识和数据伦理道德养成教育还需实施如下措施:

3.1 综合提升教师数据素养

客观来讲,教师对教育数据的利用如果完全遵循数据本身所代表的字面含义来进行教育决策,那么教师对教育数据的利用就是一种明确且线性的行为。然而教育数据本身所能表达信息的单一性以及数据去除场景、语境信息的各种限制,就要求教师综合学生的非数据信息来进行教育决策,但这又势必造成一种相对无序和反复的过程,需要教师运用数据批判思维来审视数据应用,并客观评价自身在数据应用过程中所扮演的角色,寻找学生表现不佳或行为失常的潜在根源。

数据伦理教育需要使教师认识到,合理合法且道德的使用学生数据比使用学生数据来决策更为重要。这意味着教育工作者必须尽早接触数据素养,然后在整个职业生涯中加强数据素养。但是越来越多的研究者的目光从数据利用转向数据决策层面,忽略了数据伦理问题。所以,也有学者指出,需要加强对于教师职前教育过程中的数据伦理教育,从数据来源、利用动机、自我效能、态度、职业观等角度综合提升教师的数据素养水平[18]。同时,教育主管部门还需要清晰的掌握学生数据的管理机构与管理过程,包括:谁在管理学生数据、谁在采集数据和谁在使用学生数据等等。所以,数据伦理道德的培养不仅仅需要大学图书馆对单个个体的数据伦理进行培养,更需要对整个教育环境进行综合提升。

3.2 加强对权限意识的教育

数据伦理问题不仅表现在对数据的分析和处理过程中,也包含在对数据的管理上。除前述数据所有权之外,数据所有者和数据利益共享者会对数据的访问、利用具有相对较大的控制权,由此而产生的对于数据访问权的控制管理就极为重要。所以,数据所有者及其利益共享者的访问机制、相关授权模式、授权范围都需要进行进一步关注。对于整体权利而言,数据所有者一般拥有对于数据的全权管理权,其数据伦理意识会影响到数据的直接应用与分享;相对而言,数据利益共享者一般是数据样本或数据的分析与操作者,其对数据的访问和修改权依赖于数据利益相关者了解其所能操作的数据范围、数据的存储模式、存储位置,以及数据能被哪些人操作。然而,数据利益相关者特别是数据样本基本不了解数据的上述信息,如在学校范围范畴,要使访问权限有意义,数据主体必须能够合理地行使它们,然而作为样本的学生就很难完全了解相关数据的采集用途、存放地以及最终的使用方向,也就不清楚这些数据的实际效用,这也是数据伦理教育中容易被忽略也同时是难以监管的问题之一。如在“数据鸿沟”的背景下,学生群体可能存在对数据集、操作技能组合以及对数据本身的理解障碍,这些障碍将阻碍“非专业”数据主体行使数据权益。考虑到数据处理目的经常被“隐藏”(模糊描述)甚至部分掺杂商业利益,数据利益共享者也难以确定数据使用范围和用途。

3.3 提升对数据伦理的认识

道德和负责任的数据利用行为是了解如何使用数据的一部分,图书馆专业人员应当具备良好的数据伦理水平并将其贯彻到保护学生隐私上去。虽然数据伦理问题一直受到数据素养研究者的关注,但是对大学数据伦理教育的关注有限。在现有相关研究中,多数关注于数据技能、数据决策和数据思维等方面的界定与研究,而随着社会信息技术的发展以及公民数据素养的不断提升,数据技能、数据决策和数据思维将会逐渐纳入个体素养教育的主要范畴,然而数据伦理问题由于偏向于道德伦理范畴,重在引导和示范,需要借助于个人品行与人格魅力来进行辅助教育。但目前基于大学生数据伦理教育视角的数据认知理论和数据行为准则教育还相对不足,这也是影响下一代数据素养教育的重要因素之一。

学生数据的采集需要经过多种渠道且长时间的积累,期间对于数据采集的标准、利用方向以及数据的准确性均会受到教育教学环境、个人教育理念、教育教学法规甚至是家长层面的影响,如在数据隐私性问题上会受到来自于教育监管部门对数据使用渠道、公开范围的质疑。此外,也有研究者指出,数据往往是教学指导“陷阱”的主要诱因,这种现象主要源于对于学生个人成绩、课堂表现所得的数据的主观评判与片面夸大使用,这会给数据的规范利用造成障碍,以美国为例,为保障在利用教育数据过程中的公正性与客观性,保障学生的隐私并避免相关的数据伦理问题,专门出台了“家庭教育权利和隐私法”(Family Educational Rights and Privacy Act,简称FERPA),对数据使用行为和保护学生数据隐私进行了有效的规范。但法律法规并不能完全保证在保护学生隐私方面的权利和义务,长期的数据素养教育才是提升数据伦理水平的关键。

3.4 改革数据伦理教育方式

在数据素养的教育过程中,传统条件下对学生的评价往往建立在基于成绩、日常表现等因素上的主观评测,倚重于经验来判断学生的相关行为并实施教育教学活动,同时对于学生的个人信息、学习数据、在校活动分析结果的隐私保护也缺乏一定的数据伦理认知,同时在一定程度上也缺乏对相关数据、信息的有效甄别和客观判断能力。所以,数据伦理教育将成为数据素养教育的重要内容,对于高校图书馆而言,如何将现代信息技术、教育技术课程、数据素养教育与数据伦理教育进行有效整合并培养具有较强数据意识和较高数据伦理水平的从业者,是提升未来社会数据伦理水平的又一关键因素。

在当前的数据素养教育方式上,大多数数据素养教育首先注重于数据操作能力的培养,最后才是对大学生数据伦理的培养,即最后再培养个体保护知识产权和网络隐私、遵守法律法规等方面的能力,这在一定程度上容易造成个体对数据伦理的不重视[19]。数据伦理问题通常与大数据教育结合,以伦理问题为切入点,开展对受教者的教育,英文课程多以“Ethics”命名,如德克萨斯大学奥斯汀分校信息学院的“Data and Ethics”(数据和伦理)[20]。其内容主要介绍了数据隐私的保护价值和方法,讨论当前数字时代存在的数据伦理问题,并以案例为对象分析了数据伦理面临的挑战,但对数据伦理相关的“数据交流规则”和“数据信任”的教育则较少。

对比而言,融入于数据实践过程中的数据意识和伦理的培养更注重数据使用过程中的道德和伦理问题。如以“Data and Ethics”(数据和伦理)和“Policy and Ethics in Digital Curation”(数据管理中的政策和伦理)[20]为例,前者将数据的社会、历史观点与道德、政策和案例相结合,帮助学员理解数据隐私、数据交流和数据歧视在内的数据伦理问题;后者则主要讨论解决数据集及其管理带来的知识产权、隐私安全以及其他伦理问题。

3.5 构建数据伦理教育资源

数据意识和数据伦理教育大都融入在数据挖掘、数据分析和再利用等培养数据能力的实践过程中,专门课程的开设数量较少。在少数的专门课程中,授课内容多是解读与数据相关的政策法规,分析生活中具有代表性的数据使用案例。高校图书馆可以联合教务部门开发数据素养教育网络课程等,以查找职业信息等用户实际需求为出发点,通过对学生相应的查询、收集、整理、辨识能力的培养等数据伦理认知,进一步落实数据素养教育责任。现有资源多通过规范数据使用者的行为来达到使学生建立数据伦理的目的,较少有资源涉及数据生产者的行为规范。在具体的数据伦理教育上,美国华盛顿大学信息学院专门开设了“数据科学III:规模、应用和伦理”(Data Science III:Scaling,Ap⁃plicationsand Ethics)[21]课程,数据伦理教育是贯穿于整个课程的重要内容,这也为其他资源的特色化构建提供了思路,以讲座、研讨会和独立学习为主要授课模式,以市场营销和国家安全等领域有关的数据问题为例来帮助学生认识和处理数据相关的社会、政治和伦理问题,以培养其批判和反思精神。

4 结论

在当前大数据环境下,整个社会对数据的敏感性越来越凸显,针对诸如教育数据的分析与运用也已经逐渐面临着数据伦理挑战,特别是在数据驱动决策逐渐融入教育教学活动后,对于数据伦理问题的探讨既是对现有数据素养教育的促进,也是对相关教育、学生培养活动的一种理性约束,希望通过本论述所探讨的数据伦理问题为数据伦理教育以及大数据环境下的数据规范管理与应用提供参考。

猜你喜欢
伦理个体素养
《心之死》的趣味与伦理焦虑
必修上素养测评 第四测
必修上素养测评 第三测
必修上素养测评 第八测
必修上素养测评 第七测
护生眼中的伦理修养
关注个体防护装备
个体反思机制的缺失与救赎
How Cats See the World
医改莫忘构建伦理新机制