葛 睿,陈秀真
(1.上海信息技术学校 信息技术系,上海 200331;2.上海交通大学 信息安全工程学院,上海 200126)
随着人工智能的发展,自然语言处理(natural language processing,NLP)技术已经应用于诸如语音识别、机器翻译和舆情监测等许多领域,如最近大热的聊天机器人chatgpt其中NLP的身影便无处不在[1]。人工智能标记语言(artificial intelligence markup language,AIML)是一种基于XML(可扩展标示语言,Extensive Markup Language)格式的语言,可用于开发具有NLP能力的软件代理,主要用于基于人工语言互联网计算实体的聊天室应用程序的创建和定制[2]。类似地,模糊标记语言(fuzzy markup language,FML)同样是一个基于XML的标记语言,主要可用于描述模糊系统的结构和行为且模糊系统独立于专用于托管和运行它的硬件架构[3]。计算智能(computational intelligence,CI)是人工智能的核心技术之一,它由模糊逻辑(fuzzy logic,FL)、神经网络(neural network,NN)和进化计算(evolutionary computation,EC)三大部分组成。AI-FML是一个可以为中小学生提供学习人类知识和逻辑运算规则的设计模型[4]。元学习(Meta-learning)是指让AI学会如何学习,从而提高其效率的技术,同时也是将物理和数字相融合的可视化世界[5]。一般来说,元宇宙技术包括虚拟现实(virtual reality,VR)以及增强现实(augmented reality,AR)。文献[6]将元宇宙分类为硬件、软件、内容、用户交互、实现和应用几大部分。此外,他们还提到了教育会是元宇宙的重要应用领域,如视听教学(audiovisual-based education)和问题导向式教学(problem-based learning)。对于学生们来说,因为书面上的内容和实际体验的感受是完全不同的,因此体验式学习(Experiential learning)非常重要。受此启发,本文提出了一种基于AI-FML元宇宙的架构,包括元数据收集、元信息处理、元知识抽取、模糊本体构建和元智能学习,可供中小学生实际体验计算智能的应用。《心经》是佛教传统中使用最为频繁的经文[8],本文将AI-FML与《心经》的教义相结合,使提出的智能代理更加具有可解释性。此外,也将AI-FML元宇宙引入到上海4所中小校的实验课中。参与的学生使用AI-FML平台来构建基于CI应用程序的知识库(knowledge base,KB)和规则库(rule base,RB);然后可以应用基于FML的粒子群优化(particle swarm optimization,PSO)工具[9],将FML和PSO进行结合,使用训练数据集训练KB和RB;接下来,在导入学习模型并输入值后,学生可以进行模块化编程,以控制位于不同空间中的AI-FML机器人或其他学习工具的语音,表情和动作。通过这种方式,他们可以与AI-FML共同学习,以模拟这些工具的感知和认知特征。
本文的整体框架,包括提出的智能代理、软硬件(AI-FML hardware and software)、元宇宙学习域以及基于AI-FML的学习CI模型。在学习过程中,学生通过概念式学习(concept-based learning)、体验式学习(experience-based learning)、操作式学习(operation-based learning)、实践式学习(practice-based learning)、应用式学习(application-based learning)和表达式学习(expression-based learning)来熟悉AI-FML。学生在元宇宙学习域中在机器的引导下学习,并学习如何与机器进行互动。该智能代理进行元数据的收集来评估学习者的学习成绩,以表达他们对学习内容的感知。
IEEE(电气与电子工程师协会,institute of electrical and electronic engineers)计算智能学会(computational intelligence society,CIS)中学生外展小组(high school outreach,HSO)的愿景是将CI引入课堂,以激发学生们的兴趣。FL系统有五个重要组成部分,包括模糊规则(fuzzy rule)、模糊变量(fuzzy variable)、模糊集合(fuzzy set)、隶属度(membership degree)和隶属函数(membership function)。
《心经》是佛教中最常被背诵的经文之一,其中充满了人类智慧的结晶。基于CI学习空间域、人类学习时间域以及基本模糊本体论的AI-FML元宇宙结构,可用于中小学生的学习。可以看到,学生们可在各自的AI-FML时域和空域上观察元智能,通过不断深入学习不同年龄段的HI(human intelligence),并逐步扩展AI-FML的学习内容,实现从小学到大学的学习目标。这样一来,学生们便可看见并亲身体验所学的知识,理解奋斗过程中所付出的汗水。随着时间的推移,学习到的元智能越来越接近IEEE CIS HSO的实际情况,同时不同年龄段的人学习时所掌握的知识量以及与实际情况的接近程度也不同。
表1 模糊变量表
图1为基于CI和人类对《心经》语义理解的AI-FML元宇宙学习平台。AI-FML元宇宙学习平台包括人类智能和人工智能。此外,该平台还包含元数据、元信息、元知识、元智能和模糊本体等供学习。表2为人类基于《心经》的语义理解,用于AI-FML元宇宙的体验和学习。
图1 基于CI和人类对心经语义理解的AI-FML元宇宙学习平台
表2 基于CKIP 标注工具的模糊变量表
人类对心经的语义理解用于AI-FML元宇宙的学习和体验如下。
1)AI-FML初学者在其AI-FML元宇宙的时空域中观察元智能。
①他深入学习FS、NN、EC和FML,以提高到达学习目的地(如小学(elementary school,ES)、初中(junior high school,JHS)、高中(senior high school,SHS)或大学(university,U)时HI的表现。
②然后,他才能理解和体验形相、感觉、认知、形成和意识,并超越一切苦难和困难。
2)在AI-FML元宇宙中,智者明白形式并不与空性有所不同,而空性也不与形式有所不同。
①形即为空,空即为形。
②感觉、认知、形成和意识在AI-FML元宇宙中的情况也类似。
3)在AI-FML元宇宙中,智者明白所有法相都是空无特性的。
①它们不产生,不毁灭,不玷污,不纯洁;它们既不增加也不减少。
②它们没有形式、感觉、认知、形成或意识。
③无眼睛、耳朵、鼻子、舌头、身体或思想。
④无色、声、香、味、触、法。
4)在AI-FML元宇宙中,无眼界,直至无意识的境界。
①无无明亦无无明尽。
②直至无老死亦无老死尽。
③无苦、无聚、无灭、无道、无智、无得。
④学者通过跟随人类到达目的地的智能来获得元智能。
5)在AI-FML元宇宙中,学者的思想是畅通无阻的。
①因为没有障碍,他不会感到恐惧。
②同时他也将远离扭曲的梦幻思维。
③最终,他从学校毕业,并获得进化元智能。
④根据到达目的地的人类智能,他获得了最高层次的普适元智能。
6)因此,AI-FML元宇宙的学者理解了HI。
①它是一个伟大的精神,一个光辉璀璨、超然至高、无与伦比的元宇宙。
②它能消除一切苦难。
③它是真实而非虚假。
④因此,他讲述并传授关于AI-FML学习之路的HI。
⑤他是这样朗诵的:
(a)请前往AI-FML元宇宙之门。
(b)你将获得AI-FML学习和体验的美妙HI。
fAIFML_HS(x:a,b,c,d)=ES[a,b,c,d]=
JHS[a,b,c,d]=SHS[a,b,c,d]=U[a,b,c,d]=
(1)
公式(2)和(3)分别表示隶属函数fAIFML_HS(Learning Content:a,b,c,d)和fAIFML_HS(Learning Episode:a,b,c,d)。
fAIFML_HS(Learning Content:a,b,c,d)=
{ES[FS,NN,EC,FML],JHS[FS,NN,EC,FML],
SHS[FS,NN,EC,FML],U[FS,NN,EC,FML]}=
(2)
fAIFML_HS(Learning Episode:a,b,c,d)={ES[6,7,11,12].
JHS[11,12,14,15],SHS[14,15,17,18],
(3)
在地区1到N的城市1、…、L分别设有体验室和体验中心。此外,基于人类智能的元知识和领域本体位于学习域1~N中,人工智能和机器智能也存在于学习域1~N中。AI-FML机器人的智能代理,包括视觉智能、听觉智能、语言表达智能、触觉智能和大脑智能,因此可以是观察者、行动者或执行者。观察者将视觉数据传输到AI-FML 元宇宙平台,行动者执行模块化程序的表达动作,执行者接收AI-FML的结果并执行相关动作。不同地区不同城市的AI-FML学习域的年轻学生,可以通过元宇宙体验式学习,与AI-FML工具的机器智能共享或共同学习他们的人类智能。
学习域中的学生将其人类智能发送到元宇宙中的AI-FML学习平台或实验室。此后,AI-FML学习平台或实验室将机器智能发送到学习域中的AI-FML工具。
图2展示了基于模糊本体论的智能代理的实现,可用于中学生在AI-FML元宇宙中的学习和元知识构建。整个过程分为数据收集和数据评估两个阶段。首先,领域专家根据CI相关内容构建CI相关本体论。在数据收集阶段,学生将CI元素与现实应用相结合,并学习如何与嵌入到基于CI的学习体验体(learning experience agent)中的AI-FML工具交互。与此同时,学习数据进行了存储。在数据评估阶段,智能学习标签体(intelligent learning label agent)提取收集到学习数据的关键概念,并存储带标签的内容。最后,智能学习评估体(intelligent learning evaluation agent)以热力图的形式反映学生的学习成绩。
图2 用于元知识构建的智能代理结构(增加人机交互画面)
智能学习标签代理负责从收集到的学习数据中提取关键概念,图3显示了收集到的学习数据示例,在小学A的AI俱乐部中,四名学生在观看计算机围棋程序教学视频(视频1)和AI-FML人机协作教学视频(视频2)后的书面陈述。图4为本文的软件架构界面,包括领域本体构建和标注。
图4 软件架构展示图
提出的智能代理算法输入:学生学习元数据如下。
输出:学生的学习状况热力图
过程:
1)使用Protégé软件构建领域本体。
2)使用CKIP 标注器创建字典文件。
①读取领域本体的.owl文件。
②提取主题RDF(资源描述框架,resource description framework)语句的主语,谓语和宾语。
③储存主谓宾语。
④根据提取的主语为CKIP标注器创建字典文件。
3)从学生的学习元数据中提取关键概念。
①给定学生学习元数据的目标URL(统一资源定位器,uniform resource locator)。
②将提取的标题设置为元数据。
③设置要提取的HTML标签。
④执行提取。
⑤存储提取的关键概念。
4)提取的关键概念在CKIP中进行操作(使用CKIP提取关键概念)。
①给定学生学习元数据的目标URL(统一资源定位器,uniform resource locator)。
②提取CKIP 标注器中的结果并存储。
5)学习热力图中的成绩。
①利用CKIP提取的学生元数据中的关键信息,计算本体概念之间的相似度。
②给予这种学习元数据适当的权重,以计算学生的学习成绩。
6)输出学习元数据中的学习成绩。
下面为基于CKIP标记器的小学A中视频1和视频2提取的词集。我们提取本体的概念,以计算 (Concepti,Conceptj)的相似性,其中 Concepti和 Conceptj分别表示来自构建的本体和学生学习元数据提取的词集中的概念。
小学A视频1和视频2中的词集:
视频(Na)的(DE)三(Neu)个(Nf)重点(Na)视频(Na)三(Neu)大部分视频(Na)三(Neu)以人为中心的 AI(VA)以人为中心的 AI(FW)以人为中心的 AI(FW)人类(Na)协作(VA)模式(Na)以(P)人(Na)为(VG)中心(Nc)的(DE)AI(FW)人类智慧(VH)人类智慧(Na)人工智能(Na)人类(Na)协作(VA)模式(Na)教育学习应用(Na)人类(Na)协作(VA)模式(Na)人类(Na)协作(VA)模式(Na)教育学习应用(Na)智慧(Na)学习(VC)和(Caa)执行(VC)智能(Na)学习(VC)和(Caa)执行(VC)不(D)确定(VK)的(DE)外部(Ncd)环境(Na)视频(Na)1(Neu)内容(Na)视频(Na)内容(Na)智能(Na)学习(VC)和(Caa)执行(VC)学习(VC)和(Caa)执行(VC)可以(D)模仿(VC)人类(Na)学习(VC)AI(FW)是(SHI)可以(D)以(P)简单(VH)的(DE)方式(Na)来(D)学习(VC)人工智能(VH)以(P)聪明(VH)的(DE)方式(Na)执行(VC)任务(Na)。
2022年秋季学期,我们向上海的4所国际学校(包括上海市民办中芯学校,上海协和国际学校,上海惠灵顿国际学校和上海长宁国际学校,以下简称小学A,小学B,中学C与中学D)引入了AI-FML元宇宙学习。小学A的五年级学生每周在AI俱乐部学习120分钟,小学B的六年级学生每周在计算机课上学习两节AI-FML课程,每次80分钟,中学C和中学D的学生每周分别学习两个小时和一个小时。在每个学习阶段中进行了基于概念、经验、操作、实践、应用和表达等不同组合的学习,使学生们熟悉AI-FML元宇宙。值得一提的是,在小学生学习时,进行的操作式学习比初中学生要少得多;与之相对,表达式学习对所有不同年龄组的学生都很重要。
本节中设计了基于《心经》模糊本体概念的学习模型,将人类智能和机器智能应用于基于AI-FML的学习CI模型,让初学者通过与机器和AI-FML机器人互动来理解CI的基本概念。这种寓教于乐的方式对学生们来说很容易接受,通过AI-FML工具或机器人的视觉智能,他们可以在不同的空间中体验机器智能。图5(a)显示了小学A中的学生登录Google虚拟课堂和AI-FML元宇宙的计划时间和实际花费时间的曲线图,可以看到,计划时间与实际时间逐步匹配。此外,我们还进行了概念式学习、实践式学习和表达式学习的比较:由图5(b)可以看到,小学A的学生在学习AI-FML概念时,实际花费的时间比计划的时间更长,也许对于小学生来说学习AI-FML的概念很难,因为在实际中我们也的确发现了他们使用平板电脑花了很多时间在AI-FML元宇宙中对他们理解的概念进行标注。由图5(c)可以看到,小学生在每一个阶段中都花了很多时间一起玩耍并学习,以在AI-FML元宇宙中体验、实践、操作和应用现实世界的CI应用。由图5(d)可以看出,表达式学习实际花费的时间比计划的时间多,但最终在课程结束时趋于一致。
图5 学生在各方面计划和实际花费的时间
我们应用学习热力计来评估在2022年秋季学期,小学A和小学B的学生学习AI-FML和英语时,根据学生的听觉智力、口头表达能力、视觉智力和书面表述表现来评估其学习情况。
表3给出了他们与机器人共同学习AI-FML的一些基本信息。学习热力图的关键评估要点,以学习机器语言AI-FML为例,关键要点包括1)看讲座视频,然后把他听到和看到的关键概念标注出来;2)说出他所学到的知识;3)练习构建其AI-FML应用的KB和RB以及4)测试题作答。
表3 共同学习AI-FML的信息
图6为不同阶段学生学习成绩的曲线及其趋线,可以看到:1)小学B学生的趋线斜率比小学A学生的更高,表明小学B的参与模式使学生进步更快;2)小学B学生在第三和第四阶段的学习成绩最低,因为概念式、实践式和操作式学习对这些学生来说很难标注其关键概念;3)第四课时之后,小学B学生的学习成绩逐渐增加,并在最后两课时中达到最高,这表示小学B学生持续保持进步,这种学习方式有助于小学生学习CI;4)与小学B相比,小学A学生的学习成绩趋线更平缓。但是,小学A的平均学习成绩为76,高于小学B的平均学习成绩。
图6 两个小学学生学习成绩的变化及其趋势
本节中,提出的智能代理对中学C参与的32名初二学生在AI-FML 元宇宙中进行人机共学英语的学习成绩进行了评估。表4显示了其基本信息。参与的学生来自两个初二班级,第一课时和第二课时中每节课的总时长分别为90分钟和45分钟。此外,采用异质分组法将每个班级的学生分成四组,因此每个班级第1组的英语水平最高。每个班级第1组和第2组的学生人数分别为(4,4,4,3)和(4,4,5,4),因为班级1的第1组中有两名学生缺席了第一节课的学习课程。
表4 共同学习英语的信息
基于CI的学习经验代理具备视觉智能、听觉智能、书面表达和口头表达能力,他们与年轻学生交互以收集其学习数据。智能学习标签代理和智能学习评估代理根据学生在英语听、说、读、写能力的表现评估其学习成绩,其中听占30%,说占30%,读占10%,写占30%。
图7和图8分别展示了班级1和班级2的学习热力图,其中左上角、右上角、左下角和右下角的四个六边形分别表示第1、2、3、4组,中心的六边形表示整个班级的平均值,热力图旁边的数字表示根据参与学生的元数据测量的整体学习成绩。0到100表示学生们学习热力图的范围,其中50为中点。1班的平均学习成绩从49上升到60,2班的平均学习成绩从64上升到70。观察到两个班级中皆是第1组的学习热力图表现最好。
图8 班级2的学习热力图
本文提出一种基于人工智能和元宇宙的人机交互学习智能代理,将《心经》中模糊本体论的概念应用于小学生和中学生学习英语以及AI-FML元宇宙中的FML。通过将《心经》的原则与基于模糊本体论的智能代理相结合,提出了一种面向年轻学生在AI-FML元宇宙中学习的智能代理,以赋予其计算、感知和认知智能。在引入AI-FML人机交互学习到上海的4所中小学后,观察到智能代理可以有效地工作,并且学生的学习热情在结束时呈上升趋势。未来,我们希望将这种学习CI模型推广到国内甚至世界上的其他学校,让他们在玩耍、享受的同时也能学习到CI的实际应用。