用新一代人工智能技术解决真实问题

2022-07-12 18:09谢作如

中国信息技术教育 2022年13期

摘要：人工智能教育不能仅仅停留在科普和体验阶段，要让学生用AI来解决真实问题。本文提出“AI科创活动”这一教育名词，梳理了中小学AI科创活动的类型方向，从多个角度进行了可行性分析，并展示了温州中学的学生案例。

关键词：人工智能教育;AI科创活动;新一代人工智能技术

中图分类号：G434 文献标识码：A 论文编号：1674-2117（2022）13-0005-04

近年来人工智能技术突飞猛进，不管是抗拒还是顺从，谁都无法否认，人工智能正在改变我们身边的点点滴滴。和人工智能技术发展几乎同步，中小学的人工智能教育也越来越引起关注。《普通高中信息技术课程标准（2017年版）》虽然在必修模块中增加了“人工智能”，但毕竟是在高中阶段，并没有引起足够重视。《义务教育信息科技课程标准（2022年版）》的发布，则意味着人工智能教育要进入国家课程，必将迎来新的热点。

中小学人工智能教育该如何实施？一位人工智能方向的博士曾经非常直接地表示，让中小学生做一个训练识别手写体的模型，或者体验一下各种AI应用，不过是在教“屠龙之术”——指极为高明，但是在现实中用不到的技术或本领。显然，远离生活应用的AI教育无法吸引中小学生，是没有生命力的。那么，中小学人工智能教育究竟如何开展才真正有效？笔者从开展AI科创活动这一可行的角度提出了自己的观点。

● AI科创活动的提出和分类

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学，科创活动是科技创新活动或者科普创新活动的简称，AI科创活动则是指融合AI技术的科技创新活动。

以研究内容或者方向进行划分，中小学的AI科创活动大致可以划分为AI+科研、AI+工程和AI+艺术三类，加上AI本身就是一个重要的研究领域，于是形成了AI科创的四个主要类别或者研究方向。

AI+科研。随着科技的发展，数据探究已经成为科研活动最常用的手段，而运用AI能够很好地开展一些重复烦琐的数据整理工作。

AI+工程。在创客活动中，AI技术的应用已经非常普遍。AI技术的普及又推动中小学开源硬件逐步走向卡片电脑，如树莓派、虚谷号、拿铁熊猫和行空板等。这些控制板内置Linux系统，流畅运行如TensorFlow、PyTorch之类的AI框架。

AI+艺术。自从世界上第一件被拍卖的AI艺术品以432500美元的高价售出，“AI+艺术”的浪潮便势不可挡。作为艺术与科技结合最典型的代表，交互艺术更是融入了越来越前沿的技术。随着生成对抗网络的普及，生成图像（如猫脸、二次元头像、人脸等）、图片上色、艺术风格迁移等各种有趣的艺术应用不断出现。

AI实验研究。和其他经典计算机算法不同的是，AI模型的训练和数据集的关联特别密切。当面对一个真实的问题情境时，即使在最新SOTA模型的支持下，也需要微调很多参数。

● 开展AI科创活动的可行性分析

中小学生能不能使用AI技术开展科创活动？在编写清华大学出版社初中信息科技教材时，笔者曾针对AI技术在解决真实问题方面，与几位核心编委总结出了三种典型的途径，并梳理出相应的支持工具。

1.应用AI技术解决真实问题的三种途径

途径一：调用人工智能开放平台的接口

人工智能开放平台的接口一般采用Web方式，因而也称为WebAPI。利用这些WebAPI，学生不需要自行训练AI模型，也不需要理解原理，只要将数据提交到平台，然后根据返回的预测结果做相应的执行即可（如图1）。人工智能开放平台最典型代表是百度AI开放平台，它提供了一个名为“baidu-aip”的Python库。

途径二：调用人工智能应用平台

一些人工智能的算法和模型会封装为AI应用平台，和WebAPI一样，学生不需要自行训练模型，也不需要理解原理即可使用。可以将这些AI应用平台看成是本地的API，常见的AI应用平台有OpenCV和MediaPipe等，OpenCV还支持自行训练分类器（AI模型），也可以称为AI开发平台。

有些AI算法和模型并没有封装为人工智能应用平台，以扩展库或者模块等方式发布，需要用户自行编译使用，如清华大学自然语言处理实验室推出的中文文本分类工具包THUCTC（THU Chinese Text Classification）、常见的語音合成库Pyttsx等。

途径三：收集数据选择算法训练模型

一些特定的场景是找不到通用工具的，只能靠自行训练数据。例如，你想将自家的几只宠物狗进行分类识别，就只能收集数据，再选择算法自行训练模型了。又如，识别普通话有很多WebAPI，但是要识别温州话这种地方方言，就只能靠自己训练。

显然，途径三的难度是最高的，也是最有AI味的做法。实际上，以深度学习为代表的新一代人工智能技术的兴起，是对AI技术的一种有效“降维”，开发难度变低，识别效果却更好。

2.开发AI应用系统的常见支撑技术

实际上，不管采用以上哪一种途径，都仅仅是“用AI解决问题”的一个核心环节，并非全部。作为一个完整的AI应用系统，对数据进行推理或者识别环节固然重要，但获取数据（感知），根据识别结果执行相应的动作（控制），同样不可缺少。还有，这个AI应用如何部署也非常重要。这说明，仅仅有AI开发工具是不够的，还需要其他的工具来支持。

以设计一个看到小朋友微笑会摆摆手并打招呼的微笑机器人为例，除了需要训练一个识别微笑表情的AI模型或者相关WebAPI外，还需要很多其他相关工具：实时获取摄像头画面的工具，如OpenCV;一个能够驱动舵机的软硬件工具，如pingpong和掌控板;一个能够部署这个AI应用的迷你电脑，如拿铁熊猫;一个语音合成工具，如Pyttsx等。

Python是当前中小学生学习AI的主流语言。在陪同学生开发AI应用的这几年中，笔者收集了一些常见Python库，并按照功能类型进行了分类（如下页表）。

当然，中小学生开发的AI应用往往需要部署在一些迷你电脑上，能够运行Linux系统的开源硬件就成为最常见的选择，如jetson Nano、树莓派、虚谷号和行空板等，这些硬件的性能和价格都不一样，可以根据具体的要求做出选择。如果对Linux系统不熟悉，也可以选择拿铁熊猫。

● AI科创活动案例

温州中学的人工智能教育始于2017年，随着AI技术的平民化，逐步从Kinect（微软的一款深度摄像头）、LeapMotion（一款手势传感器）转向到基于普通摄像头和深度学习上来，2021年，学校建设了人工智能实验室，开设了“走进万物智联的世界”课程。学生在物联网的基础上，利用HASS（HomeAssistant，一款开源的智能家居网关）将实验室等智能家居设备打通，设计一些智能控制方向的有趣应用，成为学校智慧校园建设的一部分。

案例1：趣味二进制灯组——基于数字识别的灯光控制系统

简介：用户在摄像头（高拍仪）下写0～255之间的数字，智能终端将数字转化为二进制数字，然后发送相应的MQTT消息到MQTT服务器（SIoT），HASS网关接收到消息后，控制实验室中的智能灯泡（8个一组）的开关状态（如图2）。

AI技术：手写数字识别。利用MMEdu的Classification模块和LeNet网络模型。

相关技术：物联网技术。借助MQTT服务器实现消息中转，再使用HASS实现智能灯具的控制。

点评：这是典型的AI+工程的案例。手写体识别是一个非常经典的人工智能实验，也是一个入门级的卷积神经网络实验，借助LeNet网络模型和Mnist数据集一般在数分钟内就能训练出一个准确度较高的AI模型。但是模型训练出来后还能做什么？很多AI课程都没有进行拓展。“趣味二进制灯组”案例给出了一个答案，那就是从AI模型训练走向AI应用系统开发，让物联网和人工智能结合起来。

案例2：AI魔法棒——基于掌控板的手势识别

简介：魔法棒上内置了加速度传感器（利用掌控板即可），利用MQTT发送每一次完成动作后的加速度传感器数据（每秒采集128个），形成数据集后在台式机上训练出AI模型。之后，每完成一个动作就用MQTT发送消息到台式机上预测，再利用MQTT接收识别结果，在屏幕上显示或者执行相应的动作（如下页图3）。

AI技术：BP神经网络。利用BaseNet搭建全连接神经网络，在事先采集数据的基础上训练AI模型，用这个模型对新的数据进行预测。

相关技术：传感器技术和物联网技术。利用MQTT消息传递数据，借助SIoT的数据导出功能得到数据集。

点评：AI课程中在教学BP神经网络时，往往采用“波士顿房价预测”“鸢尾花识别”之类的案例，非常无趣。本案例巧妙地使用了MQTT消息传递数据，借助台式机的算力搭建BP神经网络，训练数据并用于新数据预测，从而识别出传感器的运动状态（手势），是“创客+AI”教育的典型案例。

案例3：是什么决定了青少年的见识——基于好问题数据的深度探究

简介：不同地区的学生在见识方面是否一致？他们的“提问”能力有什么不同？而这些差别和地区GDP是什么关系？带着这样的问题，学生分析了全国中小学生“好问题”大赛的一百多万条数据，选择了上海和赣州两个地区进行多方面的比较，最后得出相关结论。

AI技术：中文文本分类。利用中文文本分类工具包THUCTC，对学生的问题内容进行分类。

相关技术：数据分析技术。利用Pandas分析一百多万条数据。

点评：这是长三角中学生数据探究大赛的一个获奖作品。虽然说利用jieba库分词和统计词频也是AI技术的典型应用，但毕竟过于简单。如果没有中文文本分类工具包（THUCTC）的支持，这个数据探究工作是无法进行的，因为数据量太大了。

案例4：当MediaPipe遇上BP神经网络——对表情识别的另一种研究

简介：表情识别（Facial Expression Recognition）是计算机理解人类情感的一个重要方向，也是人机交互的一个重要方面。训练表情识别的AI模型对算力要求较高，需要GPU环境的支持，在普通机房无法开展这方面的研究。但是，如果先利用Dlib或者MediaPipe獲取人脸特征点，然后搭建神经网络进行训练呢？学生利用Extended Cohn-Kanade（CK+）数据集进行实验，获得了很不错的准确率。

AI技术：MediaPipe和BP神经网络。先利用MediaPipe获取人脸特征点，再用BaseNet搭建全连接神经网络。

点评：这是一个“AI实验研究”方向的典型科创案例。MediaPipe是谷歌开源的人体关键点检测算法，可以识别人脸、手势、姿态等多种关键点，并且检测速度足够快。在MediaPipe的支持下，学生找到了一种低算力模式下的深度学习研究方向。

● 反思与展望

通过这几年开展AI科创活动的实践，笔者深深体会到用AI解决真实问题并不困难，学生完全有能力学习以深度学习为代表的新一代人工智能技术，并开发出一些简单有趣的AI应用。虽然目前国内开展AI科创活动的学校主要集中在上海、北京这些城市的名校中，但笔者坚信，AI技术很快就会走下神坛，成为学生们实践技术创新的重要工具之一。

参考文献：

[1]吴俊杰，谢作如，戴娟.中小学AI教育需要怎样的工具[J].中国信息技术教育，2022（12）：19-22.

[2]谢作如，邱奕盛.用深度学习和物联网技术设计“AI魔法棒”[J].中国信息技术教育，2022（09）：77-79.

中国信息技术教育2022年13期

中国信息技术教育的其它文章: 多模态交互在教学中的应用; 基于社会主义特色未来学校的高中地理《中国的粮食问题》教学案例研究; 劳动教育共同体信息化平台的构建与研究; 极简教育技术在教学资源制作中的应用; 基于计算机图形学的植物果实轮廓特征差异性检验; Python作业自评检测系统的开发与教学实践