总机电话:010-64522026   编辑部:010-62178764   邮发代码:82-418   刊号:ISSN1671-4350   定价:16.00

[专题]当人工智能遇上青少年科技创新活动

文_谢作如/浙江省温州中学

2023-04/总第325期

阅读数3

近年来,人工智能技术发展突飞猛进,各种应用不断刷新人们的想象力。从识别准确度超过人眼的计算机视觉开始,人工智能逐步走向产业化。而以ChatGPT为代表的AIGC(人工智能生成内容)兴起则再次告诉人们,人工智能将必然成为推动科技跨越发展、生产力整体跃升的驱动力量。与人工智能的快速发展几乎同步,中小学人工智能教育也在受到越来越多关注。2017年发布的《普通高中信息技术课程标准》在必修课程中增加了“人工智能”的要求,《义务教育信息科技课程标准(2022年版)》则将“人工智能”作为重要的学习内容。

科技创新活动与科普活动是中小学跨学科学习活动最典型的代表,也是学有余力的学生的重要选择。很多科学工作者和工程师都是因为少年时期参加科技创新活动得到启蒙,从而确定了人生目标。我们深信,人工智能很快会成为继计算机、互联网、开源硬件与物联网之后,最重要的青少年学习和工作的助手,融合了人工智能技术的科技创新活动呼之欲出。


人工智能是青少年科技创新活动的新研究工具

随着人工智能的发展,机器学习成为科学发现中日益重要的核心工具,它能够对大规模科学实验数据进行建模与分析。科学家认为“机器猜想+科学智能”将成为科学发现的新范式,并在这方面取得了许多令人瞩目的重大进展,典型例子如地球科学领域的预测天气、生物科学领域的预测折叠蛋白质结构等。2023年,科技部会同自然科学基金委启动了“人工智能驱动的科学研究”专项部署工作。

既然人工智能终将成为科学发现的主要研究工具,那么在科技创新活动中强调人工智能,培养利用人工智能解决问题的意识和能力,能够帮助青少年对未来科学研究工作形成全新的认识。而深度学习的兴起,促使人工智能的技术门槛开始降低。只要拥有足够丰富的数据,借助算力与开源算法,很多人都能训练出人工智能模型。换句话说,只要掌握了机器学习的流程,即使不了解原理,甚至不熟悉编程,都能用人工智能解决问题——因为智能可以通过“喂数据”而获得。那么,人工智能在青少年科技创新活动中可以发挥哪些作用呢?

方向之一:解放人力,处理复杂繁琐的事务

在当前的青少年科技创新活动中,数据探究这一活动主题逐步受到重视(典型活动如长三角中学生数据探究大赛、国际青少年人工智能交流展示会深度学习挑战赛等),但收集与整理数据恰恰又是科技创新活动中最复杂、最繁琐的工作之一。利用人工智能完成重复繁琐的数据处理工作,能够很好地体现出人工智能的重要价值,即解放人力。比如,在科学观察实验中用摄像头实现自动识别,在种子发芽实验中用摄像头统计数量,对大量的非结构化数据进行智能处理等。

案例1. 利用人工智能助力科学观察 科学课程中有很多关于观察植物的探究活动,但往往只要求学生用肉眼观察植物的每天生长情况,以文字形式记录在本子上。这样的观察记录无法提供具体的监测数据。如果要探究植物的生长情况与环境(如土壤湿度、光照等)的关系,那不仅需要定时拍摄照片,还要同步记录数据,二者结合才能够更加直观分析植物在不同环境下的生长情况,从而了解植物的习性特点。温州中学学生编写了一个能够同步记录图像与传感器数据的信息系统。这个“科学观察辅助工具”(图1)可以运行在“行空板”或者“虚谷号”上,使用摄像头采集画面,通过土壤湿度传感器记录土壤信息。当摄像头的画面发生变化(如开花、结果、有害虫等),或者传感器的数值发生变化,则自动保存图像,并在图像上标注相应信息。其中判断是否开花结果与虫害,使用了MMEdu训练的目标识别人工智能模型。借助这类系统,能够将人从繁琐、无聊的观测工作中解放出来。

202304zt1-01.jpg

图1 “科学观察辅助工具”工作流程图

案例2. 利用摄像头统计种子发芽情况 种植活动是劳动教育的重要组成部分,而研究不同条件下(如光照、温度、pH值等)种子萌发的差异则是常见的科学实验。通过种子萌发实验,取得实验数据,分析检验就可以获知不同条件下种子萌发是否存在差异。一般来说,这种研究都会采用对照实验的方式开展。种子萌发实验并不复杂,但要得到较好的统计意义,避免小数据带来的误差,数据量应该要大一些。可是种子数量一多,定时统计就成为一种较重的负担。广州的曾祥潘老师探索了一种利用计算机视觉辅助观察的研究方法。他在实验过程中用摄像头定时拍照记录,再利用深度学习目标检测算法识别照片中的发芽种子,取得实验数据,最后使用R语言对两组数据进行检验。在发芽种子的识别方面,他使用了YOLO v5算法和SAHI深度学习推理辅助工具。

案例3. 对“好问题大赛”数据的深度探究 不同地区的学生在见识方面是否一致?他们的提问能力有什么不同?而这些差别与地区GDP是什么关系?带着这样的问题,温州中学的章锦阳等同学深度探究了中国学生好问题征集评选活动的100多万条数据。他们选择了上海和赣州两个地区,借助分词和词频统计等技术进行多方面比较,最后得出相关结论。在这一过程中,他们遇到的最大困难在于如何确定问题的类别,毕竟100多万条数据不可能一一靠人力标注。他们最终找到了清华大学开源的中文文本分类工具包(THUCTC)。借助这一工具,简单编程后批量完成了这个工作(图2)。有趣的是,学生发现THUCTC的文本分类效果并不够好,因为模型是基于长文本(新浪网站文章)进行训练,对短文本并不适用,于是他们选择了计算机专业进行学习,立志要设计更好用的文本分类工具。

202304zt1-02a.jpg202304zt1-02b.jpg

图2 对两个地区的学生问题进行词频分析对比结果

方向之二:另辟蹊径,通过采集数据解决数学难题

科技创新活动关注生活中的真实问题,学生常常会遇到一些需要用数学知识解决的难题,如用数学公式表征多组数据之间的关系。很多有趣的科技创新活动主题就因为受限于学生的数学知识而无法普及。有时候学生还会遇到有些数据彼此关联密切,却又找不到精确数学公式表示的情况,如工程应用和经济分析领域。那么,用采集数据加上训练模型的方式拟合多种物理量之间的关系,显然是一种有效的解决问题方式。我们可以把神经网络看成万能数据拟合工具,即使是一个黑箱子,也不妨碍人工智能成为学生开展科技创新活动的好帮手,从而培养数据意识和计算思维。


中国科教工作者协会会员专属文章,

以下平台可使用同一账号密码登录,点击开始同步密码

确认