商业
在教室中建立一个支持机器人活动的辅导系统——两个绿野仙踪研究

  本文开发了一种认知模型的构建和评估方法,以支持学生在学校机器人学习中解决问题的能力,旨在为未来辅导系统的实施奠定基础。他们进行了两项《绿野仙踪》研究,一项在教室,另一项在实验室。基于认知模型,人类巫师对20名学生进行了配对支持。对研究过程进行录像并进行定性分析。详细描述了这种定性研究方法。对这些研究的评估表明,学生们对巫师的反应大多是积极的。我们还发现了提高学生解决问题能力的方法。基于对《绿野仙踪》研究的评价和观察,本文提出了未来机器人技能辅导系统的设计方案。

  物理计算和机器人技术在世界各地的教育中越来越受欢迎。K-12计算机科学框架建议构建个人相关的工件,例如机器人系统,用于计算机科学教学(K-12计算机科学框架指导委员会等,2016)。为了将机器人技术引入学校,已经构建了不同的课程,并且可以找到关于对学生动机和方向产生积极影响的有希望的发现(Kaloti-Hallak等人,2015;Kempf et al., 2020;Verner & Ahlgren, 2004)。然而,机器人活动中的问题解决过程往往是复杂的,学生在机器人活动中会遇到各种困难(Kafai et al., 2014;Katterfeldt et al., 2016;Cross et al., 2016)。在计算机科学和其他STEM(科学、技术、工程和数学)学科中,有多种技术增强工具来支持学习者解决问题的任务。一个可能的工具是智能辅导系统(VanLehn, 2006, 2011)。实现智能辅导系统的方法有很多,但目前在学校机器人教育领域还没有这样的系统。

  构建和编程机器人是一个复杂的解决问题的过程,因为它的成功不仅仅取决于软件。硬件的适当构造、对环境的影响以及学生的数学技能也很重要。机器人辅导系统的一个巨大潜力是利用机器人的传感器提供适当的反馈。智能交通环境下的反馈已经得到了很好的研究,例如与学生使用反馈水平、他们的求助和任务外行为有关(Aleven et al., 2006;Baker et al., 2004;McLaren et al., 2014)。在这篇文章中,我们着重于用定性研究的方法来了解学生的问题,关于智能导师实施的障碍,并提供我们在这一领域进行的定性研究的详细信息。

  本研究的第二个目的是建立并提供机器人辅导系统的结果。在我们的方法中,我们实施了两个绿野仙踪的研究,用很少的技术努力来评估我们的认知模型对成对工作的学生的影响。这些研究是在2017/18学年进行的,其中一些结果已经发表在第一作者的论文中(Schulz, 2019)。本文对不同反馈方式的有效性进行了测试;其中两个与这里介绍的《绿野仙踪》研究有关。在本文中,我们使用相同的数据来报告导师和所包含的认知模型的构建。此外,我们提出了认知模型的适应性。

  在计算机科学教育(CSEd)中,机器人是教授计算机科学技能的重要组成部分(K-12计算机科学框架指导委员会等,2016)。教育中的机器人常常与建构主义的学习理论联系在一起(Papert, 1980)。建构主义理论源于皮亚杰的建构主义理论,它描述的是学习者头脑中知识结构的建构。受此启发,建构主义理论建议通过包括头脑之外的活动来构建知识结构,例如在修补过程中使用有形设备并最终共享工件(Papert & Harel, 1991;Resnick & Rosenbaum, 2013;经验丰富的人,2005年)。这种方法意味着一种白盒设计,从头开始构建机器人等设备。设计过程是这一过程的重要组成部分。在这里,学生们来回设计一个个人有意义的人工制品,并在这种情况下学习(Stager, 2005)。Constructionsim是作为一种学习理论而建立的,但目前也作为一种设计框架,例如构建数字文物,在学校中进行建构主义干预,以及设计新媒体(Kynigos, 2015)。

  然而,先前在机器人和物理计算方面的研究发现,解决问题的过程对学生来说是复杂的,并且会产生问题,例如如何调试软件并识别问题的根源(Okita, 2014;Cross et al., 2016;Kafai et al., 2014;Katterfeldt等人,2016)。Okita(2014)提出了关于这些问题的初步提示。一项干预研究发现,递归反馈是学生的障碍之一。递归反馈描述了用于指导机器人的编写程序代码与机器人在现实世界中的运动结果之间的差异。当学生在机器人上启动程序时,他们不可能改变它。机器人完成程序后,学生们必须回溯找出指示机器人动作的代码片段。在另一项研究中,学生遇到的主要问题是调试程序代码(Cross et al., 2016)。在这项研究中,为设备编程是学生面临的挑战。然而,他们喜欢机器人项目的动手性质。Kafai等人描述了电子纺织品项目中与程序代码分离的困难:“然而,调试电子纺织品是一个复杂的过程,比调试程序代码更复杂,因为错误可能是由代码、电路设计或工艺引起的。”1 - 15]。所描述的问题来源也与机器人有关。在其他项目中,他们试图消除概念的重叠,比如物理和计算机科学教育。因此,构建了硬件模块,最大限度地减少了电路设计错误的可能性(Katterfeldt et al., 2016)。

  从这些文献中,我们可以看到,学生在学习机器人时必须解决各种各样的障碍。然而,到目前为止,学生的问题很少在研究中得到具体的解决。基于现有文献和Schulz和Pinkwart(2017)提出的定性分析,已经制定了关于学生问题的分类法。分类法包括“硬件”、“软件”、“环境”和“数学/物理”等类别,以及进一步的子类别(见表1)。作者还指出了哪些信息对学生解决所提出类别中的问题有帮助。该分类法可用于在机器人任务期间为学生提供支持。

  表1分类学生在机器人活动中遇到的问题

  提供支持的一种可能方式是建立一个辅导系统。这将使许多机器人课程成为可能,并扩大教育规模。辅导系统可分为计算机辅助教学(CAI)和智能辅导系统(ITS)。使用CAI的辅导系统为学生的答案提供即时反馈和提示。使用CAI,学生可以直接在学习环境的响应字段中键入他们的答案。ITS对解决问题的步骤提供反馈和提示,以指导学生通过解决问题的过程,在途径和反应方面具有更大的可变性(VanLehn, 2011)。一种特殊类型的ITS是认知导师,包括围绕学生知识的认知表征(即模型)专门构建的解决问题的环境(Corbett et al., 2001)。他们通过实践促进学习,并支持反思。在下面的段落中,我们将讨论智能辅导系统的可能特征,其目的是在学习活动中支持学生。

  在Aleven et al.的文献综述中,作者得出结论,学生往往不知道自己何时需要帮助(Aleven et al., 2003)。这使得学生很难寻求帮助,这些发现超出了课堂环境。在中学的研究表明,学生很难找到一个适当的时间点,他们应该寻求支持(Aleven等人,2006;Baker et al., 2004)。Aleven及其同事(Aleven et al., 2006)创建了一个支持求助的认知导师,并收集了学生帮助行为的定量数据。当需要提供帮助时,处理学生的脱缰行为也很重要。Baker等人(2004)评估了学生在与认知辅导系统互动时的非任务行为。学生们分别进行了前后测试,以衡量他们的表现,并确定其与学生的任务外行为的关系。不幸的是,我们并不清楚到底问了什么问题,用什么测量仪器测试了什么。研究人员还观察了学生们是否坚持完成任务。在观察过程中,学生的行为被量化到预先建立的类别中。

  当学生提出要求时,许多认知导师会提供帮助。寻找导师给予反馈的合适时机被Koedinger和Aleven(2007)称为“援助困境”。支持的频率是一个悬而未决的问题。学生应该少得到一些提示来自己解决问题,还是每一步都得到频繁的反馈?在他们的复习中,互动式和非互动式反馈都进行了测试,学生有可能要求支持。支持分为五个阶段,每个阶段都变得更加详细。作者的结论是,目前还不可能确定最佳的支持程度。

  McLaren等人观察了反馈的强度,并提供了三种不同的反馈:1)无反馈,2)指出错误,通过文本、协助反馈,以及3)与2相同的支持,但具有预防性(McLaren等人,2014)。这项研究的结果表明,那些在考试前表现最好的学生比那些更需要帮助的学生寻求更多的帮助。为了评估学生的成功,课程的完成程度和学生的步骤是否导致目标被观察和定量呈现。教师对学生的内容理解能力、探究能力等进行评估,通过打分进行分类,分为高、中、低三种。老师们对学生的技能进行了定量评估。作者认为,这些发现可能取决于他们的辅导系统的版本,因为它支持学习过程的早期阶段。然而,分数较低的学生有可能在以后的阶段需要支持。我们必须考虑到,成绩优异的学生往往更清楚自己何时需要帮助,而且通常拥有更好的元认知技能。

  在物理计算和机器人的辅导系统的集成是罕见的,但似乎是有前途的,就目前的反馈频率的文献。Spikol等人提出了一种方法来支持解决问题的活动并支持学习者(Spikol等人,2016)。作者指出了许多障碍:例如,图像数据处理的实施和解释,以推断学生的活动。Ruiz et al.(2017)选择了一种增强现实方法来支持电路的构建。他们研究了年龄在22到43岁之间、对物理计算感兴趣的成人学习者。利用平板电脑的摄像头,学生可以通过增强现实解决方案检查电路的正确性,并可以请求信息。第一项研究表明,学生在使用平板电脑而不是模拟电路模型时犯的重大错误更少。

  鉴于我们对机器人背景下的辅导的了解,仍有一些悬而未决的问题。这篇文献综述发现,已经开发出一种分类法来对学生在机器人学习过程中遇到的问题进行分类。然而,为中学生提供复杂机器人任务的支持系统的开发仍然缺失。提出的分类法可以用来开发一个认知模型来实现这种机器人辅导系统的原型。根据Aleven(2010)的说法,认知模型包含了描述导师何时以及提供何种反馈的规则。此外,关于学生的先验知识和偏见的信息对于提供适当的支持是必要的。需要测试的是,在学生与机器人互动的过程中,潜在的认知模型是如何影响学生的。观察和评估学生对反馈的反应以及他们如何使用反馈来解决问题是本文的中心目标。因此,原型需要执行和评估,然后进行调整。对于这种方法,我们需要将教育技术和计算机科学的教育观点结合起来。在我们看来,这里有宝贵但未被发掘的潜力。这一研究缺口导致了以下研究问题:

  1.

  基于认知模型的即时反馈对支持学生完成机器人任务的影响是什么?

  2.

  根据发现的效果,需要对认知模型或反馈进行哪些调整?

  我们进行了两项不同的《绿野仙踪》研究,以确定机器人辅导系统的效果。“绿野仙踪”研究可以在系统开发的早期阶段进行,以测试原型。它可以提供定性和定量的数据来观察参与者的行为模式和偏好。一个人,被称为向导,根据指定的规则提供反馈。在操作过程中,向导可以是可见的或隐藏的,研究中实施的技术可以不同,例如,它可以是低技术的,甚至可以是无技术的(H?ysniemi et al., 2004)。因此,如果课堂上的老师始终遵循反馈规则,他或她就可以成为一个可见的向导。在进行任何技术实现之前,使用可见向导进行研究是有价值的,这样可以测试参与者是否理解反馈。当向导被隐藏时,参与者会认为支持是由一个全自动的辅导系统提供的。这些研究在不同阶段的人机交互领域很常见(H?ysniemi et al., 2004)。在任何情况下,研究都应该对参与者透明。如果实现了可见向导,则有必要向参与者解释向导的角色。在隐藏向导的情况下,透明度会影响结果,至少应该在研究结束后显示(Dahlb?ck et al., 1993)。因此,在构建高成本系统之前,“绿野仙踪”研究对于测试参与者的接受程度、需求和需求是很重要的。

  表2研究概况

  我们决定进行一项绿野仙踪研究来解决我们的研究问题,因为使用这种方法,我们可以用很少的技术努力来评估学生对所提供的支持的反应。然而,该研究的设置和生成的数据仍然可以与高科技的辅导系统相媲美。机器人缺乏可评估的支持系统是另一个原因,首先从低技术版本开始,以更好地了解学生对反馈的需求,因为其有效性尚未经过测试。为了改变技术实现的级别,我们进行了两个不同的wizard -of- oz研究:一个是可见的向导,一个是隐藏的向导。表2给出了研究设计的概述。

  我们在研究中收集了定量和定性的数据。在本文中,我们分析了定性数据,重点研究了辅导系统的应用。由于我们对学生的反应时间或他们详细的程序代码不感兴趣,我们没有收集定量的日志数据。重要的是,首先要从定性的方法开始,更多地了解学生问题的不同方面和辅导系统的要求。从数量上开始有可能忽略研究人员无法预料的方面。由于我们的研究问题最重要的信息是学生的口头评论和他们对机器人的处理,我们决定使用访谈(第一次和第二次研究)和录像(仅在第二次研究中)来收集定性数据。利用测试仪器收集定量数据,评估辅导系统对学生学习的初步效果。

  两项研究都基于相同的认知模型(例如,给出反馈的规则和教师使用的层次),该模型源自所提出的分类法,并通过规则扩展,通过解释问题的来源和给出可能的解决方案,以直接指示的形式给出反馈。学生不应该问问题,当学生遇到问题或犯了他们自己无法纠正的错误时,巫师需要采取行动。这两个Wizard-of-Oz研究有不同的目标(见表2)。

  第一个研究(WOZ I)的目的是评估学生得到的直接指导,并对任务中出现的问题进行概述。其中一点是观察基于认知模型的反馈是否对学生有帮助,是否可以被向导应用。因此,在本研究中,实现一个可见的向导就足够了。为了达到这一目标,在干预课程结束后,对所有学生和巫师进行了结构化访谈。我们决定使用可视向导来进行这项研究,因为我们的目标是测试认知模型。因此,不需要隐藏向导,我们有机会在有更多参与者的教室环境中测试模型。在教室里不可能有隐藏的巫师,因为房间里的人太吵了,无法看到或听到一群人在说什么。这将是向导给出适当反馈的一个问题。

  在第二项研究(WOZ II)中,测试了整合认知模型在辅导系统中的适用性。因此,有必要创造一个似乎只受自动化辅导系统影响的环境。第二项研究是作为实验室研究进行的,向导在第二个房间使用多种媒体进行观察:“Slack”向学生发送提示;屏幕共享可以看到学生的屏幕,还有一个摄像头可以看到学生与机器人的互动和他们的肢体语言。因此,学生对向导的提示和任务进展的反应被录像下来。对录像进行转录并采用定性和定量方法进行评价。关于收集的数据和访谈问题的更多信息见4.1节和5.1节。

  20名参与者参加了这两项研究(两项研究的参与者不同)。所有人都是德国文法学校的学生,并参加了大学的自愿科学课程。这些组将在相应的研究描述中进行更详细的描述。

  两项研究都使用了两种不同的机器人。其中一个是乐高头脑风暴EV3机器人,一些参加学校计算机科学课程的人知道这个机器人。第二个设备是来自Aldebaran的Nao机器人H25(见图1),它在像Robocup这样的专业机器人挑战赛中更常见。由于它的多个传感器和执行器,各种可能的任务是巨大的。然而,Nao机器人很可能过于复杂和昂贵,无法在学校中经常使用。

  使用不同的软件对设备进行编程。对于LEGO Mindstorms EV3机器人,我们使用了Open Roberta Lab(脚注1),因为这个编程环境类似于Scratch(脚注2),它被一些学生称为基于块的编程语言。对于Nao机器人的编程,我们选择ChoregrapheFootnote 3(参见图2,通过屏幕共享的向导视图)。这是一个可视化的界面来编程机器人,并提供了多种功能,这对新手很有帮助。编程是通过块(预编程代码片段)完成的,这些块包含在Choregraphe中,但也可以由用户构造(参见图2,窗口“编程块”)。这些块通过线连接以激活它们。还包括一个仿真工具,用于在计算机上测试程序,并在物理设备上尝试之前检查机器人的运动。这个功能对于年轻的学生和新手来说很重要,这样可以保护设备。另一个特点是所谓的“关键帧”的创建。通过关键帧,机器人可以被放置在一个位置,比如牵手,这个位置可以保存在一个新的块中。这使得构建机器人的复杂运动变得非常容易,而无需对每个细节进行编程。

  两项研究的任务几乎相同。在第一项研究中,学生有更多的时间(每节干预课最多10分钟,见表5)。这是合理的,因为第一项研究是在课堂环境中进行的,在课堂环境中,更多的干扰因素发挥了作用。然而最终,同学们在绿野仙踪的研究中我解决了更多的任务。

  图1

  figure 1

  Nao机器人有一个红色的球

  图2

  figure 2

  WOZ II中的向导视图,在choreography中显示学生的程序代码

  在《绿野仙踪》的研究II中,我们给学生们布置了最有趣和最多样化的任务,以确保他们与机器人有高度的互动。任务的构造方式是,相关分类法中显示的所有问题源都可以与学生相关。《绿野仙踪》的学生们被要求给一个单手拿笔的机器人编程。使用这支笔,机器人应该被编程在一张纸上画一个“x”。之后,他们应该试着画更多的符号,比如“y”或“o”。在《绿野仙踪》的研究II中,学生们的任务只是画一个没有其他符号的“x”。这意味着两项研究的主要任务是相同的,但省略了针对快速学生的额外任务。只有在两个研究中选择相同的任务进行研究比较。表3和表4列出了两项研究中使用的详细任务。

  表3 LEGO Mindstorms EV3的任务

  表4 Nao机器人的任务

  在这两项研究中,进行了一项测量基本编程能力的心理测量测试(m

  hling等,2015)。它是一个经过验证的测试仪器,它解决了控制结构的使用问题。这个测试是为七年级到十年级的学生设计的。考试分为六个题,难度逐渐增加。每个任务都可以得1分,但任务5需要2分。总的来说,学生可以达到0 - 7分。在每个任务中都有一个带有坐标和指南针的游戏板,机器人站在上面。给出了任务的解释,然后是一些伪代码。目标是计算出程序运行后机器人将站在哪个场地,以及机器人将朝向哪个方向。该测试采用项目反应理论进行验证,并且是一维的,因此一个潜在的构念是由几个项目决定的。测试区域的内容包括:操作序列、条件、具有固定重复次数的循环、具有退出条件的循环,以及这些构造的嵌套。测量的潜在构念是使用控制结构的能力。本测试作为前测和后测来评估干预是否对学生的编程能力产生积极影响,并评估认知模型。

  认知模型是基于文献综述中提出的分类结果。在智能辅导系统(ITS)领域,分层模型的使用,导致更详细的反馈,是常见的。例如,Anohina(2007)使用两层模型,采用两种不同的帮助模式,使支持适应学生的需求,避免挫折。

  因此,我们开发了一个四层模型,并在研究开始时向学生介绍了该模型。

  第一层:在这里,学生被告知他们的问题的原因在哪个主要类别。这可以是硬件、软件、环境或数学/物理知识。这个问题也可以通过在多个类别(这里称为“问题的重叠来源”)中进行调整来克服,然后对所有这些问题进行命名。

  第二层:在这一层,子类别被告知学生。如果第一层有重叠,那么两个主要类别的子类别就会呈现给学生。

  第3层:第1层和第2层比较笼统,第3层应该针对学生的具体情况更具体地描述问题,而不告诉他们解决方案。

  第四层:只有在这一层,导师/向导告诉学生具体的问题并给出解决方案。这里的反馈是尽可能具体的,就像给出一个具体的值来实现在程序中。

  巫师反馈的措辞是标准化的。但是,各个向导在描述第三层和第四层的问题或解决方案时可能会有细微的差异。在第一层开始后,向导给出进一步提示的速度可能会有所不同,这取决于提供反馈的人。为巫师设定时间限制是不合理的,因为学生的动机和自我效能感在小组中是非常不同的。

  机器人应该绕着一个盒子行驶,使用超声波传感器来测量到盒子的距离。在识别出盒子并稍微转了几圈之后,机器人就会撞到盒子上,但无法转到足以继续算法。

  1.

  第一层:问题出在软件上。

  2.

  第二层:问题出在学生编写的程序代码上。

  3.

  第三层:机器人不能太靠近箱子,以免撞到箱子。

  4.

  第四层:超声波传感器的阈值应编程为至少15cm。然后机器人需要转身。

  认知模型还包含向导的规则,例如何时提供支持以及应该在反馈给学生的信息中包含哪些信息。遵循这些规则,向导可以更好地识别成对的学生何时需要支持,并决定何时提供帮助。巫师们应该按照下列规则行事:

  1.

  在整个干预过程中,观察学生与电脑、机器人和同伴的互动。

  2.

  如果学生的肢体语言显示出他们变得失去动力和沮丧,学生谈论需要帮助,或者很明显,学生的解决问题的方法已经走错了方向几分钟,那么向导应该提供支持。

  3.

  使用四层模型提供帮助,总是从第一层到第四层,只在需要时提供更详细的帮助。支持从最一般的提示开始,这样学生就可以在不直接给出解决方案的情况下找到解决方案。

  4.

  如果出现一个新的独立问题,那么向导必须从第一层开始给出提示。因此,对于每个问题,整个过程都从第一步重新开始。

  5.

  如果没有需要帮助的迹象,那么巫师应该呆在后台,不跟学生说话。学生的互动应该集中在合作伙伴身上,以便与他/她一起解决问题。

  作为模型的教学方面,两个特性实现的任务对于Nao机器人:(1)第一只包括的任务编程的机器人的上身,以避免关于机器人的平衡问题,(2)一个程序块准备打开绿色LED右眼的机器人在任务3.1和3.2检测到一个球(见表4和图3)。因此,可以排除传感器问题的来源问题。

  图3

  figure 3

  Nao机器人检测到一个红球

  摘要

  介绍

  文献综述

  方法

  《绿野仙踪》第一册

  《绿野仙踪》研究二

  讨论

  有限公司

  结论与展望

  笔记

  参考文献

  作者信息

  道德声明

  搜索

  导航

  #####

  在第一个研究中,7年级到10年级的14名学生(2名女生,12名男生)(年龄在13岁到16岁之间)参与了研究。这些学生有编程和计算机科学方面的先验知识,并与柏林的不同学校有联系。他们都是德语文法学校的学生,母语都是德语。他们向德国一所大学的计算机科学学生社团提出申请,主题是“机器人”。这个学生社团是为学校里对计算机科学非常感兴趣的学生发起的,他们希望每周参加一次专门为他们设计的实用研讨会。要参加,必须有编程经验。这意味着他们可以用图形化的基于块的编程环境(例如Scratch)编写小程序。该课程为期10周,学生们每周见面一次,每次1.5小时。实践课与干预课交替进行。实践课程旨在让学生熟悉硬件,并教他们如何解决机器人问题。在三节干预课中,学生根据前面描述的认知模型(见3.1节)获得支持,并收集数据。课程划分如表5所示。在学生社团的剩余课程被用来准备与学生的项目演示。

  表5学习课程概况

  学生社团由两名计算机科学专业的学生(目标是成为计算机科学教师)、两名普通计算机科学专业的学生和两名研究人员(其中一人是第一作者)授课,他们都有机器人的特定背景。在这个小组中,一个人负责技术支持,其他五个人在研究中扮演向导的角色。14名参与者被要求结对工作。由于研讨会是自愿参加的,再加上学校的其他安排,通常会有1-2名学生缺席。因此,不可能在整个研究过程中建立稳定的配对。由于学生们仍然喜欢和朋友们一起工作(他们通常是成双成对地来到学生社团),所以大多数时候每节课只换一组。学生们对分类法有了一个大致的了解,并了解了分类法所描述的问题以及向导提供反馈的过程。巫师在每节课上都在场,并同时负责最多两个小组,这取决于单节课的参与者人数。在这项研究中,两对学生和他们的向导一起被分配到多个房间。一个房间里最多有三个小组。因此,大多数巫师只能支持一个小组。这些巫师被随机分配到不同的小组。在学生社团成立之前,所有的巫师都接受过如何提供反馈的培训。他们配备了以下材料:

  课程计划:包括所有的任务,以确保所有的学生得到相同的任务指导,

  认知模型:包含反馈内容和反馈规则;

  程序:把他们给学生的所有提示都记下来。

  向导被指示将第一个任务交给小组,然后退后观察学生,并在需要时给予支持。任务完成后,巫师会给出下一个指令,等等。就目前的文献而言,这是一项无技术的绿野仙踪研究,其中人类巫师根据基于认知模型的规则行事(H?ysniemi et al., 2004)。

  在每节干预课后,对这些巫师进行一次小组访谈。向导被问及他们使用认知模型的哪一层(例如,第一层:主要类别)来为学生提供支持。他们还被问及对认知模型适用性的印象。学生们也是成对接受采访的。他们被要求解释他们是否需要向导的支持,什么样的支持,以及提示是否有帮助。在本文中,参与者和巫师的陈述已经从德语翻译成英语。

  在采访中,学生们被问到以下问题:

  1.

  你需要导师(向导)的帮助来解决任务吗?如果有,具体问题是什么?

  2.

  在你看来,支持有帮助吗?

  3.

  描述对支持的哪些更改会有所帮助。

  4.

  你还有什么评论吗?

  在每次干预之后,巫师们被分组采访。每次采访大约需要15分钟。巫师们被问到以下问题:

  1.

  描述认知模型什么时候运作良好,什么时候不起作用。

  2.

  学生们需要帮助吗?如果是,什么时候?如果没有,为什么?

  3.

  下一课应该做哪些具体的改变?

  4.

  你认为认知模型适合这种情况吗?为什么或者为什么不呢?

  5.

  你还有什么评论吗?

  Tsovaltzi等人(2008)提出了一种对《绿野仙踪》研究进行定性评估的适当方法。在这里,我们遵循他们的方法,并调整了一些类别。我们基于视频数据进行了定性内容分析(Mayring, 2010),并构建了类似的学生反应演绎和归纳类别。此外,我们还分析了向导的笔记(在干预期间学生工作时所做的笔记)和干预后与向导进行的访谈。

  这里,从访谈中获得的定性和定量数据被呈现出来。

  在第一次干预(乐高机器人)中,我们采访了14名学生,提取了50个陈述。当一个人在一个类别中做了多个陈述时,这被视为多个陈述。三种干预措施的数据均由第一作者编码。在编码系统中构建了以下类别:所需向导的支持;不支持需要的分类;问题发生;反馈很有帮助;反馈没有帮助;进一步课程的反馈形式;言论。

  关于他们是否需要帮助的问题,五组人明确回答“是”,两组人说他们需要“一点”帮助。一组人说,他们不需要帮助来对问题进行分类,因为他们知道问题在哪里。学生们描述说,他们遇到的问题主要是在软件()方面,特别是在使用编程环境()方面。对于他们需要帮助的地方,一名学生说:“实际上,只有……在软件中。”硬件、环境和数学/物理方面的问题很少。大多数小组描述脚手架是有帮助的,没有得到更精确的()。有两组人提到,在软件领域有更多的子类别可以帮助他们定位问题。为了改进认知模型,学生建议在同一类别中出现问题,但问题发生原因发生变化时,在反馈中明确说明。由于反馈规则,学生们只被告知问题的类别,而不是同一个问题。在采访结束时,一组学生说他们喜欢这种课程,他们玩得很开心。数据显示,总的来说,学生们在这种认知模式下表现良好,但需要做出一些改变。任务还必须处理认知模型中分类法的所有类别。由于任务的配置,“软件”类别中的问题非常占主导地位。

  在第二次和第三次干预后(使用Nao机器人),学生们再次接受采访。他们现在提到了问题所在的不同类别,涵盖了认知模型中分类学的所有部分。一组解释说,他们在环境和硬件方面有很多问题,因为机器人的手臂经常粘在盒子上。学生们解释说,他们需要帮助来理解一些程序块的作用,因为命名不清楚。小组提到,向导的支持有助于理解问题(),解决问题(),避免再次犯同样的错误(),并将解决方案转移到其他问题()。其中一组解释说,他们现在理解了解决问题的策略:“看看别人是如何解决问题的,这很有帮助。你这里看看,那里看看。看了第五遍你就会发现。因此,寻找的顺序……遵守排除故障的原则。你看一下最可能的点,然后是下一个可能的点,以此类推。”另一名学生说:“所以我认为导师帮助我们很好,我现在明白了我们做错的所有事情。”

  在“反馈有帮助”类别中,学生们总共制定了28个陈述,在“反馈没有帮助”类别中,学生们制定了3个陈述。

  总的来说,很明显,反馈有助于学生理解和解决出现的问题。问题追踪策略的观察对学生来说是有价值的。随着任务变得越来越复杂,涉及到认知模型分类的所有部分,所有小组都需要帮助,并提到了模型的支持方面。

  此外,还采用编程能力测试来观察学生对控制结构的使用情况。在干预之前,学生们在编程任务上的正确率为57%。学生们的成绩涵盖了整个测试范围,从0分到7分。干预前各项测试的平均得分为()。学生社团完成后的测试描述性地显示学生的编程能力略有提高。学生们的得分在1到7分之间,正确回答了65%的任务。随着(),平均分数也呈现出正的趋势。大多数学生在开始学习时已经具备了良好的编程技能,并且在干预期间表现出了轻微的进步。由于受试者人数少,故未进行统计学意义计算。

  所有面试数据都包含以下几类:哪些工作做得好;什么工作不充分;需要支持的地方;需要改进的地方;认知模型是否合适?表6给出了数据的摘录。

  在第一次采访中,奇才们做了30个陈述,这些陈述被分类。一些奇才解释说,认知模型对解决问题非常有帮助()。一个巫师给了学生额外的提示,让他们想象自己是一个机器人,并被安置在同一个地方。然后,学生应该思考并解释机器人必须做出的正确动作。在巫师看来,这很有帮助。向导们认为,认知模型的层次对于提供反馈很有用。一组在第一层给出提示就足够了,然后他们自己解决问题。一位向导补充说,认知模型的分类有助于看到问题不仅仅是由软件引起的。通常,学生们倾向于只在软件中搜索错误。奇才也报告了一些问题。例如,他们说,“软件”这个类别太笼统了,需要更精确。向导的建议是,当问题涉及到软件时,直接跳转到子类别。一个向导说,经常有必要直接跳到第4层,因为一组人不理解其他层的提示,而且每次都要花很长时间才能完成所有的层。有可能巫师并不知道这项研究的目的。另一个向导用两句话描述说,提供足够的支持是困难的,因为当学生们在制作原型时,解决方案可能会很快改变()。向导说:“学生很快就会失去重点,他们很快就会改变实施方案,这也会改变解决方案。”从这些信息中,我们为未来的工作得出以下假设:由于学生问题解决过程的结构化,教师可以更有效地给予反馈。

  在第二次和第三次干预后,我们在向导的答案中发现了大约40个陈述。向导们描述说,反馈很有效,并帮助学生们迅速找到解决问题的方法()。它支持学生将知识从一个问题转移到另一个问题(),并有助于个人反馈和内部分化()。向导们报告了与学生们类似的问题,例如,软件崩溃或程序中盒子的命名不清楚。有些人提到,不跳过所有的图层是很麻烦的。与第一次干预后的结果相反,向导在认知模型中描述了分类法的所有类别,并且没有再次提到并非分类法的所有顶级类别都在任务中使用。一位向导说,为学生建立一个“元模型”可能会有所帮助。向导可能意味着一个说教式模型,以减少任务的复杂性。这可能包括提示,比如在程序中不需要腿部时,让Nao机器人以休息姿势做所有动作。这使得解决方案更容易,机器人也更稳定。在干预2和3之后,关于认知模型的反馈是非常积极的。大多数向导发现认知模型适合以所描述的方式支持学生()。然而,一个向导说认知模型太“僵硬”了,因为他们总是要遍历所有的层次。

  表6 WOZ I中向导回答的编码系统摘录

  学生和向导们都认为认知模型的反馈是有帮助的。大多数奇才将认知模型描述为直观的,并表示他们将以类似的方式解决问题。其他人需要更多的时间来适应认知模型,这是使用支持系统的常见方法。有人还提到,需要找到更多的类别来扩展和具体化认知模型的分类。将LEGO机器人的第一次干预与Nao机器人的第二次和第三次干预进行比较,对认知模型的适用性判断不同。向导们和学生们说,在使用乐高机器人的第一次干预中,认知模型的分类宽度并没有得到充分的需要或使用。然而,在使用Nao机器人进行干预后,这种批评没有重复。人们的注意力似乎也从寻找软件中的问题扩展到了整个分类法。

  不同的层次被积极地提到,因为学生需要不同程度的帮助。负面反馈也有助于调整认知模型,使其更加准确,学生的反馈更加明确。我们的结论是,认知模型可以成为教师在机器人活动中给予学生支持的合适工具。

  在此研究之后,对层模型进行了一些修改。一方面,如果反馈似乎不合适,因为学生已经用自己的更改处理了这些层,或者这些层对学生来说很明显,那么向导应该跳过第1层和第2层。如果再次出现同样的问题,也可能是跳过这些层的原因。分层是否明显似乎与学生的能力以及之前的课程中是否发生过类似的问题高度相关。这在第一种方法中已经可以实现,但是对于向导来说还不够明确。更详细地描述了子类别“程序代码”(是否缺少一个框或是否使用了错误的程序块)。

  《绿野仙踪》研究II是为了确定认知模型是否适合作为一个辅导系统的基础。在这里,一个隐藏的向导通过数字通道提供反馈。

  在这项研究中,6名9年级至11年级(年龄在15至17岁之间)的学生(1女,5男)参与了研究。他们都是德国文法学校的学生,母语都是德语。这些学生是该大学的自愿实习生,具有计算机科学和编程方面的先验知识。因此,他们对计算机科学非常感兴趣。这项研究进行了四天。第一天,参与者被介绍给乐高机器人,第二天进行相应的干预。然后在第三天将他们介绍给Nao机器人,并在第四天进行相应的干预。任务和时间框架与《绿野仙踪》研究i类似。然而,在这项研究中只有一个巫师在行动。

  学生们得到了一个平板电脑,以便在不同的设备上获得向导的支持。因此,学生不需要切换不同的线程(编程环境和反馈),他们可以携带平板电脑到机器人。作为一个额外的工具,我们使用了messenger Slack。使用Slack可以在线向不同的群组发送消息。这在学校环境中是合适的,因为只使用电子邮件地址而没有使用电话号码。当时的最新版本是3.23.1,安装在学生的平板电脑和向导的电脑上。

  这项研究在两个不同的房间进行。在第一个房间里,一组学生完成任务。他们有一个工作站,里面有电脑、平板电脑和机器人。一名技术助理坐在这个房间里,以防机器人出现重大问题,还有一名老师。教室里有视频记录,尤其是学生们测试实施程序的地方。向导坐在工作站的第二个房间里,有三个屏幕:1)从学生房间传输视频,2)通过屏幕共享向学生展示程序代码,3)与Slack程序一起发送提示。

  定性分析的数据见表7。对向导的“积极反应”和“消极反应”这两个类别也出现在文献中(Tsovaltzi et al., 2008)并被采用。“对向导的中性反应”、“对向导的其他反应”作为分类从数据中导出。最后两个类别对于判断支持是否被有效使用以及通过平板电脑实现的技术是否合适非常重要。在WOZ II中建立了其他类别,但这里没有给出(“支持层”或“在什么任务期间支持”)。然而,这些类别量化了给定的支持,但没有提供关于学生反应的信息,而这正是WOZ II的重点。在成绩单中,我们分析了向导向学生发送消息时的部分。

  在抄本中发现的主要是“对向导的积极反应”,它被分为两个子类别。当学生读出消息并直接从建议()开始时,一个积极的反应被编码在“直接使用提示”的子类别中,如例2所示。

  WOZ II, AB组与Nao机器人:

  1.

  (通知的声音)

  2.

  通知:软件测试手间距离

  3.

  [B拿起药片并读出]

  4.

  [A和B在一个新的关键帧中节省机器人双手之间的距离]

  5.

  [A和B再次尝试用机器人抓球程序-机器人成功拿球]

  方括号中是根据录像描述学生的行为。虽然同学们没有互相交谈,但是可以看出他们已经直接使用了向导的反馈,完成了任务。

  从这些观察结果中,我们可以得出进一步研究的假设:机器人活动中的计算机辅助反馈被学生所接受,计算机辅助反馈提高了学生解决问题的能力。不过,一个完全自动化的辅导系统是否会对学生产生同样的效果还需要测试。

  例3显示了学生根据向导的提示进行的谈判。

  WOZ II,乐高机器人组团CD:

  1.

  (通知的声音)

  2.

  [通知:软件-在机器人测试盒子是否在附近之间,机器人应该向前行驶更长的时间]

  3.

  [C]和[D]默读信息。D开始编程。

  4.

  真的吗?那它开得很远。

  5.

  医生:你觉得20厘米太大了吗?

  6.

  顾客:是的,我想要15或10厘米。

  7.

  [C和D讨论角度。]C手动前后转动机器人。D认识到角度不合适,并改变它们。C把机器人放在地板上测试,机器人成功地绕着盒子行驶。

  例如,“对向导的中立反应”类别包含了“阅读但不讨论消息”的子类别()。在这种情况下,他们听从向导的暗示,但他们没有与同伴沟通,计划如何进行。这可以用学生缺乏合作技能来解释。碰巧的是,当学生们刚刚找到解决方案时,提示信息就出现了。然后,学生们认为他们已经按照向导的建议做了(参见例4)。

  WOZ II,乐高机器人组团CD:

  1.

  (通知的声音)

  2.

  [C和D默读留言]

  3.

  C:是的。这就是我们所做的。

  “对巫师的负面反应”只发生过一次,当时学生在得到暗示后很不高兴。文本的一部分显示了示例5中的情况。

  WOZ II, EF组与LEGO机器人:

  1.

  (通知的声音)

  2.

  [通知:软件-测试转弯角度]

  3.

  [E打开消息读了出来,大概是很恼火]

  4.

  艾凡:是的!

  5.

  [E和F]在改变角度。E叹了口气。)

  这些学生仍然按照指示去做。他们似乎因为任务的难度而感到沮丧,而不是因为巫师的暗示的质量。这种解释源于学生的坏心情,从他们的肢体语言和声音中可以看出,他们在信息出现之前就已经感到沮丧了。

  除了学生们的反应,我们还观察到学生们在Slack上多次阅读消息,例如,他们有时会在遇到困难时再读一遍。这就引出了这样一个假设:由于反馈的可用性,学生们多次验证了他们的解决方法。

  在“对巫师的其他反应”这一类别中,学生们不理解这条信息,并试图问房间里的人()。在这种情况下,他们解释说他们只是通过Slack聊天获得提示。在另一种情况下,一个学生看到了提示,想要按照提示进行转换。但是另一个人想尝试别的东西,他们再也没有提到这个暗示。当学生们表现出“对巫师没有反应”时,我们发现了不同的原因。例如,学生无法识别一些消息(),因为Slack中的通知声音不起作用。碰巧学生们认出了这条信息,但既没有阅读也没有讨论这条信息()。这种行为可能有不同的原因,例如,缺乏协作技能或正在处理不适合提示的问题。

  表7 WOZ II的编码系统摘要

  一些小组在使用Slack时遇到了麻烦,因为有时通知声音不起作用。这方面的大多数问题发生在六个干预组中的两个。然而,当学生们坐在平板电脑前时,在评估视频数据时,并不总是能够看到学生是否看到了信息,但没有谈论它,或者他们是否根本没有注意到信息。

  由于这是一个短暂的干预,测量基本编程能力的测试没有被用作确定学习成功的前测试和后测试。它只被用作预测试,以了解学生的技能。学生们在编程任务上答对了73%。所有测试的平均得分为(),即测试范围从2到7分。这一平均值表明,与《绿野仙踪》研究I()的组相比,这一组在描述上具有更好的编程技能。

  学生们对反馈的反应非常积极。他们中的大多数人都试图遵循反馈,并取得了相当的成功。学生们完成了任务,考虑到他们的反应,他们并没有感到沮丧。一些学生在遵循巫师的提示或不讨论时缺乏沟通技巧。然而,有效的协作需要实践,这超出了本研究的范围。综上所述,分层模型似乎可以作为机器人辅导系统的基础。然而,还需要更多的定量数据来证明其有效性。关于未来工作的更多细节将在展望中讨论。

  第一个研究问题制定如下:

  1.

  基于认知模型的即时反馈对支持学生完成机器人任务的影响是什么?

  大多数学生的反应是积极的或中立的,向导的反馈大部分是积极的,这对辅导系统的实施是有希望的。在我们看来,这种反馈的关键原因是:1)对于向导和学生来说,认知模型易于使用;2)对于学生来说,模型是透明的;3)所提供的反馈使学生能够成功地完成任务。在未来的研究中,实施不同类型的反馈将是有价值的,例如使用Dickler(2019)提出的查询技术。VanLehn(2016)也指出,对于学生的先验知识,可以采取不同形式的建议(如提醒、说服、教学和补救)。使用多种形式可以更好地适应学生的先验知识,使学习更有效。此外,有必要实现学生提问的可能性。

  根据学生的积极反应和任务的完成情况,我们发现认知模型可以在计算机科学教育中做出贡献。这可以像《绿野仙踪》的研究1中那样实现,当老师提供反馈时,或者在自动辅导系统中实现。如果反馈的方式作为一种学习方法在计算机科学课程中也有帮助,则需要在未来的研究中进行测试。学生们报告说,他们对如何解决问题有了更好的理解,这是21世纪的一项重要技能(Trilling & Fadel, 2009)。通过辅导系统支持学生学习机器人课程是一种相对较新的方法。对辅助工具(如认知模型)的评估是从经验上解决这一研究差距的许多步骤之一。总的来说,我们已经了解到,在机器人活动中,即时反馈是有价值的,应该努力开发基于这种认知模型的成熟的辅导系统。

  对于AIEd(教育中的人工智能)社区,我们提出了一个分层模型。基于该模型,可以收集和整合更多的反馈。为了进一步研究,需要采取以下步骤:

  1.

  收集更多数据并将日志文件片段分配给认知模型,

  2.

  从日志文件中导出元数据;

  3.

  实现并训练一个算法来自动分配给认知模型,

  4.

  提供适当的反馈;

  5.

  建立一个反馈渠道。

  之后,还需要其他数据源,例如学生成绩,这些数据可以集成到模型中。因此,有必要收集训练数据,利用机器学习技术开发准确的辅导系统。使用人工智能方法的目的是根据观察了解学生的问题,并对某些问题进行预测以提供支持。一个重要的优点是,许多常见的问题可以通过辅导系统解决,教师可以专注于还不能自动化的问题。

  在这一点上,没有评估使用认知模型的有效性或学习收益。在《绿野仙踪》研究1中,用于测量编程能力的测试工具描述性地显示学生的能力略有提高。然而,由于样本量小,这种提高没有进行统计显著性测试,因此不适合一般性陈述。为了测量学习收益,需要特定的经过验证的测试工具,这在计算机科学教育中通常是罕见的。首先,有必要开发一种测试机器人学知识和解决机器人问题的仪器。

  在对学生互动的观察中,我们发现学生之间缺乏合作。有些学生既不谈论巫师的暗示,也不跟着他们说话。对于机器人辅导系统的开发,我们可以得出结论,应该实现脚手架学生协作的功能。支持合作行为可能是有价值的,这也是结对编程场景的一个已知问题(Preston, 2006)。对于他们的合作,如果学生有时改变角色,谁在构建和测试设备,谁在编程,这是很有用的。当必须同时完成多项任务时,在团队中工作似乎非常复杂。鼓励学生避免分散任务,而是一直在一起完成同一个任务,这可以支持合作。

  虽然信使号存在一些技术问题,但没有迹象表明这些问题影响了研究结果。最有可能的影响是,学生得到的提示更少,可能会变得沮丧。然而,这些问题在六组中的两组中尤为突出,这两组在完成任务和表达挫折感方面并没有什么不同。在未来的研究中,这类技术问题是可以避免的,例如,如果这个导师的技术实现版本在需要提示时锁定屏幕。这在另一项《绿野仙踪》研究中成功完成(McLaren et al., 2008)。

  我们提出了这样的假设:“由于为学生构建了物理计算过程,教师可以给出更有效的反馈。”根据认知负荷理论,认知系统必须减少它所处理的新元素的数量(swell, 2011)。在Sweller的理论中提到了不同的负荷,比如学习材料的难度、主题呈现的方式或方案的处理。这可以通过降低难度来实现,例如,根据学生的需要,辅导系统将一个主题分成小的部分。将分类法(用于存储和分类出现的问题源)提供给学生还可以减少学生和教师的新元素负担。考虑到我们的观察和访谈数据,我们发现认知模型支持参与者的迹象。因此,在未来的研究中,我们将在一个成熟的辅导系统中揭示认知模型,以减少认知负荷。为了评估教师的认知负荷,需要在经典的a /B测试场景中进行有透明认知模型和没有透明认知模型的实验研究。

  此外,结果还受到不同因素的限制。认知模型似乎支持学生,但它仍然取决于巫师。到目前为止,我们不能排除积极的结果与向导提供的具体和不同的反馈有关。因此,我们的研究并没有显示认知模型与向导的独立性。为了实现这一目标,需要更多隐藏的巫师或技术上实施的辅导系统。结果也有可能受到反馈的影响,这些反馈对学生来说是新的和有趣的。在进一步的研究中,需要测试他们对反馈系统的反应是否仍然像描述的那样积极,如果他们长时间在普通的课堂环境中使用它。我们还需要考虑反应偏差。这可能是因为学生们意识到研究情境,所以他们被迫对实验者的问题给出积极的回答(Holbrook et al., 2003)。因此,在课堂情境中研究认知模型的技术实现将是本研究的一个极好的进一步步骤。

  第二个研究问题是:

  2.

  根据发现的效果,需要对认知模型或反馈进行哪些调整?

  对认知模型的总体评价基本上是积极的,但在此基础上构建完善的辅导体系还需要进一步的发展和研究。学生和向导的回答也表明,任务应该涵盖使用认知模型的类别。当使用可能的硬件变化有限的设备时,或者在没有收集环境数据的任务中,这种认知模型似乎过于宽泛。

  可能需要分类法的更多方面,以便高级学生能够访问该分类法。因此,未来的一步可能是根据学生的机器人经验和任务的复杂性,给他们提供不同的认知模型适应。我们对学生和向导的访谈结果表明,“软件”和“程序代码”类别中的子类别,例如“缺少控制结构”或“关于语义的问题”可能会有所帮助。指出问题的根源是使问题空间更加透明的认知模型的重要组成部分。

  Aleven(2010)认为,在辅导系统中,对认知模型的一个主要要求是灵活性。这包含了学生在给定任务中的各种解决方案。因此,需要在模型中实现许多规则。特别是从《绿野仙踪》的研究中,我们了解到对于人类巫师和未来的辅导系统来说,额外的规则是必要的。可以考虑下列提法:

  如果学生自己把他们的问题分类在一层,那么这一层可以被跳过,以提供有意义的提示。

  如果学生在同一类别中有新的问题,那么必须命名。

  这些规则可以很容易地被人类巫师遵循,当教师根据课堂上的认知模型来支持他们的学生时。然而,在实际的教学系统中,如果可以跳过层次,可能很难实现。除了基于规则的方法(遵循模型跟踪的范例)(Aleven等人,2016),示例跟踪的实现可能是有价值的。在这种方法中,使用一般化的示例(而不是认知模型)来解释解决问题的行为。在示例跟踪导师中,复杂的问题被分解成解决问题的步骤,并生成行为图。然后,将学生的行为与生成的图表进行比较,并提供反馈。这些步骤使示例跟踪方法更容易编写和调试。特别是在学校中使用,非程序员方法与认知导师创作工具(CTAT)对于降低实施成本很有价值(Aleven et al., 2016, 2009)。

  Aleven(2010)提出的第二个要求是认知忠诚。因此,关于学生的先验知识和先入之见的信息对于构建一个准确的学生模型来为个别学生提供精确的支持是必要的(参见6.1节中建议的形式)。提供不同层次的反馈可以通过给学生或多或少的详细信息来完成。根据文献,建议由辅导系统提供分层反馈(Anohina, 2007)。在我们的研究中,层次也被证明对学生解决问题的能力有支持作用。由于向导只提到了更多的子类别,以适应他们的模型,而没有提到层的变化,因此使用的四层似乎是最优的。

  在这一点上,向导的规则侧重于支持学生完成任务。Anderson et al.(1995)指出,非路径工作的规则也是必要的。这些漏洞百出的规则是为了让学生们在错误的道路上完成任务时回到正轨。为了进一步的发展和课堂学习,这些规则需要实施。这可能还包括学生们希望在思考方向错误时得到反馈。对于AIEd,该模型可以通过进一步基于规则或本体的反馈进行扩展。因此,日志文件分析可用于预测学生在相关研究领域成功完成的任务行为(Nam, 2016),课程退学(Kloft等人,2014)或创造力指标(r

  等人,2022)。这是丰富认知模型的有益基础。

  到目前为止,还没有统计上有意义的关于学生技能和能力的信息,因为这些能力模型还不存在。在未来的工作中,这种整合对于一个多方面的认知模型是必要的。

  根据目前的文献,在认知模型中应该考虑支持的一些教学方面。例如,硬件如何向学生提供反馈。其中一个例子是,如果识别到红球,led就会打开。根据建构主义理论,更多的这些可能性应该用于白盒设计。查看黑匣子内部也是可解释人工智能(XAI)研究的最新目标(Fiok等人,2022)。Putnam & Conati(2019)假设了智能交通系统对XAI的明确需求。将人工智能和机器人教育结合在一起,可以促进人工智能教育和计算机科学教育的发展。

  在教学设计中,学生应该具备解决问题的元模型。这可以包括遵循调试过程的步骤、经常出现的问题以及如何搜索这些问题。根据所说明的协作和结对编程技能中的问题,协作脚本的实施对于支持学生的交互是有价值的(Dillenbourg, 2002)。在计算机支持的协作学习(CSCL)的研究领域,“宏观脚本”也被建议用于构建解决问题的过程并指导协作交互(Tchounikine et al., 2010)。VanLehn(2016)主张将CSCL研究和ITS更紧密地结合在一起,因为它们有很多共同的问题和解决方案。在计算机科学教育中,另一种在编程中解决问题的方法是“帕森斯问题”。在这里,学生们得到一个正在运行的程序代码片段,需要把这个谜题按正确的顺序排列(Garcia等人,2018;Du等人,2020)。将这种方法与辅导系统相结合,对于机器人任务中的编程部分是有价值的。编程中的脚手架也可以通过“PRIMM”(预测-运行-调查-修改-生成)方法来实现。与其他方法的一个重要区别是,学生首先得到一个运行的程序,并需要预测它是如何工作的。在运行程序并调查代码后,学生开始修改系统并最终构建自己的系统(Sentance et al., 2019a)。这种方法对学习者(例如,更好的表现,对编程的信心)和教师(例如,结构化教学,教学效率)都有积极的影响(Sentance等人,2019b)。在未来的工作中,这些方法中的一种应该用于机器人。作为第一步,结对编程的协作脚本(略微适应机器人)可以在辅导系统中进行集成和测试。

  认知辅导的研究通常采用定量方法。因此,进行了前后测试、日志文件分析和定量评级。例如,当学生的问题之前没有经过经验识别时,我们不知道我们到底在测试什么,定量方法通常不够准确。本文采用定性方法设计了一种机器人教学智能辅导系统。特别是在分析新的问题空间时,重要的是要弄清楚出现的问题和障碍,例如,什么时候应该支持学生解决机器人任务。定性方法有助于识别未预见的问题。量化这种方法将是下一步,例如,当评估辅导系统的有效性时,可以根据定性研究适当地解决学生的需求。定性研究的一个重要质量标准是收集数据的三角测量(Flick, 2010年,第405页)。为了满足这一标准,考虑不同的研究方法和进行的研究的高透明度是重要的。

  我们的目标是测试一个认知模型作为一个辅导系统的实现。收集到的数据表明,认知模式对学生有积极的影响。我们了解到,当一个成熟的辅导系统将被构建时,即时反馈是可以实现的。因此,所使用的层数似乎适合所呈现的机器人任务。我们提出一种建构辅导系统的质性研究方法。从结果来看,这似乎是更好地了解学习者需求的一种有价值的方法。通过对该方法的详细描述,我们希望鼓励研究者对教学体系的构建进行定性研究。对于未来的工作,我们提出了如何扩展认知模型以及如何使用人工智能方法构建一个成熟的辅导系统的信息。

  为了扩展认知模型,老师的观点也很有趣。没有多少老师是机器人专家,这是一个复杂的领域。对教师进行采访,了解他们在课堂上使用辅导系统后的学习收获,这对支持教师也很重要。这可以通过在开放学习者模型中实施辅导系统来实现(Bull & McKay, 2004),其中教师可以访问学生的数据,并可以从他们的角度提供更多关于小组形成或学习收益的信息。Schulz和Lingnau(2020)描述了机器人技术的这种方法。此外,观察学生是否也更有效地解决问题将是有趣的(Tsovaltzi et al., 2008)。在没有经过验证的测试工具的情况下,效率可以作为学生学习进展的一个指标。然而,开发和使用经过验证的测试仪器将更加准确。

  由于向导和学生的积极反馈,我们假设在我们的研究中,向导决定在学生真正需要提示时给予支持。然而,这在自动化辅导系统中很难实现。到目前为止,模型中还没有足够详细地规定反馈提供的时间,因此无法实现自动化。学生们不只是在一个设备上工作,他们总是在电脑工作场所和机器人驾驶的地板之间切换。这意味着在计算机上暂停进程不能被解释为“没有进展”。也许学生们会在机器人上重复程序,或者改变硬件结构。也有可能程序代码是正确的,但是硬件或环境导致了需要跟踪的问题。如Spikol等人(2016)所建议的,实施图像处理等方法可能适合捕获有关学生行为的更多信息,例如,如果他们与机器人或计算机进行交互以进行编程。图像处理也有助于分析他们的肢体语言,从而知道他们什么时候感到无聊。还可以收集机器人的传感器数据来近似学生的动作和情绪。这意味着机器人可以通过数字方式连接到辅导系统和编程环境。辅导系统需要检测:1)当学生被困住而与设备或编程环境没有互动时,以及2)当价值观或程序块快速随机变化时,因为学生只是猜测适应。

  到目前为止,我们确实知道学生们完成了任务并使用了向导的反馈。我们假设反馈和学生完成任务之间存在因果关系。但是需要一个控制组来评估奇才的影响。学生能力的发展也需要通过更大规模的长期研究来证实。使用测试工具来评估问题的解决也可以提供信息。为了进一步的研究,有必要组成性别平衡的小组,以便评价具体的性别方面。

  识别学生的问题将是一个挑战,因为学生并不总是坐在电脑前。例如,我们需要在学生与机器人的互动中找到寻求帮助行为的迹象。在一个完全成熟的辅导系统在课堂上实施之前,还有很长的路要走。为此,本文提供了一些初步的解决方案。

  下载原文档:https://link.springer.com/content/pdf/10.1007/s40593-022-00305-2.pdf

点击分享到

热门推荐