公牛队
完美包装:麻省理工学院使用生成式人工智能重塑机器人精度

  

  

  麻省理工学院的研究人员创造了一种机器学习方法来改进机器人包装,允许机器人通过一次满足多个约束来有效地解决复杂的包装问题。该技术使用扩散模型来寻找最佳解决方案,优于传统方法,并显示出在各种环境中未来应用的前景。

  研究人员诱导了一系列生成式人工智能模型一起工作,以解决多步机器人操作问题。

  任何试图将家庭大小的行李塞进轿车大小的行李箱的人都知道这是一个难题。机器人也很难完成密集的包装任务。

  对于机器人来说,解决打包问题需要满足许多约束条件,比如堆放行李,这样行李箱就不会从后备箱里掉出来,重物不会放在较轻的物体上面,机器手臂和汽车保险杠之间的碰撞也要避免。

  一些传统方法按顺序处理这个问题,每次猜测满足一个约束的部分解决方案,然后检查是否违反了其他约束。由于要采取的一系列行动和要打包的一堆行李,这个过程可能会非常耗时。

  麻省理工学院的研究人员正在使用生成式人工智能模型来帮助机器人更有效地解决复杂的物体操作问题,比如用不同的物体包装一个盒子。图片来源:研究人员提供

  麻省理工学院研究人员的创新方法

  麻省理工学院的研究人员使用了一种称为扩散模型的生成式人工智能来更有效地解决这个问题。他们的方法使用了一组机器学习模型,每个模型都经过训练来代表一种特定类型的约束。将这些模型结合起来,同时考虑所有约束条件,生成包装问题的全局解决方案。

  他们的方法能够比其他技术更快地产生有效的解决方案,并且在相同的时间内产生更多的成功解决方案。重要的是,他们的技术还能够解决约束和大量对象的新组合问题,这是模型在训练期间没有看到的。

  由于这种通用性,他们的技术可以用来教机器人如何理解和满足包装问题的总体约束,比如避免碰撞的重要性,或者一个物体靠近另一个物体的愿望。以这种方式训练的机器人可以应用于各种环境中的各种复杂任务,从仓库的订单履行到在某人家中整理书架。

  “我的愿景是推动机器人完成更复杂的任务,这些任务有许多几何约束,需要做出更多的连续决策——这些都是服务机器人在我们非结构化和多样化的人类环境中面临的问题。有了成分扩散模型这个强大的工具,我们现在可以解决这些更复杂的问题,并得到很好的泛化结果,”电气工程和计算机科学研究生杨竹田说,他是一篇关于这种新的机器学习技术的论文的主要作者。

  这张图展示了二维三角形填充的例子。这些都是无碰撞的结构。图片来源:研究人员提供

  她的合著者包括麻省理工学院的研究生毛嘉远和杜一伦;斯坦福大学计算机科学助理教授吴佳军;麻省理工学院脑与认知科学系教授、计算机科学与人工智能实验室(CSAIL)成员Joshua B. Tenenbaum;Tomás麻省理工学院计算机科学与工程教授、CSAIL成员lozano - psamurez;资深作者Leslie Kaelbling,麻省理工学院松下计算机科学与工程教授,CSAIL成员。这项研究将在机器人学习会议上发表。

  约束的复杂性

  对于机器人来说,连续约束满足问题尤其具有挑战性。这些问题出现在多步机器人操作任务中,比如把物品装进盒子或摆桌子。它们通常涉及实现许多约束,包括几何约束,例如避免机器人手臂与环境之间的碰撞;物理约束,如堆叠物体,使其稳定;还有定性的限制,比如把勺子放在刀的右边。

  可能存在许多约束,并且根据对象的几何形状和人为指定的需求,它们在不同的问题和环境中有所不同。

  为了有效地解决这些问题,麻省理工学院的研究人员开发了一种名为Diffusion-CCSP的机器学习技术。扩散模型通过迭代地改进其输出来学习生成与训练数据集中的样本相似的新数据样本。

  该图显示了具有稳定性约束的3D对象堆叠。研究人员表示,至少一个物体是由多个物体支撑的。图片来源:研究人员提供

  为此,扩散模型学习了对潜在解决方案进行小改进的过程。然后,为了解决一个问题,他们从一个随机的,非常糟糕的解决方案开始,然后逐渐改进它。

  例如,想象一下在模拟的桌子上随机放置盘子和餐具,让它们在物理上重叠。物体之间的无碰撞约束将导致它们相互推开,而定性约束将把盘子拖到中心,使沙拉叉和餐叉对齐等。

  Yang解释说,扩散模型非常适合于这种连续的约束-满足问题,因为多个模型对一个物体姿态的影响可以组合起来,以鼓励满足所有约束。通过每次从一个随机的初始猜测开始,模型可以得到一组不同的好解。

  一起工作

  对于Diffusion-CCSP,研究人员想要捕捉约束的相互联系。例如,在打包中,一个约束可能要求某个对象靠近另一个对象,而另一个约束可能指定其中一个对象必须位于何处。

  扩散- ccsp学习一系列扩散模型,每种约束类型都有一个扩散模型。这些模型是一起训练的,所以它们共享一些知识,比如要打包的物体的几何形状。

  然后,这些模型一起寻找解决方案,在这种情况下,要放置的对象的位置,共同满足约束。

  “我们并不总是第一次猜测就能找到解决方案。但是,当您不断改进解决方案并发生一些冲突时,它应该会使您得到更好的解决方案。你可以从犯错中得到指导。”

  与其他方法相比,为每种约束类型训练单个模型,然后将它们组合起来进行预测,大大减少了所需的训练数据量。

  然而,训练这些模型仍然需要大量的数据来证明已解决的问题。杨说,人类需要用传统的缓慢方法来解决每个问题,这使得生成此类数据的成本令人望而却步。

  相反,研究人员通过首先提出解决方案来逆转这一过程。他们使用快速算法来生成分段的盒子,并将不同的3D对象组合到每个片段中,确保紧凑的包装、稳定的姿势和无碰撞的解决方案。

  “有了这个过程,数据生成在模拟中几乎是即时的。我们可以创造出成千上万个我们知道问题是可以解决的环境,”她说。

  使用这些数据进行训练,扩散模型一起确定机器人抓取器应该放置物体的位置,从而在满足所有约束条件的情况下完成打包任务。

  他们进行了可行性研究,然后用一个真实的机器人演示了Diffusion-CCSP,解决了许多难题,包括将2D三角形拟合到一个盒子中,用空间关系约束包装2D形状,用稳定性约束堆叠3D物体,以及用机械臂包装3D物体。

  他们的方法在许多实验中都优于其他技术,产生了更多既稳定又无碰撞的有效解决方案。

  在未来,Yang和她的合作者希望在更复杂的情况下测试Diffusion-CCSP,比如可以在房间里移动的机器人。他们还希望使Diffusion-CCSP能够解决不同领域的问题,而无需对新数据进行再培训。

  “Diffusion-CCSP是一种基于现有强大生成模型的机器学习解决方案,”乔治亚理工学院交互计算学院助理教授、NVIDIA AI研究科学家徐丹飞(Danfei Xu,音译)说,他没有参与这项工作。它可以通过组合已知的单个约束模型,快速生成同时满足多个约束的解。虽然它仍处于开发的早期阶段,但这种方法的不断进步有望在各种应用中实现更高效、更安全、更可靠的自主系统。”

  参考文献:“基于组合扩散的连续约束求解器”,作者:杨竹天,毛家远,杜奕伦,吴家军,Joshua B. Tenenbaum, Tomás lozano - p

  和Leslie Pack Kaelbling, 2023年9月2日,计算机科学>机器人。arXiv: 2309.00966

  这项研究得到了美国国家科学基金会、空军科学研究办公室、海军研究办公室、麻省理工学院- ibm沃森人工智能实验室、麻省理工学院智能探索中心、大脑、思维和机器中心、波士顿动力人工智能研究所、斯坦福大学以人为本的人工智能研究所、模拟设备、摩根大通公司和Salesforce的部分资助。

  分享

  推特

  REDDIT

  电子邮件

  分享

  以前的文章

  更多关于sciitechdaily

  技术

  健康

  健康

  健康

  地球

  科学

  空间

  地球

点击分享到

热门推荐