爆火全网的炒虾机器人震撼升级了!斯坦福联手 DeepMind 开源升级版 ALOHA 2,全新的机器人不仅能戴隐形眼镜、开可乐,甚至还可以开钱包抽钞票!这种级别的精细控制简直神了……
一个月前,斯坦福爆火炒菜机器人 Mobile ALOHA,在今天全新升级二代 ALOHA 2!
(从右上角视频中看出 2023 年 4 月份的时候,ALOHA 双手非常笨拙,被撕开包装的任务难住了)
大眼熊猫玩偶成为第一个受试者,只见 ALOHA 2 往眼珠子上一按,隐性眼镜一下子就上去了。(就是眼珠子可能会有点疼)
这次,与以往不同的是,谷歌 DeepMind 也下场了,一起联手斯坦福、Hoku Labs「明星团队」推出 ALOHA 2!
据介绍,ALOHA 2 是一种用于双手远程操作的增强型低成本硬件,大幅提升了初代 ALOHA 的耐用性,能够在更复杂的任务上进行大规模的数据收集。
更惊喜的是,ALOHA 2 此次的打造成本仅为 27,067.50 美元(约 19 万),比第一代还要便宜 3 万元。
我们刚刚看到的,ALOHA 2 撕开隐形眼镜包装,扣开可乐罐等微小物体的操作能力上表现出色。
在 16 倍慢速的情况下,看分别这两个抓手的响应速度,很明显 ALOHA 2 更快,初代 ALOHA 才一点点合并。
还有 Follower 夹持器的抓取力,采用了低摩擦导轨设计,可以将 2 倍以上的力传递到夹持器尖端。
通过恒力牵引器(constant-force retractors)和弹簧滑轮系统,这个手臂可以在大多数地方「漂浮」。
这次的 ALOHA 2,继承了 ALOHA 的原始设计,由一个双臂并联加持工作单元(包含两个 ViperX 6-DoF 手臂)和两个更小的 WidowX 手臂组成。
此外,系统还配备了多个摄像头,可以从多个角度捕捉图像,这样就可以在远程操作期间收集 RGB 数据。
机器人安装在一个 48 英寸 x30 英寸的桌子上,周围有一个铝制保护框架,它不仅为摄像头提供了额外的安装点,还集成了重力补偿系统。
为了支持复杂操控任务的研究,团队计划在 ALOHA 平台上大幅扩展数据收集的规模,包括增加机器人的数量、每台机器人的数据收集时长以及数据收集的多样性。
- 性能与任务范围:提升 ALOHA 关键组件的性能,如夹持器和控制系统,以支持更多样的操控任务。
- 用户友好性与工程学:为了使数据收集工作更加高效,这次团队将用户的体验和舒适度放在首位,对系统的响应速度和工程学设计进行了优化。
- 系统鲁棒性:团队简化了机械设计,确保了更大规模机器人群的易于维护,这样就可以提高系统的鲁棒性,减少因故障诊断和修理导致的停机时间。
可以看到,通过这些改进,操作者可以更轻松地对一些挑战性任务进行远程控制,比如叠 T 恤、打结、抛掷物体,甚至是精度要求极高的工业作业。
为了实现更流畅的远程操作体验和更好的工程学设计,团队将 ALOHA 的原始剪刀型夹持器设计,替换成了一种低摩擦轨道设计,这就显著降低了机械复杂度。
为了进一步减轻操作者的负担,团队还把原来的夹持器电机更换为摩擦更小的型号,这种电机齿轮比更低,且采用了低摩擦金属齿轮代替了塑料齿轮。
这种新设计,就使开启和关闭夹持器的力量需求减少到原来的十分之一。这就显著降低了操作者在长时间采集数据时的手部疲劳和压力。
首先是 ALOHA 中采用的原始剪刀型设计,它通过定制的 3D 打印转子和轨道来实现夹持器电机的反向驱动。
这种新型夹持器摩擦力耕地,这就减少了操作者与机器人「手指」之间的反应延迟,极大提升了用户体验,从视频中可以看出,新设计在反应时间上大大加快。
而原有的 PLA 和丙烯酸结构,被替代为了 3D 打印的碳纤维尼龙材料,这就提高了「手」的柔韧性 —— 承受重载时,它能适度弯曲,让操作更安全。
这次,团队保留了 ALOHA 手指关节的透明设计。在夹持器内侧使用了聚氨酯抓握带,并在手指外侧增加了胶带,因而提升了抓握力。
为了减轻远程操控的疲劳感,团队还设计了一种「重力补偿」机制 —— 通过可调节的悬挂式缓冲器,人类操作者就可以根据自己的舒适度调整平衡力。
「主动系统」利用 MuJoCo 模型的逆向动力学。计算出重力负载的等效扭矩,然后将扭矩命令传递给主控机器人的关节。
结果发现,平均而言,操作员使用被动重力补偿系统表现更好(每分钟插入 1.38 个形状,相比之下主动系统为 0.97 个)。
然而,「主动系统」操作起来需要更多力量,且动作更为生硬,可能是因为伺服电机调节不当,或是在抵抗重力时存在轻微的延迟。
1. 通过完全关闭主控机器人关节的动力,可以避免软件错误或异常情况下的意外大幅移动,从而实现更安全的远程操作;
不过,他们认为,经过适当的开发和调试,一个「主动系统」可能会超越「被动系统」的性能,并可能扩展一些有用的功能,比如为用户提供触觉反馈。
对于那些需要精细操作的任务来说,特别是在手臂需要紧密配合或在狭小空间内操作时,这种设计显著提升了远程操控的效果。
启动时,主控臂和从动臂( leader & follower arms)都会初始化到初始位置。操作员可以通过操作任一主控机器人上的夹持器手指部件来启动数据收集会话。
在远程操作会话中,研究人员记录了包括图像、主控臂和从动臂关节位置,以及 ROS2 系统提供的其他辅助数据在内的机器人传感器数据流。
为了确保下游处理流程能接收到完整、高质量的数据,他们还在数据收集时采取了多项措施,这对机器人学习流程至关重要。
此外,还会记录额外的数据,以便在后期发现某些机器人在特定时间段内存在问题时能够进行数据过滤。
这次,团队还推出了 ALOHA 2 工作站的一个模拟版本,这个版本基于 MuJoCo Menagerie 技术,对远程操控和在虚拟环境中的学习非常有帮助。
MuJoCo 模型的渲染。通过对 ALOHA 2 所有摄像机和机器人位置进行精确建模、执行系统识别,就能确保与真实行为相似
在实验中,研究者记录了使用主控臂进行的 11 次操作轨迹,通过专门的计算方法,减少了这些真实轨迹与模拟轨迹之间的差异。
在这个过程中,研究者调整了模拟中位置控制元件的一系列参数,包括动作的比例控制、阻力、连接部分的摩擦力和扭力限制等。
为了让模拟效果更加逼真,研究者尽可能模仿了真实设备的相机设置(参看下图的模拟相机视角。
备案号:沪ICP备10015141号-1 杏彩体育·(中国)官方网站欢迎来电咨询!