上周末,一款由斯坦福大学研究团队发布的低成本人工智能机器人被网友热传。这是一款可以模仿人类双手进行精细任务操作的机器人,具有更优的移动性和灵活性。
根据该研究团队的介绍,该机器人主要基于Mobile ALOHA系统,能够自主完成部分复杂的移动操作任务,例如煎虾、打开双门壁柜来储存沉重的烹饪锅、呼叫并进入电梯、以及在水槽里冲洗使用过的锅。
此外,还有部分复杂操作则由人为遥控完成,例如拉开窗帘打开窗子,给花盆浇水;在人站着不动的前提下,替主人刮胡子;开锅热油做虾仁滑蛋;将衣服放入洗衣机、倒入洗衣液、并开启洗衣机;换被套并收纳衣服。
该研究项目由一个三人团队研发,项目的联合负责人Zipeng Fu和Tony Z. Zhao都是斯坦福大学人工智能实验室的计算机科学博士生,也同为谷歌DeepMind团队的学生研究员;以及二人的指导老师、斯坦福大学计算机科学和电气工程系的助理教授Chelsea Finn。
Tony Z. Zhao还在社交媒体X上发布了一段Mobile ALOHA的烹饪视频。
什么是Mobile ALOHA?
Mobile ALOHA是一个操作系统,而非一个机器人。
它是一个开源的操作系统,其学习原理是遥操作和模仿学习,通过对人类重复动作的学习从而掌握技能。
Mobile ALOHA是基于ALOHA遥操作系统实现的。它强化了静态ALOHA系统的双手操纵能力,并在此基础上增加了全身远程控制系统。
此外,Mobile ALOHA还增加了底座移动能力,赋予机器人接近人类的移动速度。对比之下,静态ALOHA遥操作系统更多是在桌面上进行思考,而Mobile ALOHA在底部上增加了移动底盘,增加了对机器人移动性和灵活性的训练。
从硬件上看,该研究团队发布的机器人外在形象并非人形形态,整个身体由一个移动底盘、一个操作界面、两个机械臂、反馈驱动、两个手腕摄像头和一个顶部摄像头构成。其底盘还具备了机载电源,使得它在没有外部电源的情况下也能连续工作多小时。
提高成功率
通常,开发通用机器人的最佳方式是“行为克隆”,也就是机器人从人类提供的演示中进行模仿学习。行为克隆可以让机器人学习各种原始技能,从简单的拾放到更精细的操作。
Mobile ALOHA借助移动底座能力和全身远程操作界面,可以收集更多的机器人与现实世界交互的数据,并在交互过程中学习、模仿人类动作。
此外,研究团队发现,若将Mobile ALOHA收集到的模仿学习数据与现有的静态ALOHA数据集相结合、并协同训练,就可以显著提高机器人移动操作任务的性能。
基于上述的协同训练,研究人员只需要对每个任务进行50次演示,就可以大幅提高机器人操作的成功率,高达90%。
以擦拭红酒任务为例,在没有联合训练时,其成功率只有50%,但联合训练后,成功率可以提高到95%。
价值与争议
这个机器人的一大吸睛点在于,它的成本真的很低。团队专门列出了具体的硬件清单,包括机器人硬件、电源和计算设备、摄像头、传感器、组装和维护费用以及开源的软件部分在内,整套机器人下来成本只需要3.2万美元(合22.7万人民币)。
此外,Mobile ALOHA的最大价值是物理操作能力的进步,因为它展示了机器人做重复性精细操作任务的潜力。
目前生活中,有许多任务都需要全身协调以及灵巧操作,而非单独的移动或操作,而Mobile ALOHA恰能在移动性和灵活性上有所突破。
不过,该团队也表示,Mobile ALOHA 仍存在一些限制,例如系统占用面积较大,固定高度的双臂难以触及较低的橱柜、烤箱和洗碗机等。
且这个技能并非100%精准,也时常会出现错误,研究团队也对外展示了一些“失败案例”。
值得一提的是,Mobile ALOHA 项目目前已经在 Github上开源,公布了代码、硬件结构和数据,团队也放出了相应的论文和介绍。