机器人也会系鞋带了!斯坦福团队用模仿学习赋予机器人新技能

斯坦福团队教机器人系鞋带并发布全球首个相关演示视频,这个机器人(Aloha 2)相比之前的炒菜版机器人能执行更轻巧复杂任务。Aloha 2除系鞋带外还会挂衣服、拧齿轮、收拾厨房、给“同事”换配件等。为训练它,研究团队使用扩散策略收集2.6万个示范数据进行大规模训练,基于模仿学习而非强化学习,其神经网络架构参考ACT模型。

研究人员按特定步骤操作,如给嵌入加位置嵌入等,基础模型有2.17亿可学习参数,小模型有1.5亿参数。训练基于JAX框架在64个TPUv5e上并行,有特定训练参数。最终实验成功率很高,研究人员认为模仿学习很有效。Aloha 2的研究团队由DeepMind和斯坦福小组组成,它是原始Aloha系统的增强版,硬件有改进,团队已开源其所有硬件设计、提供教程和模拟模型用于双手操作研究。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
有新私信 私信列表
搜索

亲爱的同学, AISCK不支持网页右键喔!

你可以鼠标左键选择内容后,按Ctrl+C复制

嗨! 我是AI助手Ceres