Uploads%2farticles%2f11554%2f999
|
2017-05-18

OpenAI 公布突破性新算法:可通过 VR 培养机器人模拟学习

只用一次演示就可以教会机器人工作。

OpenAI 是由特斯拉 CEO Elon Musk 联合 LinkedIn 创始人 Reid Hoffman 及 PayPal 创始人 Peter Thiel 等人共同创立的一家非盈利的研究实验室,其在昨天宣布了其机器人研究工作的一座新里程碑—— 一款被命名为单次模拟学习(One-Shot Imitation Learning)的开源 AI 学习框架。在它的帮助下,只需要人类在 VR 中演示一次任务,让机器人学习它,机器人就可以在真实环境里完成任务。

在上个月 ,OpenAI 就展示了这个机器人的早期版本,他们使用域随机化算法(domain randomization)对其视觉系统进行了训练。而本次发布的模拟学习系统则包含两个单独的神经网络算法系统:

  • 第一个是视觉网络,通过分析机器人相机中的图像,以确定物体在现实中的位置。尽管机器人从未接触过真实的桌子或木块,但研究人员会使用数十万个模拟图像来训练它们产生认知,每个模拟图像都会根据颜色、纹理、背景等各项特征进行排列。
  • 第二个是仿真网络,机器人通过观察人类如何演示任务来理解任务意图,然后在现实世界中模仿完成任务。需要说明的是,机器人会在模仿网络中进行上千次的虚拟演示的培训,而不需人要在现实环境中操作它。

观看一遍演示之后,机器人就可以在现实环境中进行任务模拟了。下面是原理演示视频:

正如上面视频中所看到的 ,OpenAI 正在尝试教一个机器手臂如何堆叠一系列彩色立方体块。戴着 VR 眼镜的人首先在虚拟环境中手动执行任务,然后 ,OpenAI 的视觉网络开始观察并分析动作,在数十万个模拟图像上对机器人进行训练。这部分过程的重点是使用模拟数据与不断变化的变量来训练AI。因为收集真实世界的图像十分密集且耗费时间,因此采用与现实相似的虚拟数据来训练机器人效果反而会更好。

OpenAI 的算法接着将从视觉网络中收集的信息传送到仿真网络,来指导机器人手臂进行动作。仿真网络可以推理任务的意图,并通过预测人类演员在类似情况下的反应来进行模拟。棘手的部分是,每个立体块的彩色和排列顺序都是不同的,而且块的初始放置位置坐标不固定。而一次学习系统的优势在于,不管立体块的初始位置如何不同,只要能确定最终的堆叠顺序,机器人就能成功完成任务。

所有这一切只使用模拟数据,而不是通过显示机器人视频或真实世界的例子的照片 。OpenAI 技术人员的成员 Josh Tobin 对此解释说:「我们的机器人现在已经学会了执行任务,通过一个单一的任务演示,我们可以在许多不同的初始条件下实现任务。教授机器人如何构建不同的块安排,只需要一次额外的演示。」

这里的长期目标是让 AI 有能力快速学习新行为,并使用这些知识来适应环境中不可预测的变化。 Tobin 说:「 模仿让人类快速学习新的行为,我们希望机器人能像婴儿一样有能力模仿别人做的事情。」

OpenAI 是地球上最强的人工智能研究团队之一,致力于进行非监督式学习和强化学习的研究 。OpenAI 的使命和长期目标是以将最大限度地造福全人类的方式发展人工智能。

「机器人 + VR」还能诞生哪些创意

虚拟现实和机器人都是时下科技界非常流行的词汇。OpenAI 用 AR 来训练机器人进行工作,那么两者结合一起还会产生哪些创意呢?近日,美国的一家创业公司 Double Robotics 就在研究VR+机器人的策略,将其公司的远程视频机器人可控制摄像机拍摄 VR 视频

机器人摄制VR视频

美国极客圈最近也很流行把非常有趣的 VR 体验与真实世界的 3D 打印、开源电子元器件设计、软件开发以及机器人自动控制嫁接在一起。比如硅谷一家创意公司 219 Design的研究人员使用 HTC Vive 头显控制一台机器人手臂。他们使用一个 VR App 进行实时控制机器人手臂的精细动作,也可以让机器人手柄重复事先录制好的运动轨迹。  

使用 VR app 控制机械臂的运动

该团队的 Dave Bim-Merle 表示,这个项目目前只是证明了一个产品设计概念,把 VR 与机器人控制相结合。你可以想象一下,这种产品设计理念可以用在水下机器人控制、灾后救援机器人和战场拆弹机器人等应用场景。

除了一些创业公司,工业机器人巨头 ABB 也曾在去年上海工博会上展出过一套 VR 教学系统。学员通过戴上 VR 眼镜,就可以进入一套虚拟的工厂 VR 情景,并可观看机器人在流水线上的工作细节,帮助学员了解实际的工业场景。


>>
Back to top btn