高度的自动化是很多行业正在探索或已经实现的目标,以我们常见的机械臂为例,它可以快速、准确地完成各种各样的任务,但它同样也存在一个问题,那就是开发者需要根据工作类型来定制系统,而且每个环节的设备都只能执行由人类编写好的特定任务,每更换一个任务都需要重新编写一次代码。
近日,Google 就展示了一项新的研究,这项研究提出了通过将人类自然语言指令翻译成机器人配置代码,从而实现让机器人系统自己编写自己的代码的概念。这个概念主要是为了减少人类开发者的麻烦,无需在新任务出现后再对系统重新编程,也可以减少训练机器人执行新任务的工作量。
这个可以根据现实世界中遇到的对象和场景生成自己代码的系统被 Google 称为 Code as Policies(CaP)。
目前的语言模型不仅能高度熟练地编写通用代码,还能编写控制机器人动作的代码。当提供几个示例指令与相应的代码(通过上下文学习)配对时,语言模型可以接受新的指令,并自主地生成新的代码、重新组合 API 调用、为新任务合成新的机器人行为。
Google 的研究人员在博客中指出:
通过 CaP,我们提议使用语言模型,通过少量(人类语言)提示让机器人自己编写出代码。我们的实验证明,与直接学习机器人任务和输出自然语言动作相比,CaP 输出代码在任务性能方面有了提升。CaP 允许单一系统执行各种复杂多样的机器人任务,而不需要进行特定任务的训练。
相比之下,训练 AI 系统执行一项新的任务的传统方式是需要向 AI 提供大量的例子和数据。
Google 研究人员在内部评估中测试了 CaP 的功能,在上图展示的测试中(第一排第三个),研究人员向 CaP 下达了 "将积木在中间摆成一个正方形" 的指令后,CaP 成功地生成了代码,使机器人能够重新排列积木。
该系统除了依赖语言模型,还依赖于第三方库和 API,才能以更好的方式生成适合特定场景的代码。这些 API 中可获取的信息是目前现有的限制之一。研究人员指出:"这些限制指出了未来工作的方向,包括扩展视觉语言模型,或将 CaP 与探索算法相结合"。
Google 目前已经通过其 GitHub 开源了这项研究的初期代码,以及交互式模拟机器人演示等内容。
(文/开源中国)