Google 推出让机器人自己写代码的模型

2022年11月9日 12:14 | 阅读 705 次

高度的自动化是很多行业正在探索或已经实现的目标，以我们常见的机械臂为例，它可以快速、准确地完成各种各样的任务，但它同样也存在一个问题，那就是开发者需要根据工作类型来定制系统，而且每个环节的设备都只能执行由人类编写好的特定任务，每更换一个任务都需要重新编写一次代码。

近日，Google 就展示了一项新的研究，这项研究提出了通过将人类自然语言指令翻译成机器人配置代码，从而实现让机器人系统自己编写自己的代码的概念。这个概念主要是为了减少人类开发者的麻烦，无需在新任务出现后再对系统重新编程，也可以减少训练机器人执行新任务的工作量。

这个可以根据现实世界中遇到的对象和场景生成自己代码的系统被 Google 称为 Code as Policies（CaP）。

目前的语言模型不仅能高度熟练地编写通用代码，还能编写控制机器人动作的代码。当提供几个示例指令与相应的代码（通过上下文学习）配对时，语言模型可以接受新的指令，并自主地生成新的代码、重新组合 API 调用、为新任务合成新的机器人行为。

Google 的研究人员在博客中指出：

通过 CaP，我们提议使用语言模型，通过少量（人类语言）提示让机器人自己编写出代码。我们的实验证明，与直接学习机器人任务和输出自然语言动作相比，CaP 输出代码在任务性能方面有了提升。CaP 允许单一系统执行各种复杂多样的机器人任务，而不需要进行特定任务的训练。

相比之下，训练 AI 系统执行一项新的任务的传统方式是需要向 AI 提供大量的例子和数据。

Google 研究人员在内部评估中测试了 CaP 的功能，在上图展示的测试中（第一排第三个），研究人员向 CaP 下达了 "将积木在中间摆成一个正方形" 的指令后，CaP 成功地生成了代码，使机器人能够重新排列积木。

该系统除了依赖语言模型，还依赖于第三方库和 API，才能以更好的方式生成适合特定场景的代码。这些 API 中可获取的信息是目前现有的限制之一。研究人员指出："这些限制指出了未来工作的方向，包括扩展视觉语言模型，或将 CaP 与探索算法相结合"。

Google 目前已经通过其 GitHub 开源了这项研究的初期代码，以及交互式模拟机器人演示等内容。

(文/开源中国)