首页 > 区块链 > 用大模型训练实体机器人，谷歌推出机器人代理模型

用大模型训练实体机器人，谷歌推出机器人代理模型

时间：2024-01-25 10:01:58

来源：hao86下载

区块链

【#区块链# #用大模型训练实体机器人，谷歌推出机器人代理模型#】

原文来源：AIGC开放社区

图片来源：由无界 AI生成

谷歌DeepMind的研究人员推出了一款，通过视觉语言模型进行场景理解，并使用大语言模型来发出指令控制实体机器人的模型——AutoRT。

AutoRT可有效地推理自主权和安全性，并扩大实体机器人学习的数据收集规模。在实验中，AutoRT指导超过20个实体机器人执行指令，并通过远程操作和自主机器人策略收集了77,000个真实机器人操作的片段。

这充分说明，AutoRT收集的机器人操作数据更加多样化，并且在大语言模型的帮助下AutoRT可以轻松实现与人类偏好相一致的机器人行为指令，该模型对于训练实体机器人帮助巨大。

论文地址：https://auto-rt.github.io/static/pdf/AutoRT.pdf‌

大语言模型是AutoRT的核心组建之一，充当机器人的指挥“大脑”，根据用户的提示和环境条件为一个或多个机器人提供任务指令，主要包括环境探索、任务生成、自主行为和行为过滤四大模块。

环境探索

负责让机器人在环境中寻找适合操作的场景。该模块使用了视觉语言模型构建环境地图,识别并定位各个对象。

然后根据对象特征采样导航目标,引导机器人驶向潜在的操作场景。这使得AutoRT可以无需事先了解环境布局就进行部署。

简单来说，就是让机器人自己在房间、办公室等环境进行自行操作和观察,到处看看有啥可以操作的东西。它会先把当前环境里的桌子、杯子这些物体定位好,明确具体的坐标，方便以后的动作指令操作。

任务指令生成

首先使用视觉语言模型描述当前场景和环境中的对象,然后将这些文字描述输入大语言模型,生成机器人可以执行的一系列操作任务指令。

任务生成考虑不同的数据收集策略,为它们各自生成适配的任务列表。此外,任务生成过程中还内嵌了“机器人约束”,定义了机器人需要遵守的基本规则、安全规则和具体约束,确保任务的安全性和合理性。

自主执行

在任务执行阶段，机器人根据生成的任务执行计划来执行具体的操作。机器人可以根据需要执行自主策略，如通过路径规划和运动控制来移动和操作物体。

此外，机器人还可以通过与人类操作员进行通信来执行任务。在需要人类干预或指导的情况下，机器人可以向操作员发送请求或询问，并根据操作员的指示进行相应的操作。

自主执行的目标是使机器人能够在不同环境和任务下独立运行，并从中获取丰富的数据。

行为指令过滤

主要对任务生成的输出进行再次筛选,移除不安全或不合理的任务。该模块同样基于大语言模型,将生成的任务及可选的数据收集策略作为输入，同时输出每个任务指令所匹配的策略或拒绝理由。

可以把这个模块看成是一个自我反思的过程,大语言模型对自己生成的内容进行纠错和修正，提升整体的安全性能。

通过以上4大模块的协同工作，AutoRT能够在真实世界的不同环境中快速收集大规模、多样化的机器人数据。

相比于传统的数据收集方法，AutoRT利用先进的视觉感知和语言模型技术，使机器人能够在未知的情境下自主决策并执行任务，从而最大限度地提高数据收集的效率和安全性。

此外，AutoRT还支持与人类操作员的交互，使机器人能够在需要时获取人类的帮助和指导。

小编推荐下载

机器人点点生活实用
机器人跳跃益智休闲
笔顺机器人学习工具
海星机器人学习工具
机器人远征动作冒险
机器人医生生活实用
口语机器人学习工具
射击机器人 FPS射击

相关推荐

更多>>

用大模型训练实体机器人，谷歌推出机器人代理模型 01-25

原文来源：AIGC开放社区图片来源：由无界AI生成谷歌DeepMind的研究人员推出了一款，通过视觉语言模型进行场景理解，并使用大语言模型来发出指令控制实体机器人的模型——AutoRT。 AutoRT可有效地推理自主权和安全性，并扩大实体机器人学习的数据收集规模。在实验中，AutoRT指导超过20个实体机器人执行指令，并通过远程操作和自主机器人策略收集...

大模型正在重构机器人，谷歌Deepmind这样定义具身智能的未来 01-06

文章来源：机器之心图片来源：由无界AI生成过去一年中，连连取得突破的大模型正在重塑机器人研究领域。在最先进的大模型成为具身机器人感知世界的「大脑」之后，机器人的进化速度取得了远超想象的进步。 7月，谷歌DeepMind宣布推出RT-2：全球第一个控制机器人的视觉-语言-动作（VLA）模型。只需要向对话一样下达命令，它就能在一堆图片中辨认出霉霉，送给...

基础模型+机器人：现在已经走到哪一步了 01-01

机器人是一种拥有无尽可能性的技术，尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑，帮助机器人感知和理解这个世界并制定决策和进行规划。近日，CMU的YonatanBisk和GoogleDeepMind的夏斐（FeiXia）领导的一个联合团队发布了一篇综述报告，介绍了基础模型在机器人领域的应用和发展情况。原文来源：机器之...

自研大模型上车双足机器人，西湖大学系具身智能曝光 12-24

来源：量子位图片来源：由无界AI生成双足机器人赛道，又迎来一名搭载AI大模型的玩家。西湖机器人，西湖大学机器智能实验室的转化项目，被曝将重点涉猎双足机器人领域，并且是搭载GPT大模型的版本，以行为/轨迹为核心那种。目前，该公司在市场的大概估值在1-2亿左右。还有来自市场的消息表示，因为转化自西湖大学，其迈向双足及大模型的道路拥有两条支线的诸多明星...

手机QQ怎么设置群机器人 09-23

大家的手机QQ群机器人不仅可以和大伙们进行对话，还可以跟大家玩游戏，比如说可以玩猜歌词、猜成语、成语接龙等，十分的有意思，如果你还不知道手机QQ怎么设置群机器人，接下来就给大家带来设置群机器人的操作步骤，有兴趣的朋友们快来看看吧!【操作步骤】：1.大家在想要开启的群机器人的群里面，在群资料的界面找到【管理群】功能选项。2.大家进到群管理界面之后，点击【设置群...

让机器人成为现实的初创公司 01-24

机器模仿人类的运动方式更难，还是模仿人类的思考方式更难？如果你在十年前问我这个问题，我的答案一定是“思考”。毕竟大脑的工作方式仍有很多神秘之处。然而，就在去年，人工智能的进步已经让计算机程序能够以类似人类的方式进行创造、计算、处理、理解、决策、识别模式，并继续学习。制造像我们身体一样运作的机器——一样地行走、跳跃、触摸、握持、挤压、抓握、攀爬、切割和伸展...

人形机器人将进宝马工厂「实习」之前它还只会冲咖啡 01-23

前段时间，名为“Figure01”的机器人因会冲咖啡而走红。这两天，它还找到了新工作，要去宝马的美国工厂“实习”，干得好的话，一两年后就能到流水线上参与“造车”了。 Figure01是创业公司Figure的大作，该公司仅成立一年，主营开发和制造人形机器人，估值已经超过4亿美元。最近，Figure与知名车企宝马达成重要协议，将在今年晚些时候将Figure01...

我国已成世界最大自动化采用国，机器人正在慢慢“取代人类”吗？ 01-18

虚拟人和人形机器人是许多行业未来应用的趋势。虽然技术已经让这些都成为现实，但人们担心的问题是，当自动化解决方案开始取代人类时，人类会发生什么？ 01.机器人应用愈加广泛如今，无论是在工作还是在家庭，人类都习惯持续依赖更多的技术来提升体验。企业已经从机器、自动化流程和无缝集成工具带来的持续生产力中获益匪浅。而消费者也一直在使用技术来简化他们的日常活动。...

资讯排行