一眼看懂
封面预览
论文提出了 ABot-Claw,一个基于 OpenClaw 运行时扩展的具身智能框架,旨在弥合高层次推理与低层次物理执行之间的鸿沟。
- 论文提出了 ABot-Claw,一个基于 OpenClaw 运行时扩展的具身智能框架,旨在弥合高层次推理与低层次物理执行之间的鸿沟。
- 该框架旨在解决现有系统(如纯 VLA 模型或沙盒内 Agent)在真实世界开放环境中难以进行持久上下文维护、多机器人协作和在线纠错的问题。
- 论文的目标是构建一个能够进行持久记忆、跨具身协作和自我进化的机器人智能体基础。
Card 01
研究单位
研究单位
- AMAP CV Lab
Card 02
论文概述
论文概述
- 论文提出了 ABot-Claw,一个基于 OpenClaw 运行时扩展的具身智能框架,旨在弥合高层次推理与低层次物理执行之间的鸿沟。
- 该框架旨在解决现有系统(如纯 VLA 模型或沙盒内 Agent)在真实世界开放环境中难以进行持久上下文维护、多机器人协作和在线纠错的问题。
- 论文的目标是构建一个能够进行持久记忆、跨具身协作和自我进化的机器人智能体基础。
Card 03
核心贡献
核心贡献
- 提出了 统一具身接口与能力驱动调度机制,实现异构机器人(机械臂、人形、四足)的协调与并行执行。
- 设计了 以视觉为中心的跨具身多模态记忆系统,用于持久化存储和检索物体、位置、关键帧等环境信息。
- 集成了 基于通用评价者模型的闭环反馈机制,用于在线评估任务进度、支持局部修正和重新规划。
- 构建了 分层解耦的系统架构,将高层任务编排、共享服务与底层机器人执行分离,提高了系统的可维护性和可扩展性。
- 在多种异构机器人平台上进行了端到端的真实世界任务演示,验证了框架的有效性。
Card 04
方法描述
方法描述
- 框架采用 分层解耦架构,包含三层:OpenClaw层(负责高层交互与调度)、共享服务层(提供感知、记忆、评估等独立服务)、机器人层(负责具体硬件执行)。
- 核心创新在于将 OpenClaw(原为软件任务编排引擎)扩展为支持多机器人的具身运行时,通过标准化接口连接异构机器人,并引入记忆和反馈模块。
- 关键技术包括:基于ROS的机器人适配器、视觉语义嵌入的向量检索记忆、以及基于奖励模型的执行进度评估器。
Card 05
数据集与资源
数据集与资源
- 未涉及特定训练数据集或模型预训练过程。
- 实验平台包括三种异构机器人:Unitree G1 人形机器人、Unitree Go2 四足机器人 和 Agilex Piper 机械臂。
- 实验聚焦于在真实物理环境中的系统级演示,未提及具体的 GPU/TPU 训练资源。
Card 06
评估与结果
评估与结果
- 评估在真实世界的多样化任务场景中进行,侧重于系统功能性演示而非基准指标对比。
- 主要评估场景包括:机械臂在部分可观测下的交互搜索与语义模糊指令操控、人形机器人的移动操作与跨机器人巡检、四足机器人的访客引导。
- 实验结果表明,ABot-Claw 能够成功执行长时域、多步骤任务,在部分可观测、语义模糊及跨机器人协作场景下展现出鲁棒性和适应性。