论文提出了 ABot-Claw，一个基于 OpenClaw 运行时扩展的具身智能框架，旨在弥合高层次推理与低层次物理执行之间的鸿沟。

论文详情

ABot-Claw: A Foundation for Persistent, Cooperative, and Self-Evolving Robotic Agents

2026-04-11 · 原文 · 翻译 · 2604.10096

论文提出了 ABot-Claw，一个基于 OpenClaw 运行时扩展的具身智能框架，旨在弥合高层次推理与低层次物理执行之间的鸿沟。该框架旨在解决现有系统（如纯 VLA 模型或沙盒内 Agent）在真实世界开放环境中难以进行持久上下文维护、多机器人协作和在线纠错的问题。论文的目标是构建一个能够进行持久记忆、跨具身协作和自我进化的机器人智能体基础。

4 分钟读完 6 张阅读卡 AMAP CV Lab

一眼看懂封面预览

论文提出了 ABot-Claw，一个基于 OpenClaw 运行时扩展的具身智能框架，旨在弥合高层次推理与低层次物理执行之间的鸿沟。

论文提出了 ABot-Claw，一个基于 OpenClaw 运行时扩展的具身智能框架，旨在弥合高层次推理与低层次物理执行之间的鸿沟。
该框架旨在解决现有系统（如纯 VLA 模型或沙盒内 Agent）在真实世界开放环境中难以进行持久上下文维护、多机器人协作和在线纠错的问题。
论文的目标是构建一个能够进行持久记忆、跨具身协作和自我进化的机器人智能体基础。

Card 01 研究单位

研究单位

AMAP CV Lab

Card 02 论文概述

论文概述

论文提出了 ABot-Claw，一个基于 OpenClaw 运行时扩展的具身智能框架，旨在弥合高层次推理与低层次物理执行之间的鸿沟。
该框架旨在解决现有系统（如纯 VLA 模型或沙盒内 Agent）在真实世界开放环境中难以进行持久上下文维护、多机器人协作和在线纠错的问题。
论文的目标是构建一个能够进行持久记忆、跨具身协作和自我进化的机器人智能体基础。

Card 03 核心贡献

核心贡献

提出了 统一具身接口与能力驱动调度机制，实现异构机器人（机械臂、人形、四足）的协调与并行执行。
设计了 以视觉为中心的跨具身多模态记忆系统，用于持久化存储和检索物体、位置、关键帧等环境信息。
集成了 基于通用评价者模型的闭环反馈机制，用于在线评估任务进度、支持局部修正和重新规划。
构建了 分层解耦的系统架构，将高层任务编排、共享服务与底层机器人执行分离，提高了系统的可维护性和可扩展性。
在多种异构机器人平台上进行了端到端的真实世界任务演示，验证了框架的有效性。

Card 04 方法描述

方法描述

框架采用 分层解耦架构，包含三层：OpenClaw层（负责高层交互与调度）、共享服务层（提供感知、记忆、评估等独立服务）、机器人层（负责具体硬件执行）。
核心创新在于将 OpenClaw（原为软件任务编排引擎）扩展为支持多机器人的具身运行时，通过标准化接口连接异构机器人，并引入记忆和反馈模块。
关键技术包括：基于ROS的机器人适配器、视觉语义嵌入的向量检索记忆、以及基于奖励模型的执行进度评估器。

Card 05 数据集与资源

数据集与资源

未涉及特定训练数据集或模型预训练过程。
实验平台包括三种异构机器人：Unitree G1 人形机器人、Unitree Go2 四足机器人 和 Agilex Piper 机械臂。
实验聚焦于在真实物理环境中的系统级演示，未提及具体的 GPU/TPU 训练资源。

Card 06 评估与结果

评估与结果

评估在真实世界的多样化任务场景中进行，侧重于系统功能性演示而非基准指标对比。
主要评估场景包括：机械臂在部分可观测下的交互搜索与语义模糊指令操控、人形机器人的移动操作与跨机器人巡检、四足机器人的访客引导。
实验结果表明，ABot-Claw 能够成功执行长时域、多步骤任务，在部分可观测、语义模糊及跨机器人协作场景下展现出鲁棒性和适应性。