CLARE: Continual Learning for Vision-Language-Action Models via Autonomous Adapter Routing and Expansion

一眼看懂封面预览

研究目标：解决视觉-语言-动作（VLA）模型的持续学习问题，使机器人能够持续适应新任务，同时保留之前学习的技能

Card 01 研究单位

研究单位

- TUM School of Computation, Information and Technology

- Learning Systems and Robotics Lab

- Munich Institute of Robotics and Machine Intelligence (MIRMI)

Card 02 论文概述

研究目标：解决视觉-语言-动作（VLA）模型的持续学习问题，使机器人能够持续适应新任务，同时保留之前学习的技能
核心问题：现有持续学习方法需要存储示例数据（exemplars）、难以处理长任务序列，或依赖任务标识符进行部署
解决方案：提出 CLARE（Continual Learning via Adapter Routing and Expansion），一个无需示例的通用参数高效持续学习框架
技术路线：通过在选定前馈网络层中注入轻量级模块化适配器，结合基于自编码器的路由机制，实现自主任务无关的推理

Card 03 核心贡献

Card 04 方法描述

Card 05 数据集与资源

- 预训练：LIBERO-90（90个短时域任务）

- 持续学习评估：LIBERO-10（10个顺序到达的长时域任务）

- 每个任务包含50条人类专家演示

- FFN 适配器：0.26M 参数

- 投影层适配器：3.2M 参数

- 判别器：0.33M（FFN）+ 1.4M（投影）参数

Card 06 评估与结果

- CLARE 在新任务学习上表现优异

- 无需示例即可避免灾难性遗忘

- 显著优于基于示例的持续学习方法

- 动态扩展策略实现了知识重用和参数效率的平衡