MoIRA: Modular Instruction Routing Architecture for Multi-Task Robotics

论文详情

MoIRA: Modular Instruction Routing Architecture for Multi-Task Robotics

2025-07-02 · 原文 · 翻译 · 2507.01843

论文提出了 MoIRA (Modular Instruction Routing Architecture)，这是一个用于多任务机器人的模块化框架，旨在通过零样本外部文本路由器来协调解耦的专家模型。该研究解决了传统专家混合模型(MoE) 架构的局限性，特别是其内部路由机制刚性和需要昂贵联合训练的问题，为专家定制化和扩展部署提供了灵活的替代方案。

5 分钟读完 6 张阅读卡 Department of Multimedia Systems, National Universi…

一眼看懂封面预览

论文提出了 MoIRA (Modular Instruction Routing Architecture)，这是一个用于多任务机器人的模块化…

论文提出了 MoIRA (Modular Instruction Routing Architecture)，这是一个用于多任务机器人的模块化…
该研究解决了传统专家混合模型(MoE) 架构的局限性，特别是其内部路由机制刚性和需要昂贵联合训练的问题，为专家定制化和扩展部署提供了灵活的替代…
提出了新颖的模块化路由架构 MoIRA，该架构基于专家和任务的文本描述，将任务映射到预训练的专家。

Card 01 研究单位

研究单位

Department of Multimedia Systems, National University of Kyiv-Mohyla Academy
Department of Mathematics, National University of Kyiv-Mohyla Academy

Card 02 论文概述

论文概述

论文提出了 MoIRA (Modular Instruction Routing Architecture)，这是一个用于多任务机器人的模块化框架，旨在通过零样本外部文本路由器来协调解耦的专家模型。
该研究解决了传统专家混合模型(MoE) 架构的局限性，特别是其内部路由机制刚性和需要昂贵联合训练的问题，为专家定制化和扩展部署提供了灵活的替代方案。

Card 03 核心贡献

核心贡献

提出了新颖的模块化路由架构 MoIRA，该架构基于专家和任务的文本描述，将任务映射到预训练的专家。
评估了两种零样本路由策略：基于MiniLM的嵌入余弦相似度路由和基于SmolLM2-1.7B的提示驱动推理路由，并证明了其在指令扰动下的鲁棒性。
在 GR1 和 LIBERO 两个机器人基准测试上验证了MoIRA，表明其性能始终优于或与通用模型及其他MoE方法持平，并能泛化到未见过的任务。
对推理时专家服务策略进行了实证分析，量化了VRAM使用与切换延迟之间的权衡，支持可扩展的多专家部署。

Card 04 方法描述

方法描述

MoIRA 是一个与架构无关的元控制器，它将任务学习与任务分配解耦。一个独立的路由核心根据任务和专家的文本描述，选择最适合的专业化专家。
关键技术包括：1）将通用视觉-语言-动作模型（如Gr00t-N1 和 π₀）使用LoRA进行微调，得到轻量级专家适配器；2）采用两种预训练且无需调优的外部路由策略；3）提出了三种专家服务模式以适应不同部署需求。

Card 05 数据集与资源

数据集与资源

使用的数据集：GR1 Humanoid benchmark 和 LIBERO benchmark。
模型规模：GR00t-N1-2B 和 π₀-base-3.3B 作为VLA骨干网络，使用LoRA适配器进行专家微调。
训练资源：实验在单块 NVIDIA RTX A6000 GPU (48GB VRAM) 上进行。

Card 06 评估与结果

评估与结果

评估环境：在GR1和LIBERO模拟基准上进行实验，使用统计显著性检验。
主要评估指标：在GR1上使用均方误差，在LIBERO上使用任务成功率，并评估路由F1分数。
关键实验结果：在GR1上，专业专家显著降低了MSE（例如，Pouring任务降低123倍）。在LIBERO上，MoIRA驱动的专家（SR: 94%/93%）达到了与联合训练通用模型（SR: 95%/90%）的统计性能持平。两种路由策略都表现良好，其中SmolLM2在指令扰动下表现出更强的鲁棒性。MoIRA在LIBERO上的性能也与现有MoE系统（MoDE, Tra-MoE）竞争或优于它们。