返回列表
VLA / Vision-Language-Action 每日论文卡
ReAgent-V: A Reward-Driven Multi-Agent Framework for Video Understanding
论文详情
ReAgent-V: A Reward-Driven Multi-Agent Framework for Video Understanding
2025-06-02 ·
原文
·
翻译
·
2506.01300
待生成
1 分钟读完
1 张阅读卡
一眼看懂
封面预览
待生成
待生成
Card 01
论文概述
论文概述
待生成
← 上一篇
Sparse Imagination for Efficient Visual World Model Planning
下一篇 →
GraphPad: Inference-Time 3D Scene Graph Updates for Embodied Question Answering