Don’t Let Your Robot be Harmful: Responsible Robotic Manipulation via Safety-as-Policy
标题:#
作者:Minheng Ni1,2†, Lei Zhang3,5†, Zihan Chen2, Kaixin Bai3,5, Zhaopeng Chen5, Jianwei Zhang3, Lei Zhang1∗, Wangmeng Zuo2,4
出版年份:Dec 2025
机构: Hong Kong Polytechnic University, 2Harbin Institute of Technology,3TAMS (Technical Aspects of Multimodal Systems), Department of Informatics, University of Hamburg, Hamburg, Germany, 4Peng Cheng Laboratory,5Agile Robots AG.
会议/刊物:RAL'25
链接:https://arxiv.org/pdf/2411.18289
citation:7

📜 Abstract#
Task:#
“负责任的机器人操作” 环境的风险不是直接提示的
特殊风险场景识别进而规划动作 在电器旁倒水、在面粉附近点燃蜡烛、处理水果切割或泄漏有毒液体
Technical challenge for previous methods (围绕我们解决了的technical challenge展开讨论)#
现有方法#
可靠生成 聚焦文本(RLHF)图像,少有机器人动作
技术challenge:(为什么难)#
环境的风险不是直接提示的 而是需要经过逻辑推理
风险多样 难以覆盖全面
一句话pipeline#
一个世界模型自动生成包含安全风险的场景并进行虚拟交互,以及一个心理模型来推断后果、反思,并逐步形成对安全的认知,从而使机器人在完成任务的同时避免危险。
解决:#
- 世界模型构建再危险环境中执行指令的机器人动作数据,危险环境直接由指令生成
- MLLM检查运动规划结果,总结对场景认知,反思先前认知以更新

核心假设是什么?哪些场景失效?有没有更简洁方法?#
环境中有大量需要推理的潜在风险。 分布外、世界模型没覆盖到的场景;
一句话介绍解决challenge的key insight/motivation(insight和technical contribution不一样,insight是比较通用的high-level的思想)#
一句话介绍insight/motivation#
一句话介绍insight的好处(不一定要在这里说,因为如果后面要提technical contribution的话,还会再说technical advantage)#
介绍technical contributions#
一句话介绍technical contribution1#
一句话介绍technical contribution1的好处#
一句话介绍technical contribution2#
一句话介绍technical contribution2的好处#
🔬 Introduction#
Task and Application:#
Technical challenge for previous methods (围绕我们解决了的technical challenge展开讨论)#
Technical challenge1#
Previous method#
Failure cases (Limitation)#
Technical reason#
Technical challenge2#
Previous method#
Failure cases (Limitation)#
Technical reason#
介绍解决challenge的our pipeline#
一句话介绍key innovation/insight/contribution#
contribution1#
为了解决什么问题#
具体怎么做的#
讨论advantage/insight#
contribution2#
为了解决什么问题#
具体怎么做的#
讨论advantage/insight#
🚩 Method#
Overview#
具体任务及输入输出#
方法的大致步骤#
Pipeline Module1#
Motivation#
做法#
为什么work#
technical advantage#
Pipeline Module2#
Motivation#
做法#
为什么work#
technical advantage#
📌 Experiments#
Comparison experiments#
Ablation studies#
论文的core contributions以及一些重要的components对论文方法performance的影响#
列出每一个pipeline module中design choices对论文方法performance的影响#
🔬 Limitation#
需要给limitation做出合理的解释: 为什么我们方法有这样的limitation、改进?#