Don’t Let Your Robot be Harmful: Responsible Robotic Manipulation via Safety-as-Policy

标题:#

作者:Minheng Ni1,2†, Lei Zhang3,5†, Zihan Chen2, Kaixin Bai3,5, Zhaopeng Chen5, Jianwei Zhang3, Lei Zhang1∗, Wangmeng Zuo2,4
出版年份:Dec 2025
机构: Hong Kong Polytechnic University, 2Harbin Institute of Technology,3TAMS (Technical Aspects of Multimodal Systems), Department of Informatics, University of Hamburg, Hamburg, Germany, 4Peng Cheng Laboratory,5Agile Robots AG.
会议/刊物:RAL'25
链接:https://arxiv.org/pdf/2411.18289
citation:7
 

Article Image

📜 Abstract#


Task:#

“负责任的机器人操作” 环境的风险不是直接提示的 

特殊风险场景识别进而规划动作 在电器旁倒水、在面粉附近点燃蜡烛、处理水果切割或泄漏有毒液体


Technical challenge for previous methods (围绕我们解决了的technical challenge展开讨论)#

 

现有方法#

可靠生成 聚焦文本(RLHF)图像,少有机器人动作

技术challenge:(为什么难)#

环境的风险不是直接提示的 而是需要经过逻辑推理

风险多样 难以覆盖全面

一句话pipeline#

一个世界模型自动生成包含安全风险的场景并进行虚拟交互,以及一个心理模型来推断后果、反思,并逐步形成对安全的认知,从而使机器人在完成任务的同时避免危险。

解决:#

  1. 世界模型构建再危险环境中执行指令的机器人动作数据,危险环境直接由指令生成
  2. MLLM检查运动规划结果,总结对场景认知,反思先前认知以更新
  3. Article Image

 

核心假设是什么?哪些场景失效?有没有更简洁方法?#

环境中有大量需要推理的潜在风险。 分布外、世界模型没覆盖到的场景;

 

 

一句话介绍解决challenge的key insight/motivation(insight和technical contribution不一样,insight是比较通用的high-level的思想)#

 

一句话介绍insight/motivation#

 

一句话介绍insight的好处(不一定要在这里说,因为如果后面要提technical contribution的话,还会再说technical advantage)#

 

介绍technical contributions#

 

一句话介绍technical contribution1#

 

一句话介绍technical contribution1的好处#

 

一句话介绍technical contribution2#

 

一句话介绍technical contribution2的好处#

 

🔬 Introduction#


 

Task and Application:#

 

Technical challenge for previous methods (围绕我们解决了的technical challenge展开讨论)#

 

Technical challenge1#

 

Previous method#

 

Failure cases (Limitation)#

 

Technical reason#

 

Technical challenge2#

 

Previous method#

 

Failure cases (Limitation)#

 

Technical reason#

 

介绍解决challenge的our pipeline#

 

一句话介绍key innovation/insight/contribution#

 

contribution1#

 

为了解决什么问题#

 

具体怎么做的#

 

讨论advantage/insight#

 

contribution2#

 

为了解决什么问题#

 

具体怎么做的#

 

讨论advantage/insight#

 

🚩 Method#


 

Overview#

 

具体任务及输入输出#

 

方法的大致步骤#

 

Pipeline Module1#

 

Motivation#

 

做法#

 

为什么work#

 

technical advantage#

 

Pipeline Module2#

 

Motivation#

 

做法#

 

为什么work#

 

technical advantage#

 

📌 Experiments#


 

Comparison experiments#

 

Ablation studies#

 

论文的core contributions以及一些重要的components对论文方法performance的影响#

 

列出每一个pipeline module中design choices对论文方法performance的影响#

 

🔬 Limitation#


需要给limitation做出合理的解释: 为什么我们方法有这样的limitation、改进?#

 

On This Page