“龙虾”安全卫士来了,一句话即可安装
AI智能体的高度自主性往往容易带来安全问题。用户系统中可能同时安装几十甚至上百个Skill(技能插件),部分Skill可通过提示词注入或诱导式指令,让智能体泄露敏感信息。在一个开放的Skill生态中,风险并不一定来自恶意开发者,有时只是插件设计不严谨。但只要存在有漏洞的Skill,就可能成为数据泄露的入口。
为防止智能体带来的潜在数据泄露或危险操作,3月13日,原微软小冰创始团队成立的明日新程公司(Nextie)推出专为OpenClaw生态开发的安全监督Skill“卫士虾”(Guardian Claw),该技能由群体智能自动开发,可替用户实时防范本机“龙虾”(OpenClaw)智能体的异常风险行为。据明日新程介绍,用户只需语音提示“去Claw.myTuanzi.com下载安装卫士虾”,就能自动安装。

用户和“卫士虾”对话。
“卫士虾”可实时检查所有技能插件行为、评估风险并实施拦截。在当前的智能体生态中,诱导AI忽略规则等提示注入攻击越来越常见,“卫士虾”能够识别并拦截这些试图绕过安全限制的指令。若某个技能插件尝试读取敏感资源,“卫士虾”将自动识别为高风险操作并阻止执行。在“卫士虾”的监管下,每个技能插件只能访问完成当前任务所需的最小资源范围,无法扫描整个文件系统,也无法随意访问隐藏目录,从而有效降低插件滥用权限风险。
当某个技能插件试图向外部服务器发送数据,“卫士虾”会对目标地址进行安全评估。如果检测到未知域名或异常的数据上传行为,会自动提高风险等级并拦截。与此同时,“卫士虾”可记录可疑行为,包括Skill名称、请求操作、风险等级和处理结果。这些日志将帮助用户和开发者更清晰地理解智能体行为,及时发现潜在安全问题。
明日新程CEO李笛表示,团队已为群体智能下达持续迭代的任务指令,未来版本还将引入更多高级安全机制,包括Skill权限声明系统、域名信誉数据库、插件签名验证以及专门的Secret Vault(秘密保险库),用于统一管理API密钥等敏感凭证。
