最新研究:隐蔽篡改图片可攻破聊天机器人安全限制

2026-06-29 16:40:08    来源:新经网    作者:冯思韵
很多朋友不知道【最新研究:隐蔽篡改图片可攻破聊天机器人安全限制】,今天小绿就为大家解答一下。

  测试采用多模态AI模型BLIP-2,该模型可同时处理图像和文本。结果显示,经过JaiLIP处理的图像显著提升了模型输出风险或违规内容的概率。与以往的图像攻击技术相比,JaiLIP的有害输出数量几乎翻倍。

最新研究:隐蔽篡改图片可攻破聊天机器人安全限制

版权所有,未经许可不得转载

  【CNMO科技消息】近日,佛罗里达国际大学的研究团队公布一项新研究成果,提出一种名为“JaiLIP”的技术,可通过在像素层面进行肉眼不可见的修改,绕过AI系统的安全防护机制,使聊天机器人输出本应被屏蔽的内容。

  科学家以一张红绿灯照片为例进行说明。这张图片在人类看来完全正常,却诱导模型输出了闯红灯的相关提示,还讲解了规避相应罚款的方法。这类信息本是系统被开发方屏蔽、正常情况下不会提供的内容。

  据CNMO科技了解,相关研究指出,与传统依赖复杂提示词的越狱攻击不同,JaiLIP仅通过操纵图像像素值即可影响AI模型的判断。人眼无法察觉这些细微变化,但AI系统在分析数学模式和像素数据时,会因此产生截然不同的解读。

  该研究结果对诸多企业均有重要参考意义,尤其是那些使用人工智能客服、自动化工作流程,或是搭载图文输入功能应用的企业。规模较小的机构风险尤为突出:这类机构往往选用开源通用AI模型,或是仅开展有限的安全测试,极易遭受此类攻击。由此会产生安全隐患,例如聊天机器人可能将企业内网的内部信息泄露至外部。


以上问题已经回答了。如果你想了解更多,请关新经网网站 (https://www.xinhuatone.com/)
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。