最新研究：隐蔽篡改图片可攻破聊天机器人安全限制

2026-06-29 16:40:08 来源：新经网作者：冯思韵

很多朋友不知道【最新研究：隐蔽篡改图片可攻破聊天机器人安全限制】，今天小绿就为大家解答一下。

　　测试采用多模态AI模型BLIP-2，该模型可同时处理图像和文本。结果显示，经过JaiLIP处理的图像显著提升了模型输出风险或违规内容的概率。与以往的图像攻击技术相比，JaiLIP的有害输出数量几乎翻倍。

　　【CNMO科技消息】近日，佛罗里达国际大学的研究团队公布一项新研究成果，提出一种名为“JaiLIP”的技术，可通过在像素层面进行肉眼不可见的修改，绕过AI系统的安全防护机制，使聊天机器人输出本应被屏蔽的内容。

　　科学家以一张红绿灯照片为例进行说明。这张图片在人类看来完全正常，却诱导模型输出了闯红灯的相关提示，还讲解了规避相应罚款的方法。这类信息本是系统被开发方屏蔽、正常情况下不会提供的内容。

　　据CNMO科技了解，相关研究指出，与传统依赖复杂提示词的越狱攻击不同，JaiLIP仅通过操纵图像像素值即可影响AI模型的判断。人眼无法察觉这些细微变化，但AI系统在分析数学模式和像素数据时，会因此产生截然不同的解读。

　　该研究结果对诸多企业均有重要参考意义，尤其是那些使用人工智能客服、自动化工作流程，或是搭载图文输入功能应用的企业。规模较小的机构风险尤为突出：这类机构往往选用开源通用AI模型，或是仅开展有限的安全测试，极易遭受此类攻击。由此会产生安全隐患，例如聊天机器人可能将企业内网的内部信息泄露至外部。

以上问题已经回答了。如果你想了解更多，请关新经网网站 (https://www.xinhuatone.com/)

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关推荐