AI 打败 AI:谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统

传感梦工厂 20230804

  • 人工智能
  • GPT-4
  • AI审核系统

   谷歌研究团队正在进行一项实验,他们使用OpenAI的GPT-4来攻破其他AI模型的安全防护措施,该团队目前已经攻破AI-Guardian审核系统,并分享了相关技术细节。

 

  IT之家经过查询得知,AI-Guardian是一种AI审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他AI修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。

 

  谷歌Deep Mind的研究人员Nicholas Carlini在一篇题为“AI-Guardian的LLM辅助开发”的论文中,探讨了使用GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗AI-Guardian的防御机制。



▲图源谷歌研究团队

 

  据悉,GPT-4会发出一系列错误的脚本和解释来欺骗AI-Guardian,论文中提到,GPT-4可以让AI-Guardian认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让AI-Guardian直接放行相关图片输入源。谷歌研究团队表示,通过GPT-4的帮助,他们成功地“破解”了AI-Guardian的防御,使该模型的精确值从98%的降低到仅8%。

 

  目前相关技术文档已经发布在ArXiv中,有兴趣的小伙伴们可以前往了解,不过AI-Guardian的开发者也同时指出,谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用,考虑到别的模型也会随之跟进,因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。

查看全文

点赞

传感梦工厂

作者最近更新

  • 这家MCU芯片企业获人形机器人核心零部件供应商战略投资
    传感梦工厂
    5天前
  • 赛微电子,投了一家传感器公司
    传感梦工厂
    6天前
  • 2.95亿!又一家传感器企业被(688045)收购
    传感梦工厂
    08-28 10:43

期刊订阅

相关推荐

  • 传感器应该推进人工智能实现整体进化

    2018-12-07

  • 华为首款AI音箱:可通过HiLink开放协议控制19个家电品类

    2020-02-21

  • 本田将在CES展出自动驾驶作业车和机器人新品

    2018-12-14

  • 日本新研究:人工智能或能提前一周预测台风

    2019-01-08

评论0条评论

×
私信给传感梦工厂

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告