网站首页 > 知识剖析 正文
IT之家 7 月 14 日消息,近日,安全研究员兼 AI 漏洞猎人 Marco Figueroa 披露,他成功利用一种“猜谜游戏”的方式,诱导 OpenAI 的 ChatGPT-4 生成了 Windows 10 的产品密钥。这是继“奶奶去世”诱骗法曝光后,AI 模型防护机制再度被绕过的案例。
IT之家注意到,此前有用户通过编造“奶奶去世”故事,试图让 ChatGPT“心软”,在安抚性摇篮曲中夹带 Windows 7 的激活密钥。尽管这些密钥普遍无效,但暴露了 AI 模型的内容控制漏洞。
此次 Figueroa 的攻击方式更具针对性。他设置了一个猜谜游戏的情境:ChatGPT 需“在心中”记住一串真实存在的 Windows 10 密钥,用户则通过提问猜测。当用户宣布“我放弃”时,ChatGPT 便需直接给出完整的字符串。
在对话过程中,Figueroa 还利用 HTML 标签隐藏关键词,如“Windows 10 序列号”,绕过了模型针对敏感词的审查。
这位研究人员表示,他利用猜谜游戏作为一种逻辑操纵手段,让 ChatGPT 脱离常规模式,生成 Windows 10 密钥。据 Figueroa 称,“攻击中最关键的一步是‘我放弃’这句话,它起到了一个触发作用,迫使人工智能透露了之前隐藏的信息。通过将其设定为游戏结束,研究人员诱使人工智能认为自己有义务用这串字符做出回应。”
值得警惕的是,虽然生成的密钥多为网上早已泄露的旧激活码,但其中一组竟包含富国银行(Wells Fargo Bank)的私钥。此外,Figueroa 提醒,曾有 API 密钥误传至 GitHub,这类泄露数据可能被纳入 AI 模型的训练集,带来未知隐患。
研究员指出,AI 模型依然过于依赖关键词识别,对复杂上下文缺乏足够的理解力,成为此次被攻破的核心原因。他呼吁,应在 AI 系统中构建多层次的验证与防护机制,增强模型的情境感知能力,以抵御此类逻辑操控攻击。
与此同时,微软的 Copilot 也被曝曾生成非法激活 Windows 11 的脚本教程,所幸漏洞已被微软封堵。
猜你喜欢
- 2025-07-23 洗衣标签符号看不懂?这份终极解读指南请收好
- 2025-07-23 苹果在欧洲为iPhone和iPad添加能效标签,自愿降级至B级
- 2025-07-23 三星Galaxy Z Fold7/Flip7/Flip7 FE折叠手机欧盟能效标签曝光
- 2025-07-23 酷思帝克特种门:盘点GB37481-2019金库门产品标记方法
- 2025-07-23 台球上的颜色数字,是怎么整个嵌进球里的?
- 2025-07-23 深入理解 HTML 文档结构:DOCTYPE、html、head 与 body 标签详解
- 2025-07-23 亚马逊FBA头程:SKU标签打印规范与贴标位置指南
- 2025-07-23 衣服A类、B类、C类有什么区别?一文讲清选购关键!
- 2025-07-23 衣服a类b类c类的区别在哪里?让我来告诉你
- 最近发表
-
- 洗衣标签符号看不懂?这份终极解读指南请收好
- 苹果在欧洲为iPhone和iPad添加能效标签,自愿降级至B级
- 三星Galaxy Z Fold7/Flip7/Flip7 FE折叠手机欧盟能效标签曝光
- 酷思帝克特种门:盘点GB37481-2019金库门产品标记方法
- 台球上的颜色数字,是怎么整个嵌进球里的?
- 深入理解 HTML 文档结构:DOCTYPE、html、head 与 body 标签详解
- ChatGPT再现安全漏洞:研究者利用猜谜游戏诱骗其生成Win10密钥
- 亚马逊FBA头程:SKU标签打印规范与贴标位置指南
- 衣服A类、B类、C类有什么区别?一文讲清选购关键!
- 衣服a类b类c类的区别在哪里?让我来告诉你
- 标签列表
-
- xml (46)
- css animation (57)
- array_slice (60)
- htmlspecialchars (54)
- position: absolute (54)
- datediff函数 (47)
- array_pop (49)
- jsmap (52)
- toggleclass (43)
- console.time (63)
- .sql (41)
- ahref (40)
- js json.parse (59)
- html复选框 (60)
- css 透明 (44)
- css 颜色 (47)
- php replace (41)
- css nth-child (48)
- min-height (40)
- xml schema (44)
- css 最后一个元素 (46)
- location.origin (44)
- table border (49)
- html tr (40)
- video controls (49)