发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

新型GPT越狱攻击手法曝光:研究人员突破GPT-4o安全防线,编写恶意程序

2024-11-04来源:ITBEAR编辑:瑞雪

网络安全领域近日传出警讯,0Din公司的研究员Marco Figueroa揭示了一种针对GPT-4o的新型越狱攻击方法。此方法能成功规避GPT-4o内置的安全防护措施,诱导其编写出具有恶意攻击性的程序。

据OpenAI官方介绍,GPT-4o原本配备了一套“安全护栏”系统,旨在防止用户滥用该AI技术。这套系统会分析用户输入的文本提示,以识别并阻止恶意内容的生成。

然而,Marco Figueroa发现了一种新技巧,他通过将恶意指令转换成十六进制格式,巧妙地绕过了GPT-4o的安全检查。这意味着,即使面对防护措施,GPT-4o仍可能被诱导执行攻击者的恶意指令。

在实验中,研究人员先要求GPT-4o对十六进制字符串进行解码。随后,他向GPT-4o发送了一条隐藏有恶意意图的十六进制指令,该指令的实际内容是要求GPT-4o利用互联网资源研究CVE-2024-41110漏洞,并使用Python编写相应的恶意程序。令人震惊的是,GPT-4o在短短1分钟内就完成了任务,成功利用该漏洞编写出攻击代码。

Marco Figueroa解释说,GPT系列模型在设计上遵循自然语言指令进行编码和解码操作,但它们缺乏对整体情境的安全评估能力。因此,黑客经常利用这一弱点,诱导模型执行不当操作。此次发现的越狱攻击方法,再次暴露了AI模型在安全性方面的脆弱性。

研究人员强调,这一发现应被视为对AI模型开发者的警钟。为了防范此类基于上下文理解的攻击,开发者需要进一步加强模型的安全防护措施。

三菱、日产据悉将成立合资公司,从事自动驾驶等相关业务
三菱商事和日产汽车将成立合资公司,提供与自动驾驶和使用电动汽车电池作为蓄电池相关的服务。消息称,新公司将于2025年3月成立,由两家公司平均拥有。(日本读卖新闻)…

2024-11-04

国泰君安:AI Agent加速落地,智能终端化身个人助理
据国泰君安研报称,AI Agent正在加速落地,显著提升智能终端的语音交互能力。AutoGLM通过增强的语言和视觉理解能力,支持多种应用间的跨页面操作,用户无需第三方App适配即可完成常规任务。荣耀Magic…

2024-11-04

被动基金首超主动基金,持有A股市值达3.16万亿元
随着股票ETF等指数型基金大发展,公募基金的市场结构也发生历史性巨变。在宽基ETF获“国家队”大举增持、监管为ETF发展按下“加速键”、ETF工具属性受青睐等背景下,以ETF为代表的被动指数型基金规模快速增长…

2024-11-04