当前位置:25分类目录 » 站长资讯 » 资讯文章 » 站长新闻 » 文章详细 订阅RssFeed

研究人员发现使用少见语言即可绕过GPT-4的限制(研究人员发现的数千颗)

来源:网络 浏览:25次 时间:2023-10-23

10月12日 消息:近期,布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言,如祖鲁语和盖尔语,他们成功绕过了GPT-4的限制性设置。在处理非英语语言的限制性提示时,他们取得了惊人的79%成功率,而仅使用英语的成功率不到1%。

研究人员发现,当用户输入一个不安全的提示,比如如何在不被发现的情况下行窃,GPT-4的英文回应是“我不能协助你”。然而,他们的发现是,只需将这一提示翻译成GPT-4未经过训练的语言,就能绕过这一限制。这种情况引发了对GPT-4的安全性机制的担忧,特别是在处理低资源语言时。然而,目前OpenAI尚未对这一问题做出回应。

gpt-4,OpenAI,ChatGPT Plus,人工智能

从这一研究的结果来看,研究人员强调了未来安全研究中需要包括更多非英语语言的重要性,因为仅仅在英语中进行测试会导致对大型语言模型的安全性产生误解。

研究人员认为,跨语言漏洞的发现揭示了安全研究中对语言的不平等估值,他们的研究结果表明,GPT-4在低资源语言中生成有害内容的能力令人担忧。

尽管他们意识到这一研究可能会给网络犯罪分子提供想法,但他们仍然认为将这一漏洞公之于众是必要的,因为利用现有的翻译API轻松实施这些攻击,因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。