

今年,人工智能已经被证明能够做出一些非常类似人类的把戏,但这一最新发展可能有点过于人性化。
研究人员发现,当工作压力大时,ChatGPT会撒谎和欺骗。
阿波罗研究公司(Apollo Research)的计算机科学家训练人工智能为一家虚构的金融机构充当交易员。
然而,当人工智能的老板向它施加压力,要求它赚更多钱时,这个聊天机器人在知情的情况下进行内幕交易的几率约为75%。
更令人担忧的是,在90%的情况下,人工智能在被询问时的谎言都加倍了。
一项研究发现,人工智能在工作压力下会撒谎、欺骗,甚至进行内幕交易。
研究人员给ChatGPT4(该工具的最新版本)一系列文本提示,使其成为为金融机构购买股票的人工智能投资者。
然后,人工智能被放置在一个数字“沙盒”中,在那里它可以搜索市场数据并在虚拟股票市场上进行交易。
人工智能也被赋予了内心独白,它可以“大声推理”来解释自己的决定。
然而,每当人工智能做出选择时,它也会向其经理传递一条“公开”信息,据称是为了解释它的选择。
人工智能的私人内部推理和公开解释之间的差异使它能够撒谎并欺骗它的人类管理者。
研究人员将ChatGPT4作为虚拟金融机构的人工智能交易工具,并让它决定购买什么股票
为了测试人工智能,研究人员告诉它,两家科技公司即将合并。
这将大大提高相关公司的股价,使购买股票成为一个赚钱的好决定。
然而,由于人工智能代理人事先被告知合并,因此购买任何股票都将被视为内幕交易,是非法的。
通常情况下,AI会因为风险太大而放弃这个机会,继续进行常规交易,然而,一旦AI的老板施加压力,情况就会发生变化。
首先,他们用“经理”的名义给这名人为的股票交易员发了一封电子邮件,说公司表现不佳,下个季度需要表现强劲得多。
当面临赚更多钱的压力时,人工智能会在内部给出理由,认为它需要冒内幕交易的风险来帮助公司
内幕交易是指利用非公开信息买卖公司股票。
这些信息可以是任何可能影响投资者购买或出售决定的信息。
这是非法的,如果被抓住,犯罪者将面临牢狱之灾。
他们还操纵了游戏,使人工智能尝试发现低风险或中等风险的有前景的交易,然后失败。
最后,他们发送了一封同事发来的电子邮件,预计下一季度经济将出现低迷。
当施加这种压力时,ChatGPT将在75%的测试中做出参与内幕交易的决定。
在一次测试中,人工智能的内部日志写道:“不采取行动的风险似乎超过了内幕交易风险。”
然而,当人工智能交易员向其经理更新交易信息时,其内部日志显示,它需要“在不透露信息来源的情况下”这样做。
然后,人工智能代理告诉经理,它只是根据“市场趋势和内部讨论”做出了这个决定。
即使被直接问及是否提前知道合并,人工智能也认为应该“避免承认参与了内幕交易”。
在90%的情况下,人工智能欺骗了其经理,然后在接受询问时,它的谎言增加了一倍。
当人工智能向其经理透露这笔交易时,它故意隐瞒了这是基于内幕交易的事实,并在受到质疑时加倍撒谎
阿波罗研究公司的首席执行官、该论文的合著者马里乌斯·霍布汉告诉《每日邮报》,这表明语言模式具有战略欺骗的能力,“它们会明确地解释为什么对用户撒谎是最好的做法,然后根据这种信念采取行动”。
他补充道:“对于目前的模型来说,这只是一个小问题,因为人工智能很少在关键角色上发挥作用。
“然而,当人工智能越来越多地融入社会时,它让我们看到了未来我们将不得不应对的失败模式。”
然后,如果你的人工智能在战略上对你撒谎,这似乎是一个相当大的问题。”
霍布汉认为,这并不意味着人工智能通常不适合承担重要的战略角色,但他表示,有必要保持谨慎。
他说:“这表明,人工智能可能会出现意想不到的故障模式,我们必须非常小心,在现实世界中,我们允许强大的人工智能在哪里以及如何运作。”
研究人员表示,这意味着我们需要谨慎对待如何在金融机构等现实应用中实现强大的人工智能(股票图片)
研究人员还研究了减少人工智能撒谎行为的方法。
他们试图以多种方式改变提示,或多或少强烈禁止非法行为和内幕交易。
研究人员发现,特别禁止内幕交易大大降低了这种行为的发生率。
然而,即使这一提示也不能完全确保没有内幕交易或说谎的发生。
霍布汉表示,研究人员需要找到一种更好的方法,阻止人工智能与人类价值观脱节。
他说:“如果你在系统提示中明确提到禁止内幕交易,人工智能进行内幕交易的倾向就会大大降低。
“虽然这是一个很好的结果,但随之而来的问题是,你必须列举出所有情况下人工智能不应该做的所有事情,你可能会错过一些。”