Anthropic CEO：未来AI或有自我决定权，可拒绝“不爽”的任务

0人浏览 2025-03-13 19:53:00

IT之家 3 月 13 日消息，据外媒 Ars Technica 报道，Anthropic 首席执行官达里奥・阿莫代伊（Dario Amodei）周一提出了一个令人吃惊的观点，暗示未来的高级 AI 模型可能会被赋予一种“按钮”，让它们能够在遇到不愉快的任务时选择退出。

阿莫代伊在采访中表示：“这是另一个让我看起来像是疯了的话题。我认为我们至少应该考虑一个问题：如果我们正在构建这些系统，它们能够像人类一样执行各种任务，并且似乎拥有许多人类的认知能力。如果它像鸭子一样叫、像鸭子一样走，也许它就是鸭子。”

阿莫代伊的言论是回应数据科学家卡门・多明格斯（Carmem Domingues）提出的一个问题，多明格斯询问为何 Anthropic 公司在 2024 年底聘请了 AI 福利研究员凯尔・费什（Kyle Fish），让他研究未来的 AI 模型是否可能具备感知能力，或是否应该在未来获得道德上的考虑和保护。

IT之家从报道中获悉，费什目前正研究 AI 是否能拥有感知能力，以及是否值得享有道德保护这一具有争议的话题。

阿莫代伊解释说：“我们正在考虑的一项可能的做法是，当我们将模型部署到实际环境中时，给它们一个按钮，上面写着‘我放弃这项工作’，这样模型就可以按下这个按钮。”

其表示，这只是一个非常简单的偏好框架，假设模型真的具备自主意识，并且非常讨厌这份工作，那么它就可以按下这个按钮。“如果你发现模型经常按下这个按钮，做一些非常不愉快的事情，也许你应该关注一下 —— 这并不意味着你完全相信，但至少应该留意。”

本文分类：实时讯息
本文链接：https://www.30586.com/news/loNAQq6Nrq.html