美国取消出口管制后,Anthropic 在全球范围内重新部署《神鬼寓言 5》,增加了增强的保障措施和全行业人工智能越狱标准。

自 7 月 1 日起,美国政府出口管制解除后,Anthropic 将在全球重新部署其 Claude Fable 5 AI 模型。出于对网络安全漏洞的担忧,6 月 12 日实施的限制暂时停止了《神鬼寓言 5》及其对应游戏《神话 5》的访问。根据 Anthropic 的公告,《神鬼寓言 5》的回归伴随着增强的保障措施和解决人工智能越狱问题的新行业框架。
出口管制源于一份报告,该报告称《神鬼寓言 5》的防护措施可能被绕过,从而暴露软件漏洞。尽管 Anthropic 表示,使用不太先进的模型也可以进行类似的攻击,但该公司很快与美国政府机构和包括亚马逊在内的行业合作伙伴合作,以加强其安全屏障。新的分类器现在可以阻止 99% 的此类漏洞尝试,尽管代价是在良性编码任务中出现更频繁的误报。
克劳德寓言 5 模型于 6 月 9 日首次推出,是一款专为通用用途量身定制的注重安全的人工智能。 《神话 5》专为高级网络安全任务而设计,并且仅适用于特定的美国组织,与此不同,《神鬼寓言 5》采用了强大的保护措施来防止滥用。主要更新包括扩大安全裕度和主动阻止模糊或潜在有害请求的分类器。
Anthropic 表示,截至 7 月 7 日,其 Pro、Max、Team 和精选 Enterprise 计划的用户将可以使用每周使用限额的 50% 来访问《神鬼寓言 5》,之后使用将转变为基于信用的系统。该模型还将在未来几周内在 AWS、Google Cloud 和 Microsoft Foundry 等主要云平台上恢复。
出口管制事件促使 Anthropic 在制定评估人工智能越狱的全行业标准方面发挥了领导作用。该公司与亚马逊、微软和谷歌等合作伙伴正在起草一个框架,根据能力增益、武器化难易程度和可发现性等标准来评估越狱严重程度。 Anthropic 还宣布了一项 HackerOne 计划,以众包其模型中的安全漏洞。
Anthropic 由前 OpenAI 研究人员于 2021 年创立,现已成为全球最有价值的私营科技公司之一,继 2026 年 5 月完成 650 亿美元的 H 轮融资后,估值达到 9650 亿美元。该公司的 Claude 模型被定位为竞争人工智能系统的更安全替代品,强调人工智能的宪法原则和企业级部署。
Anthropic 与美国政府的密切合作凸显了人工智能、国家安全和监管之间日益紧密的交叉。该公司计划向政府机构提供未来模型的预发布访问和评估权,以及快速信息共享协议和联合研究计划。这些措施符合 6 月 2 日关于人工智能创新和安全的行政命令。
《神鬼寓言 5》的重新部署标志着在平衡人工智能创新与安全性和合规性方面迈出了重要一步。随着 Anthropic 应对这些挑战,更广泛的人工智能行业正在密切关注,尤其是随着具有先进功能的更强大模型上线。
书签











