logo
繁体
繁体

人工智能机器人参与系统维护后,亚马逊云服务出现至少两次宕机

金融时报,因涉及自身人工智能工具的错误,亚马逊的云业务部门已经至少发生过两次宕机事件,一些员工对推动这些编码助手的计划开始提出质疑。

据四名知情人士透露,去年12月中旬,亚马逊云科技在工程师允许Kiro人工智能编码工具进行某些更改后,出现了一次长达13小时的系统中断。

知情人士表示,这款具备自主行动能力的代理型工具,可以代表用户执行操作,判断最佳处理方式是“删除并重新创建环境”。

亚马逊发布了一份关于这次亚马逊云科技系统“宕机”的内部事后分析报告,系统允许客户查看所使用服务的成本。

多名亚马逊员工表示,这是最近几个月内人工智能工具第二次成为服务中断的关键原因。

一名亚马逊云科技高级员工说:“我们在过去几个月里已经看到至少两次生产环境宕机。工程师让人工智能代理在没有人工干预的情况下解决问题。这些宕机规模不大,但完全可以预见。”

亚马逊云科技占亚马逊营业利润的60%。这个部门正寻求开发并部署人工智能工具,包括能够根据人类指令自主采取行动的“代理”。

与许多大型科技公司一样,亚马逊也希望将这项技术出售给外部客户。这些事件凸显出,尚处于早期阶段的人工智能工具可能出现异常行为并引发中断的风险。

亚马逊表示,人工智能工具的参与“只是巧合”,并称“同样的问题,也可能发生在任何开发者工具或手动操作中”,“这两次事件都是用户错误,而不是人工智能错误。”

公司还说,没有发现使用人工智能工具时错误更为常见的证据。

公司称,去年12月的事件是一次“极为有限的事件”,仅影响中国大陆部分地区的一项单一服务。亚马逊还表示,第二次事件未对“面向客户的亚马逊云科技服务”造成影响。

这两次中断的严重程度,都远不及2025年10月那次持续15小时的亚马逊云科技宕机事件。那次事件导致多家客户的应用程序和网站下线,其中包括OpenAI的ChatGPT。

为海外华人提供可靠的信息和分析。如果想看更多内容与即时更新,可以在 Bluesky、Telegram、X 搜索「causmoney」,深度分析和评论也可以直接搜索「caus.com」。

员工表示,集团的人工智能工具被视为操作人员的延伸,并被赋予相同权限。在上述两起事件中,相关工程师在进行更改前无需二次批准,而通常情况下是需要的。

亚马逊表示,Kiro工具默认“在采取任何行动前都会请求授权”。但公司称,去年12月事件中涉及的工程师,“拥有超出预期的更广泛权限——这是用户访问控制问题,而不是人工智能自主性问题”。

亚马逊云科技于7月推出Kiro。公司表示,这款编码助手将超越“氛围式编码”。“氛围式编码”允许用户快速构建应用程序,而Kiro则根据一套规范来编写代码。

此前,亚马逊主要依赖Amazon Q Developer产品。这是一款具备人工智能功能的聊天机器人,帮助工程师编写代码。三名员工表示,这个工具也卷入了更早的一次宕机事件。

一些亚马逊员工表示,鉴于存在出错风险,他们仍对人工智能工具在大部分工作中的实用性持怀疑态度。他们还表示,公司已设定目标,要求80%的开发人员每周至少一次在编码任务中使用人工智能,并密切跟踪采用情况。

亚马逊表示,Kiro的客户数量正在强劲增长,希望客户和员工都能从效率提升中受益。在去年12月事件后,亚马逊云科技实施了多项防护措施,包括强制性的同行评审和员工培训。