本文刊发在商业内幕,作者阿利斯泰尔·巴尔是《商业内幕》科技简报的作者。点击此处订阅。此前,他曾担任《商业内幕》全球科技编辑和彭博社大型科技团队负责人,并在《华尔街日报》、《今日美国》、路透社和MarketWatch等媒体从事新闻报道工作。

最近,我和一家人工智能基础设施公司的首席执行官共进午餐。我不能透露他的名字,但他说的一句话确实引起了我的注意:今年晚些时候将出现一批新的人工智能模型,会更强大,也会更高效。
这很可能让人工智能 token 变得更加充足,并且价格大幅下降。token 是模型处理信息的基本单位,也是衡量和定价人工智能使用量的标准方式。
围绕“tokenmaxxing”的焦虑可能会降温。或者,用户也可能再次进入狂热状态,更加毫无顾忌地消耗更多 token。
无论哪种情况,token 的价格很可能即将暴跌。这就是为什么我们已经看到一些人工智能模型提供商大幅降价,也看到其他公司开始谈论降价。
为海外华人提供可靠的信息和分析。如果想看更多内容与即时更新,可以在 Bluesky、Telegram、X 搜索「causmoney」,深度分析和评论也可以直接搜索「caus.com」。
OpenAI 首席执行官萨姆·奥尔特曼最近表示,人工智能成本已经成为一个巨大问题,并补充说,这家创业公司将有“很多办法帮助人们用更少支出获得更多价值”。
这一趋势可能已经开始反映在数据中。由 Silicon Data 运营、受到密切关注的 token 支出指数在5月底触及约2.06的高点,截至6月10日已降至1.75。
Silicon Data 首席执行官卡门·李告诉我,这可能意味着许多人工智能模型的 token 价格正在下降。
推动 token 价格下降的主要力量,是正在席卷人工智能数据中心的新一轮技术浪潮。
英伟达 Blackwell GPU 眼下正在大规模安装。到今年下半年,这些系统将开始大规模运行,这些芯片其实更像超级计算机,将帮助人工智能实验室训练新模型,并以更高效率运行这些模型。
这些系统的正确安装花了一些时间,部分原因是它们需要水冷,还要求其他复杂的新型数据中心配置。但回报可能非常巨大。
受尊敬的人工智能研究公司 SemiAnalysis 将英伟达最顶级的 Blackwell 系统 GB 300 NVL72,与英伟达上一代系统 Hopper HGX 200 进行了比较。
在旧系统上,每块 GPU 每秒生成90个 token,而新的 Blackwell 系统每秒生成6000个。也就是多出65倍。
这些系统消耗大量电力,而较新的 Blackwell 产品耗电更多。因此,SemiAnalysis 还比较了每个系统每兆瓦能够生成多少 token。按这一指标计算,Hopper 每秒生成54000个 token,而 Blackwell 每秒生成280万个,多出50倍。
为海外华人提供可靠的信息和分析。如果想看更多内容与即时更新,可以在 Bluesky、Telegram、X 搜索「causmoney」,深度分析和评论也可以直接搜索「caus.com」。
由于这些耗能的人工智能数据中心,电价正在上涨。因此如今评估 GPU 系统时,会看生成100万个 token 需要多少成本。
SemiAnalysis 也做了这项测试,结果发现,旧款 Hopper 系统每生成100万个 token 的成本为4.20美元。Blackwell 系统的成本为12美分,便宜35倍。
再说一次,随着2026年推进,新的人工智能模型将越来越多地在这些新的 Blackwell 系统上训练和运行。这很可能带来廉价生成 token 数量的大幅增加。
这就是为什么人工智能模型提供商很可能会大幅下调 token 价格:因为他们做得到。