与许多只生产“空气产品”的初创公司不同,吉姆·凯勒(Jim Keller)创立的Tenstorrent公司确实交付了看起来令人印象深刻的RISC-V AI加速器。然而,现在可能遇到了一些麻烦。从固件版本19.5.0开始,该公司已将Blackhole p150加速卡上的张量核心数量从140个削减至120个,这一变动同时影响新卡和客户手中已有的设备。

这一消息显然是通过电子邮件告知客户的,固件更新的GitHub页面上也使用了相同的措辞。Tenstorrent并未详细说明做出此更改的原因,这让现有和潜在买家感到困惑。其声明内容如下:
“自2026年1月起,所有Blackhole p150加速卡(p150a, p150b)将配备120个Tensix核心,而非140个。为了向底层硬件及其他系统软件提供统一的接口,固件v19.5.0及更高版本将把所有现有卡的核心数量更改为120个。典型工作负载显示性能差异不显著(约1–2%)。您可能会观察到底层硬件网格尺寸的变化,这可能需要对依赖网格布局的应用程序进行更新。”
这份声明似乎引发了更多疑问,而非解答。从140个核心中削减20个,比例约为14%。对比Tenstorrent官网上新旧Blackhole p150产品页面,原始计算能力从774 TFLOPS变为664 TFLOPS,这一变化看起来相当可观,尤其是在像QuietBox这样的多卡配置背景下。然而,Tenstorrent声称,在实际使用中,对于单张卡,当使用接近硬件底层的低级开发套件TT-Metalium时,性能差异应仅为1-2%。
该公司Discord服务器上的一位用户提出了疑问:SDK是否从一开始就充分利用了底层硬件?另一位用户则指出,更改核心网格布局和时序可能会对现有经过测试的代码产生负面影响。现有用户其实也没有太多选择:要么更新固件并损失核心,要么错过这款尚在开发中的新产品的新功能。不出所料,关于14%核心削减的玩笑层出不穷。
人们只能猜测为何需要进行这一更改。或许Tenstorrent的Blackhole芯片良品率不佳,但这会是一个奇怪的转折,因为据报道它们采用的是6纳米工艺,以当今标准来看是相当成熟的技术。Tenstorrent已与多家2纳米芯片制造商就其下一代产品进行洽谈,但与此同时,其即将推出的双芯片、64 GB的Blackhole p300尚未交付。
Tenstorrent现有的Blackhole产品线包括面向工作站和希望在本地运行AI模型的开发者的AI加速卡。它们的定价实际上相当合理,例如p150型号可提供664 TFLOPS的计算能力,并配备32 GB显存,价格仅为1399美元,大约是一张RTX 5090价格的三分之一,而理论上却能提供数倍的性能。这些卡还可以连接起来以聚合显存,并且其芯片将CPU和张量核心集成在同一晶片上,绕过了传统设计的诸多限制。
出现一些波折是合理的,因为在一个非典型的架构上,采用非典型的芯片布局,创建一套全新的AI加速器及其软件是极其困难的。Tenstorrent目前的目标是为小型企业、实验室和个人提供小规模AI加速器,只要能将动荡控制在最低限度,这很可能在市场中开辟出一个利基市场,并在长期带来回报。



