Tenstorrent公司发布了其TT-QuietBox 2人工智能工作站,该工作站基于RISC-V架构打造,采用液冷散热并配备128 GB显存,起售价为9999美元。

这款由Tenstorrent自主研发的液冷全RISC-V人工智能工作站,能够轻松运行1200亿参数规模的模型。
Tenstorrent TT-QuietBox 2是一款旨在满足人工智能企业和客户需求的工作站。它搭载了该公司基于16个大型RISC-V核心打造的Blackhole人工智能加速卡,每张卡配备高达32 GB的GDDR6显存。QuietBox 2最多可配置四张这样的Blackhole加速卡,从而拥有高达128 GB的GDDR6显存。此外,该工作站还板载了256 GB的系统内存。虽然这款工作站由Tenstorrent自行开发,但该公司也正与雷蛇(Razer)合作开发另一款搭载Wormhole人工智能芯片的独立人工智能加速设备。
由首席执行官吉姆·凯勒(Jim Keller)领导的Tenstorrent人工智能计算公司今日发布了TT-QuietBox 2(Blackhole)。这款运行安静、采用液冷散热的人工智能工作站可直接在您的桌面上运行高达1200亿参数的模型,随附从编译器到内核的完全开源软件栈,起售价为9999美元。它标志着业界首款基于RISC-V架构的桌面人工智能工作站问世,可提供万亿次级(teraflop-class)的推理性能。
QuietBox 2围绕一个不同的理念构建:从事实际人工智能工作的开发者应该能够看到、控制并拥有其计算堆栈的每一层,从芯片架构到编译器。它非常适合需要本地部署(无需机架)的开发者及中小型企业部署。
QuietBox 2开箱即可快速部署,在多样化的人工智能领域表现出色:
大语言模型与代码:GPT-OSS 120B完全在设备上运行——这是一个完整的1200亿参数模型,可在您的桌面上私有化运行。Llama 3.1 70B模型运行速度达到每秒476.5个令牌。Qwen3-32B可作为私有代码助手部署,能够推理整个代码库,不受云端令牌限制。
创意与多模态:Flux处理图像生成,Wan 2.2完全本地处理视频合成,确保创意知识产权不流经第三方服务器。
科学研究:生物分子机器学习模型Boltz-2在单个Blackhole处理器上仅需49秒即可预测一个由686个氨基酸组成的蛋白质结构——同样的任务在现代CPU上需要45分钟。这达到了旗舰级工作站GPU的性能,而成本仅为前者的一小部分。QuietBox 2可以并行预测四个蛋白质结构,实现4倍的吞吐量提升。
对于不在预装列表中的模型,Tenstorrent的开源人工智能编译器TT-Forge可以将来自PyTorch、ONNX、TensorFlow、JAX和PaddlePaddle的模型直接编译到硬件上运行。只要能在标准框架上运行,就能在QuietBox 2上运行。
四颗Blackhole专用集成电路在一个桌面友好的机箱内作为统一的网状网络协同工作。该系统拥有480个Tensix核心,在BlockFP8精度下可提供2654 TFLOPS的算力,并辅以128 GB的GDDR6高速显存和256 GB的DDR5系统内存。
该架构将计算单元和高密度静态随机存取存储器集成在单个芯片上。这种数据流方法通过片上存储器高效传输张量,完全规避了限制传统硬件持续吞吐量的动态随机存取存储器瓶颈。通过利用GDDR6和片上静态随机存取存储器,QuietBox 2完全避免了当前导致人工智能硬件市场价格飙升的高带宽内存供应短缺问题。
该系统运行于Ubuntu 24.04系统,可插入标准的120伏墙壁插座,无需机架、专门的电气工程或服务器机房。
QuietBox 2的软件每一层都是开源的。这不仅仅是一个黑盒上的开放应用程序编程接口,而是全栈可见性。
TT-Forge让开发者能够完全了解计算图降级、转换、优化和执行的整个过程。
底层人工智能软件开发工具包TT-Metalium提供具有确定性执行能力的内核级控制。
TT-LLK处理底层内核软件。
开发者可以精确查看其工作流程每个阶段的情况,在硬件级别进行调试,分叉任何组件,并修改软件栈以适应其确切的工作负载。对于主权人工智能部署、受监管行业以及必须保证其基础设施如何处理数据的研究机构而言,这种透明度不仅仅是一个功能——它是核心架构。
QuietBox 2代表了一次从头开始的重新设计,专注于开发者的效率和环境效益。该系统完全预装了Ubuntu 24.04、完整的开源软件栈和TT-Studio,开箱即可快速部署。
与上一代产品相比,工程进步使空闲功耗和热量输出降低了约50%。结合显著扩展的文档和开发者工具,新的液冷机箱专为在桌面上安静、持续、高负荷运行而设计。



