英伟达(NVIDIA)正在为其数据中心人工智能(AI)图形处理器(GPU)新增一项软件服务,该服务可实时追踪这些GPU的位置,且不含任何“远程禁用开关”。

Cover Image

近期,有多份报道称,市场上需求旺盛的英伟达AI GPU被非法贩运或走私至受美国出口管制禁令限制的地区。这些芯片流入了中国,而美国政府近期刚刚批准了英伟达上一代霍珀(Hopper)架构H200 GPU对华销售。尽管如此,一些基于更新一代布莱克威尔(Blackwell)架构的GPU仍被中国机构采购。

为了应对这种非法活动,英伟达开发了一项新的软件服务,该公司在一份官方声明中向我们证实了这一点。根据信息,这项新的“位置验证技术”有助于指示芯片正在哪个国家或地区运行。据称,英伟达此前已私下开发并演示了该技术,但当前的市场形势促使他们开始向客户进行初步推广。

客户可以选择安装这一软件选项,这将使他们能够追踪其整个AI GPU集群,而不仅仅是单个GPU。这款新的软件代理利用GPU遥测技术来监控各种统计数据,如运行状况、完整性和库存情况,从而使客户能够了解其GPU的使用地点和状态。

英伟达的博客进一步介绍了这项新服务所提供的功能:

通过这项服务,数据中心运营商将能够:

  • 追踪功耗峰值,以在能源预算内最大化每瓦性能。

  • 监控整个集群的利用率、内存带宽和互连健康状况。

  • 及早检测热点和气流问题,以避免热节流和元器件过早老化。

  • 确认一致的软件配置和设置,以确保结果可复现和运行可靠。

  • 发现错误和异常,及早识别故障部件。

英伟达在一份声明中表示:“我们正在实施一项新的软件服务,使数据中心运营商能够监控其整个AI GPU集群的运行状况和库存。这款由客户安装的软件代理利用GPU遥测技术来监控集群的运行状况、完整性和库存情况。”

相关数据将托管在英伟达的NGC(GPU云)门户网站上,选择加入该软件服务的客户将能够查看各种指标来追踪其GPU。该软件服务将首先应用于需求量巨大的布莱克威尔(Blackwell)架构GPU,而美国目前尚未批准其在中国及其他受出口管制地区的销售。

英伟达重申,该软件中不包含“远程禁用开关”,该功能允许用户手动检测并随意禁用GPU。英伟达在其AI GPU中也没有嵌入任何此类硬件功能。


文章标签: #英伟达 #AI芯片 #GPU追踪 #出口管制 #数据中心

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。