今年早些时候,博尔特图形(Bolt Graphics)正式发布宙斯(Zeus)GPU平台时,曾简短提及其即将推出的旗舰图形处理器在光线追踪工作负载中可能比英伟达(Nvidia)的GeForce RTX 5090快10倍左右。但这家初创公司此前从未展示过实际基准测试结果。近日,该公司悄然添加了一张图表,展示宙斯GPU与现有显卡的相对光线追踪性能,数据看起来相当惊人。然而,这些模拟测试结果存在几点值得注意之处。

Cover Image

博尔特图形展示的图表是光线-三角形相交预算,以每帧每像素的射线三角形(tris)为单位测量。该数值表示在维持120 FPS帧率、3840x2160分辨率下,GPU在单帧渲染中对每个像素执行光线-三角形相交测试的原始光线追踪能力。这一数据可作为GPU在光线或路径追踪渲染中能处理的几何与光照复杂度的理论上限,也与博尔特的市场主张一致——由于现代GPU缺乏足够的光线追踪和路径追踪性能,游戏开发者并未广泛采用这些技术。

根据博尔特使用自研微基准测试的内部模拟,其即将推出的四芯片宙斯4c(非显卡形态,而是服务器)性能预计比英伟达现有旗舰GeForce RTX 5090(当前最佳显卡)快13倍,而单芯片宙斯1c(显卡形态)则快3.25倍。实际上,即便是入门级宙斯也能在4K分辨率下维持120 FPS的同时实现每像素超过25次采样。

该微基准测试数值越高,意味着GPU能在不跌破目标帧率(此处为120 FPS)的情况下维持更多采样、更密集的几何结构或二者兼具。但博尔特未披露微基准测试细节,也未说明如何模拟其硬件性能及获取AMD英特尔(Intel)和英伟达GPU的对比数据,因此这些结果的实际参考价值有限。

合成测试中的工作负载通常受严格控制:光线以可预测模式投射至固定三角形集,且加速结构为静态优化状态。此类测试能生成反映GPU理想条件下原始相交吞吐量的高数值,对于了解GPU在此特定负载中的理论极限已足够。但在实际游戏引擎中,该数值受诸多变量影响:动态物体可能需重建或更新加速结构;光线可能因反射折射而失序;场景三角形密度会逐帧变化;引擎的遍历算法、着色管线及内存布局也会改变每条光线需测试的三角形数量,从而影响有效速率。因此,游戏中的实际光线-三角形速率低于合成测试,且会随场景内容与渲染设置大幅波动。

至于实际游戏表现,则取决于着色器与内存性能等多重因素。宙斯1c的着色性能为10 FP32 TFLOPS,宙斯2c翻倍至20 FP32 TFLOPS,但仍远低于GeForce RTX 5090的105 FP32 TFLOPS。内存方面,宙斯2c(该公司最高性能的插卡形态)板载128 GB LPDDR5X内存,显著多于GeForce RTX 5090的32 GB GDDR7;但英伟达显卡内存带宽达1.8 TB/s,而宙斯2c仅为725 GB/s。

需注意的是,博尔特图形自身也通过模拟测试GPU能力与性能,因此无法预估宙斯1c/2c/4c在实际应用中的表现。此外,这些图形解决方案预计2026年向开发者提供样品,2027年量产。届时AMD英伟达必然已发布新一代GPU,将宙斯1c/2c与2027年的GeForceRadeon显卡对比才更具意义。


文章标签: #GPU #光线追踪 #博尔特 #英伟达 #显卡

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。