计算圆周率(Pi)位数的竞赛最初只是一项非正式的活动,但随着时间的推移,其重要性日益凸显。我们专注于服务器领域的同事在StorageReview已经证明,存储性能可以决定一次圆周率计算的成败。他们使用单台服务器运行了四个月,最新创下的记录是惊人的3.14亿位数字。

Cover Image

快速计算圆周率很快成为衡量CPU浮点性能的一种基准测试方法。然而,随着计算规模变得极其庞大,任务也变得更为复杂,因为RAMI/O架构和存储系统都开始发挥作用。这正是StorageReview通过使用单台2U服务器进行了为期四个月的计算运行并创下记录所清晰阐明的一点。

这台机器是一台戴尔PowerEdge R7725设备,配备了两颗AMD Epyc 192核芯片,总计384个核心,以及1.5 TBDDR5内存——以当今的价格来看,这笔钱大概能买下一个小国家。不过,这套配置的亮点在于存储阵列,它拥有2.5 PB的存储空间,这得益于一个由40块美光6550 Ion固态硬盘组成的阵列,每块容量为61.44 TB

长期以来,将圆周率计算到如此长的位数都需要大量的字节来存储中间计算结果。毕竟,你处理的是长达数万亿位的因数。以往的方法,例如谷歌(Google)2022年创下的100万亿位记录,使用了云服务器实例;而Linus Media Group铠侠(Kioxia)在今年早些时候进行的300万亿位计算,则使用了带有共享存储的Weka集群。但StorageReview选择使用简单、快速的本机SSD来证明一个观点。

值得注意的是,实现314万亿位计算的一个关键因素是,与上一代不同,所使用的第17代戴尔服务器在其存储背板中没有PCIe交换机;相反,它们直接连接到CPUPCIe通道。虽然有40个硬盘位,平均每个SSD分配2到4条通道,但这仍然实现了高达280 GB/s的读写性能,远高于StorageReview自己过去的实验数据。

此外还进行了其他相关的优化。该团队针对y-cruncher软件在大位数计算时产生的数据模式,对机器的临时存储阵列进行了调整。他们还将服务器的标准风冷配置改为CoolIT AHx10设置,从而使Epyc芯片获得了更高的稳态负载时钟频率。

功耗仅为1600W,这个数字本身很高,但就效率而言,实际上是一个相当令人印象深刻的数字。最后但同样重要的是,操作系统从Windows Server更换为Ubuntu 24.04.2,这个简单的更换本身就带来了更好的I/O性能。我们不禁想知道,如果使用支持原生NVMe的最新Windows Server版本,性能是否会不相上下。如果你对更多细节感到好奇,不妨去阅读StorageReview完整的文章。


文章标签: #圆周率计算 #世界纪录 #服务器性能 #存储技术 #硬件优化

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。