父子改造旧校车,变身移动复古电脑博物馆
阅读全文

锤刻创思寰宇网
英特尔披露了其下一代至强6+高效核处理器家族(代号Clearwater Forest)的更多细节,该处理器将配备高达288个下一代核心。
现在,这一旅程随着第二代纯高效核家族(代号Clearwater Forest)而继续,它将成为至强6+产品线的一部分。Clearwater Forest处理器集成了多项尖端技术:采用英特尔18A制程节点,结合了RibbonFET和PowerVia技术,并首次大规模应用了Foveros Direct3D先进封装和EMIB 2.5D互联技术。
凭借Clearwater Forest,英特尔将其分解式架构和封装设计提升到了新的水平。该芯片是一个多层解决方案,包含多个小芯片和构建模块,是英特尔的一项重大工程成就。
一颗Clearwater Forest或至强6+处理器由12个采用2.5D封装的EMIB芯片块组成。这些芯片块将3个有源基础芯片块连接在一起,后者再连接到2个输入/输出芯片块和总共12个计算芯片块。输入/输出芯片块采用英特尔7制程节点,有源基础芯片块采用英特尔3制程节点,而计算小芯片则采用英特尔18A制程节点制造。
计算小芯片方面,这些黑山高效核小芯片采用具备RibbonFET技术的18A制程节点制造。英特尔声称,18A通过降低栅极电容,为核心逻辑提供了最佳的能效。18A还提供了更高的单元密度和超过90%的单元利用率,并通过背面供电轨改善了信号路由。此外,18A还能实现低损耗供电,将损耗降低4-5%。
深入探讨18A的RibbonFET技术,它能实现更好的电流控制和减少功耗泄漏,从而带来显著的性能优势。采用RibbonFET时,栅极环绕晶体管沟道,从而能精确控制沟道中的电流,实现更高的驱动电流和更低的泄漏。这也有助于降低工作电压。此外,RibbonFET的栅极长度比FinFET短5-10%,并且每个晶体管的功耗降低了20%。
RibbonFET的一些特性包括:进一步微型化芯片组件(对高密度处理器至关重要)、精确控制晶体管沟道中的电流、提升每瓦性能、最低工作电压和静电特性、通过带状宽度和多阈值电压类型进行调谐。
然后是PowerVia技术,它将标准单元利用率提高了10%,同功耗下性能提升了4%。PowerVia使得英特尔能够从硅晶圆下方供电,在某种程度上实现了背面供电。
PowerVia的一些亮点包括:减少拥塞并提升性能、重新布置粗间距金属、凸块移至芯片背面、用于高效配电的纳米级硅通孔、改进的信号路由、更高的单元密度(超过90%的单元利用率)。
Clearwater Forest还是首款大规模采用Foveros Direct3D技术的处理器,这是一种先进封装解决方案,将有源基础芯片块上的计算和输入/输出芯片块桥接在一起。Foveros Direct 3D具有9微米的凸点间距,并使用铜对铜键合。它充当具有高密度和低电阻的有源硅中介层,并提供约0.05皮焦/比特的性能。这意味着英特尔几乎不需要消耗任何功率即可在两个芯片之间来回传输数据。
接下来剖析Clearwater Forest的三个主要芯片块:计算芯片块、输入/输出芯片块和基础芯片块。
Clearwater Forest输入/输出芯片块采用英特尔7制程技术制造。该芯片块在两个封装中总共包含八个加速器,提供英特尔Quick Assist技术、英特尔动态负载均衡器、英特尔数据流加速器和英特尔内存分析加速器。两个输入/输出芯片块总共有16个加速器。
每个输入/输出芯片块还提供48个PCIe Gen 5.0通道(总计96个)、32个CXL 2.0通道(总计64个)和96个UPI 2.0通道(总计192个)。输入/输出芯片块与格兰特急流相比保持不变,但较谢拉森林有明显升级。
接下来是基础芯片块,该芯片块使用EMIB连接,与其上方的计算芯片块相连。共有三个采用英特尔3制程技术制造的基础芯片块。每个基础芯片块承载四个DDR5内存控制器,使得芯片上总共有12个内存通道。该芯片块还集成了共享的最后一级缓存,每个计算芯片块对应48MB,或每个基础芯片块为192MB。这提供了高达576MB的封装内最后一级缓存。
Clearwater Forest的计算芯片块可能是芯片上最有趣的部分,因为它们基于新的18A制程技术。每个计算芯片块由6个模块组成,每个模块包含4个黑山高效核。这意味着每个计算芯片块有24个黑山高效核,12个计算芯片块总共有288个高效核。
每个模块还包含4MB的二级缓存,这意味着每个芯片块有24MB二级缓存,12个计算芯片块总共有288MB二级缓存。这与谢拉森林高效核处理器相同,整个芯片的三级缓存和二级缓存总和达到864MB。
因此,总结如下:
12个计算芯片块(英特尔18A)
3个有源基础芯片块(英特尔3)
2个英特尔输入/输出芯片块(英特尔7)
12个EMIB芯片块(EMIB 2.5D)
现在深入探讨黑山高效核,该核心也用于黑豹湖客户端处理器。
该核心与我们在月光湖和箭湖处理器上看到的天湖架构大体相似,但相比克雷斯特山,这是一个重大升级。
从细节开始,天湖配备了更新的预测块(128字节)、更快的“查找下一条”指令,以及用于并行获取的96指令字节。黑山是一个9路微架构,还具有更宽的解码能力,包括9路(3x3)或比克雷斯特山高效核多50%的解码集群、一个实现每集群微码并行化的纳米码,以及一个微操作队列容量从64项增加到96项。还有一个更大的64KB指令缓存,以及更精确和增强的分支预测。
在前端(乱序执行引擎)方面,我们看到了8路分配和16路退休,这意味着资源可以更快地添加和清除。队列也获得了更多资源,乱序执行窗口现在增长到416项。
调度端口已增加到26个。标量引擎拥有8个整数算术逻辑单元、3个加载和4个存储地址生成单元端口、3个跳转端口、2个整数存储数据端口;向量引擎则拥有4个向量/浮点算术逻辑单元、2个向量/浮点存储数据端口、4个向量/浮点堆栈。
内存子系统全面增强,二级缓存为每四个核心集群4MB,带宽从每周期64字节翻倍至128字节,一级缓存到一级缓存的传输现在更快,并提供了更可预测的通信。
这是通过消除从互联结构传输数据的需求,转而直接通过一级缓存访问二级缓存来实现的。聚合时钟已从每时钟16字节升级到32字节。
总而言之,Clearwater Forest上的黑山高效核比144核的至强6780E(谢拉森林)处理器性能提升高达90%,在负载线上效率提升23%,并可实现高达8:1的服务器整合,同时拥有更低的总拥有成本。
英特尔还分享了Clearwater Forest(至强6+)处理器的一些性能指标。对比包括了144核的至强6700E(谢拉森林)芯片以及未发布的288核的至强6900E(谢拉森林)芯片。
与330W功耗的144核谢拉森林(至强6780E)相比,288核、热设计功耗450W的Clearwater Forest芯片热设计功耗降低了36.3%,核心数量翻倍,性能高出112.7%,每瓦性能高出54.7%。
与500W功耗的288核谢拉森林芯片相比,288核、热设计功耗450W的Clearwater Forest芯片在热设计功耗降低11%的同时,性能高出17%,每瓦性能高出30%。
性能提升得益于新的黑山高效核,其每时钟指令数提升了17%。凭借这些,与老旧的至强平台相比,Clearwater Forest带来了1.9倍的性能提升、23%的效率提升以及高达8:1的服务器整合。
现在来看平台细节,英特尔的Clearwater Forest(至强6+)处理器将支持LGA 7529插槽,提供单路和双路配置。这与至强6900P(大瀑布湖-AP)处理器使用的插槽相同。该插槽原本也计划用于288核版本的谢拉森林(至强6900E),但后者已被取消。这些芯片的热设计功耗额定在300-500W,与至强6700E和6900P处理器的运行范围相同。较低热设计功耗的规格也将配备一半的核心数量,例如144核,与至强6700E相同。
这些芯片将能够支持高达12通道的DDR5内存,速度高达8000 MT/s。此外,该平台将支持最多6个UPI 2.0链路(每通道高达24 GT/s)、最多96个PCIe Gen5.0通道(x16, x8, x4, x2)以及最多64个CXL 2.0通道。
安全功能将包括英特尔软件防护扩展和英特尔信任域扩展。在电源管理方面,这些芯片将搭载英特尔应用能耗遥测和英特尔涡轮速率限制器。最后,Clearwater Forest处理器将获得支持VNNI和INT8的高级矢量扩展2。
因此,总结英特尔Clearwater Forest(至强6+)与谢拉森林(至强6)的对比,我们将看到:
核心数量最多达2倍
每核心每时钟指令数提升17%
最后一级缓存超过5倍
增加4个内存通道
增加2个UPI链路
内存速度提升20%
英特尔的Clearwater Forest(至强6+)处理器预计将在2026年下半年发布,因此我们预计后续会有更多信息和性能指标公布。