夜访吸血鬼第二季定档网飞,首播日期公布
阅读全文

锤刻创思寰宇网
英特尔近期公布了其下一代至强(Xeon)处理器“清水森林”(Clearwater Forest)的详细信息。该处理器采用纯能效核(E-Core)设计,基于Intel 18A制程工艺打造,最高可配备288个核心。
作为英特尔首款采用18A工艺的至强处理器,“清水森林”采用12个计算小芯片(Compute Chiplets)的全新架构,实现了全面升级。与将至强6系列划分为性能核(P-Core)和能效核(E-Core)版本的策略类似(如“花岗岩急流”和“塞拉森林”),下一代至强家族将包括纯性能核的“钻石急流”和纯能效核的“清水森林”。性能核系列针对性能进行优化,适用于计算密集型及人工智能工作负载;而纯能效核系列则专注于能效,面向高密度和横向扩展工作负载场景。
在Hot Chips 2025技术大会上,英特尔透露“清水森林”至强处理器将采用公司最新的18A制程节点,该工艺也将用于今年晚些时候推出的客户端处理器“黑豹湖”。新款至强能效核处理器的主要亮点包括:
英特尔最新18A制程:提升性能与能效
英特尔最新能效核架构:针对18A工艺优化的IPC(每时钟周期指令数)提升
Foveros Direct 3D封装技术:更短能效路径、更大最后一级缓存(LLC)
增加内存带宽:支持12通道DDR5-8000
在制程技术方面,“清水森林”采用前述的18A节点,结合背面供电和全环绕栅极技术,带来多项超越晶体管微缩的优势。18A工艺降低了栅极电容,从而提升核心逻辑能效;单元密度提高,利用率超过90%;信号布线优化,减少RC延迟并进一步提高能效;此外还实现了低损耗供电,损耗降低4-5%。
架构上,英特尔为“清水森林”采用了“黑山”(Darkmont)能效核设计,这是对“塞拉森林”所用“塞拉格伦”能效核的升级。新核心具备:
更智能的前端
更深的乱序引擎
更大的标量与矢量执行单元
增强的内存子系统
前端配备64kB指令缓存、三个3路指令解码器,每周期可解码9条指令,指令带宽提升50%,并采用更精确的分支预测器,可能利用深度分支历史和更大结构规模。
乱序引擎(OOE)也得到升级:分配宽度增至8路(提升60%),退役宽度达16路(提升2倍)以支持执行并行性。乱序窗口入口大小增加60%,达416个单元;执行端口增至26个,比上代提升50%。
执行引擎通过26个执行端口应对多种工作负载,专用硬件提升了效率。整数和矢量执行单元数量翻倍,加载地址生成能力提升1.5倍,存储地址生成能力翻倍。
核心内存子系统的三负载能力提升50%,双负载保持不变。更早发出加载指令有助于降低延迟。深度缓冲支持最多128个未完成L2缓存未命中(提升2倍)。“清水森林”还配备高级预取器,其至强能效核专属特性包括:
L1数据缓存ECC
数据中毒支持
可恢复机器检查
本地机器检查
52位物理地址
核心锁步
英特尔还为“清水森林”至强处理器采用了新的模块化架构。每四个核心组成一个集群,共享4MB统一L2缓存,延迟为17周期,总L2缓存最高可达288MB。L2缓存带宽大幅提高,最高提升2倍,达400GB/s。此外,基础芯片还包含更大的最后一级缓存(LLC),容量最高576MB。
根据SpecIntRate'17基准测试,IPC提升达17%。每个核心与L2缓存共享200GB/s带宽,集群间通过35GB/s的互联结构连接。
“清水森林”全面采用3D封装,共包含12个CPU小芯片,均基于18A工艺制造。这些小芯片安装在三个独立的基础芯片上,后者包含互联结构、LLC、内存控制器和I/O,采用Intel 3制程。中介层集成了两个基于Intel 7工艺的I/O小芯片,提供高速I/O、互联和加速器功能。通信由英特尔的EMIB互联解决方案处理。
总计包括:
12个能效核CPU小芯片(Intel 18A)
3个基础芯片封装(Intel 3)
2个I/O小芯片(Intel 7)
“清水森林”还采用单片网状一致性互联结构,使用更短路径、更多金属资源和高密度互连,以提升能效。
最后,英特尔分享了双路“清水森林”能效核至强解决方案的部分性能表现。处理器支持12通道DDR5-8000内存,双路服务器最高容量达3TB,内存带宽最高1300GB/s。作为对比,英特尔“塞拉森林”支持最高12通道DDR5-6400内存。平台支持2×96条PCIe Gen5和64条CXL通道,144条UPI(576GB/s)。在576核心+1152MB LLC的配置下,可提供最高59TF/s的计算性能,原始带宽达5000GB/s。
英特尔“清水森林”至强家族预计在未来几个季度推出。