更新时间:2024-11-03 12:06:51
在HotChips34期间,英特尔再次详细介绍了其在SapphireRapidsHBM服务器平台上运行的PonteVecchioGPU。在英特尔院士兼首席GPU计算架构师HongJiang的演讲中,我们从蓝队获得了有关即将到来的服务器强国的更多详细信息。PonteVecchioGPU具有三种配置,从单一OAM到配备XeLinks的x4子系统,可以单独运行,也可以使用双插槽SapphireRapids平台。
OAM支持4GPU和8GPU平台的all-to-all拓扑。补充整个平台的是英特尔的oneAPI软件堆栈,它是一个零级API,提供低级硬件接口以支持跨架构编程。oneAPI的一些主要功能包括:
oneAPI和其他工具与加速器设备的接口
精细的增益控制和低延迟加速器功能
多线程设计
对于GPU,作为驱动程序的一部分提供
因此,在性能指标方面,2-StackPonteVecchioGPU配置(如单一OAM上的配置)能够提供高达52TFLOP的FP64/FP32计算、419TFLOP的TF32(XMXFloat32)、839TFLOPBF16/FP16和1678TFLOPs的INT8马力。
英特尔还详细说明了其最大缓存大小和每个缓存提供的峰值带宽。PonteVecchioGPU上的寄存器文件大小为64MB,提供419TB/s的带宽,L1缓存也为64MB,提供105TB/s(4:1),L2缓存为408MB并提供13TB/s带宽(8:1),而HBM内存池高达128GB并提供4.2TB/s带宽(4:1)。PonteVecchio中有一系列计算效率技术,例如:
英特尔解释说,更大的二级缓存可以为2D-FFT案例和DNN案例等工作负载带来巨大的收益。显示了完整PonteVecchioGPU与配置为80MB和32MB的模块之间的一些性能比较。
英特尔代表取笑用于未来AI和HPC应用的新PonteVecchio计算GPU
微软呼吁IT管理员采取额外措施来防范Exchange漏洞
Rogue Team在2021年英雄联盟世界锦标赛
随着大范围高温热浪逐渐席卷全国多地电力运行保障迎峰度夏成为重中之重
LG新能源将为印度车企马恒达的首款电动SUV供应电池
MSI MEG Ai1300P 和 MPG A1000G PCIe5 ATX 3.0 电源印象
MSI推出全球首款HMI游戏显示器
通过百思买交易节省150美元购买钛合金三星GalaxyWatch3
荣耀UI4.0更新路线图将公布
紧凑型华硕Zenfone9将于7月28日正式揭示其巨大可能性