有史以来最复杂的芯片?
从历史上看,英特尔将其所有累积的芯片知识用于推进摩尔定律,并将这些知识应用于其未来的 CPU。今天,其中一些先进的处理器注定要用于阿贡国家实验室即将推出的“Aurora”超级计算机。但是,要求苛刻的仿真和建模工作负载也从 GPU 加速中受益匪浅。认识到这种不断增长的需求,英特尔着手设计和构建迄今为止最复杂的 GPU,并在非常紧迫的时间内完成。
这一努力的结果,英特尔Max系列GPU,以前以代号“Ponte Vecchio”而闻名,将100亿个晶体管和47个瓷砖封装到五个工艺节点上。除此之外,它们还包括两项封装创新,EMIB 2.5D和Foveros 3D技术,以及堆叠瓷砖以提高处理器密度。英特尔 Max 系列 GPU 产品经理 Duke Tallam 表示:“英特尔 Max 系列 GPU 的开发周期非常紧凑,因此将其变为现实就像挑战我们的团队一年建造房屋,然后第二年建造摩天大楼。“迄今为止,GPU是我们最复杂的处理器,代表了英特尔芯片产品的巨大飞跃。然而,整个包装可以放在一个人的手掌中。
(资料图片)
许多创新将MAX系列GPU推向市场
Max 系列 GPU 的巨大复杂性需要全球英特尔团队成员的支持。在俄勒冈州和亚利桑那州的工厂完成技术开发过程后,硅运往英特尔在槟城的制造工厂进行大批量生产。
然而,要达到这个阶段,需要创造性的解决方案,因为英特尔需要对其制造工艺进行一些修改。首先,英特尔将芯片晶圆互连的间距缩小到36μm,大约相当于人类头发的宽度。这是英特尔晶圆厂或工厂有史以来成功使用过的最细粒度的间距。英特尔工厂还开发了一种在工厂生产线上测试芯片的新方法,称为单体堆叠芯片测试 (SSDT)。SSDT 确保在添加其他昂贵的组件(如基板和高带宽内存 (HBM) 芯片)之前,在制造过程中只有正常运行的芯片才能向前移动。该公司还找到了一种将芯片焊接到封装上的新方法,将工艺能力提高了 50%。最后,该小组开发了一种先进的晶圆级组装工艺,将可靠性提高了十倍。
除了 GPU 的技术复杂性之外,验证过程还涉及在最少数量的样本 GPU 上完成硅前测试的挑战。因此,该团队不再依赖物理样本进行测试,而是转向虚拟模拟,演示虚拟模具在现实场景中的表现。在其他地方,工程师采用了其他创造性的方法来加速测试过程,例如在参与项目的许多团队成员之间运行并行工作流的方法。
当被问及在两年内将GPU推向市场所需的巨大努力时,英特尔的Tallam提出了他的观点。“我们拥有半个多世纪的处理器制造经验,但设计GPU的复杂性和性能要求需要我们过去的所有知识和技能。Tallam继续说道:“Max系列GPU有助于弥合当今已经令人难以置信的HPC系统与世界上少数能够或将要实现百万兆次级性能的系统之间的差距。因此,我们以意大利佛罗伦萨著名的桥梁命名GPU似乎是正确的。Max 系列 GPU 桥既美观又功能强大。我们的团队对GPU也有同样的感觉,规模要小得多。
这些数据中心 GPU 与新推出的英特尔至强 CPU Max 系列处理器相结合,将加速工作负载,在比以前更短的时间内揭示有价值的结果。阿贡国家实验室是首批采用Max系列的产品之一。其团队计划部署 60,000 个 Max 系列 GPU,平均分配给 10,000 个刀片服务器。每个刀片还将依靠两个Intel Xeon CPU Max系列处理器(这些是带有HBM内存的“Sapphire Rapids”Xeons SP),以最大限度地提高Aurora的架构,以应对一些最重要的科学工作负载。一旦ANL在其旗舰Aurora系统上部署了Max系列GPU和CPU的完整补充,它将超过两个exaFLOPS的双精度计算性能。
研究人员已经计划将所有计算能力用于一些最具挑战性的科学问题,例如对宇宙进行建模,推进基于聚变的安全能源解决方案,帮助实现医学突破或更精确地预测飓风。
这些 GPU 代表了英特尔雄心勃勃的多年 IDM 2.0 战略的核心组件,旨在实现产品领导地位、创新和长期客户价值。
将一切整合在一起
去年 11 月,马来西亚槟城组装和测试 (PGAT) 员工庆祝首批 60,000 个 GPU 的制造。马来西亚拥有英特尔最大的组装和测试制造工厂,包括四家工厂。
槟城装配与测试(PGAT)工厂经理黄美芳在她28年的英特尔职业生涯中遇到了许多挑战。尽管如此,与 GPU 的复杂性和 1,500 名团队成员的协调相比,它们都相形见绌。PGAT需要在通常与这种规模项目相关的一半的时间内满足生产需求。为了使这一切成为可能,其他团队和工厂也支持这项工作。
“该产品的众多复杂性是无与伦比的。我们面临的严峻挑战因我们压缩的时间表而变得更加困难,“Mei Fong说。“尽管存在这些障碍,但在合作伙伴组织的宝贵帮助下,我们实现了最初似乎不可能实现的目标。
宝贵的经验
从开发和制造GPU Max系列中获得的综合经验为未来的生产流程带来了新的见解,这将加速即将推出的处理器的交付。Tallum指出:“我们对最新的处理器版本感到兴奋,我们很自豪有机会尽自己的一份力量来实现突破性科学。
关键词: