服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

第二代3D V-Cache Chiplet速度高达2.5TB/s

日期: 来源:半导体产业纵横收集编辑:

本文由半导体产业纵横(ID:ICVIEWS)编译自tomshardware
AMD在Chiplet发展道路上越走越有感觉,不断突破指标极限。

AMD的Ryzen 9 7950X3D是地球上最快的游戏CPU,因为AMD决定将其颠覆性的3D芯片堆叠技术引入Zen 4,但奇怪的是,该公司没有在其Ryzen 3X7000D简报中分享有关其新的第二代3D V-Cache的任何细节。我们最初在最近的一次技术会议上发现了一些细节,现在AMD终于回答了我们的一些后续问题并分享了重要的新细节,包括Chiplet(小芯片)仍然采用7nm工艺,现在峰值带宽高达2.5 TB / s,而第一代3D V-Cache的峰值为2 TB / s。我们还有AMD用于其Ryzen 6处理器的新型7000nm I / O芯片的新图片和图表。

AMD已经转向其3D V-Cache的第二代,英特尔没有竞争技术。这确保了AMD在游戏和某些数据中心应用程序的最佳CPU中获胜。总体而言,AMD的第二代3D V-Cache技术是第一代令人印象深刻的一步,因为它允许该公司利用现已成熟且更便宜的7nm工艺节点来提高其尖端5nm计算芯片的性能。新设计代表了AMD将基于小芯片的设计方法的关键优势(使用较旧且更便宜的工艺节点与昂贵的新工艺技术相结合)带入第三维度。现在来看看细节。

首先,快速的高级复习。正如您在上面看到的,AMD 的 3D V-Cache 技术将一个额外的 L3 SRAM 小芯片直接堆叠在计算芯片 (CCD) 小芯片的中心,以将其与发热内核隔离开来。该缓存将配备 96D V-Cache 的小芯片的容量提高到 3MB,从而提高了延迟敏感型应用的性能。我们在这里详细介绍了这项技术的第一代产品。

我们直接从 AMD 和 2023 年国际固态电路会议 (ISSCC) 收到了有关第二代实施的新信息,AMD 在会上介绍了 Zen 4 架构。

AMD的上一代3D V-Cache使用7nm L3 SRAM小芯片堆叠在7nm Zen 3 CCD上。AMD坚持使用新的L7 SRAM小芯片(称为“L3D”)的3nm工艺,但现在将其堆叠在较小的5nm Zen 4 CCD之上(见下表)。但是,这会造成尺寸不匹配,需要进行一些更改。

AMD使7nm SRAM芯片更小,因此与上一代的36mm2相比,它现在的尺寸为41mm2。然而,晶体管的总数保持不变,因此新芯片的密度明显高于第一代小芯片。

正如我们在第一代SRAM小芯片上看到的那样,7nm L7 SRAM小芯片具有令人难以置信的晶体管密度 - 我们看到的密度几乎是第一代3nm计算小芯片的3倍,令人惊讶的是,7nm SRAM小芯片的密度明显高于7nm计算小芯片。这是因为,和以前一样,小芯片使用专门用于SRAM的5nm密度优化版本。它还缺少缓存中的典型控制电路 - 电路驻留在基底芯片上,这也有助于减少延迟开销。相比之下,7nm芯片包括几种类型的晶体管以及简化的L5 SRAM小芯片中不存在的数据路径和其他类型的结构。

和以前一样,来自额外 L3 SRAM 缓存的额外延迟为 3 个时钟,但 L4 小芯片和基本芯片之间的带宽已增加到 3.2 TB/s,比之前的 5 TB/s 峰值提高了 25%。

堆叠的L2 SRAM小芯片通过两种类型的硅通孔(TSV)连接到基底芯片。功率 TSV 在小芯片之间传输电力,而信号 TSV 在单元之间传输数据。

在第一代设计中,两种类型的TSV都位于基础小芯片的L3区域。然而,由于3nm工艺的密度增加,基础芯片上的L3缓存现在更小,即使5nm L7 SRAM小芯片更小,它现在与L3缓存重叠(上一代仅与基础芯片上的L2重叠)。因此,AMD不得不改变基底芯片和L3 SRAM小芯片中的TSV连接。 

由于基础芯片上的3nm L2缓存尺寸较小(由于密度增加和其他因素),AMD不得不将功率TSV从L5扩展到L3区域。对于基本芯片,与旧的基本芯片相比,AMD 在 L68 缓存、数据路径和控制逻辑上实现了 3.7 倍的有效面积扩展,因此 L3 缓存中 TSV 的物理空间更小。

信号 TSV 保留在基底芯片的 L3 缓存区域内,但 AMD 通过应用第一代设计的经验以及 DTCO 改进来减少新接口设计中的开销电路,将 L3 缓存中的 TSV 区域缩小了 50%。

AMD的3D芯片堆叠技术基于台积电的SoIC技术。台积电的SoIC是无凸点的,这意味着它不使用微凸块或焊料来连接两个芯片。您可以在此处阅读有关混合粘合和制造工艺的更多信息。AMD告诉我们,它使用相同的基本粘合工艺,并进行了持续的工艺和DTCO改进,但最低TSV间距没有改变。

L3 SRAM 小芯片也与 CPU 内核位于同一电源域中,因此无法独立调整。这有助于在配备缓存的小芯片上降低频率,因为电压不能超过1.15V。您可以在此处查看我们对两种不同类型的小芯片的深入测试。

AMD 的 ISSCC 演示还包括有关锐龙 6 和 EPYC Genoa 处理器中使用的 7000nm I/O Die(IOD) 的大量新细节。

我们将规格放在表中以便于比较,正如您所看到的,与Ryzen 7000变体相比,EPYC Genoa I / O Die非常庞大 - 这是因为AMD可以将多达12个计算小芯片(CCD)连接到其EPYC Genea处理器的I / O芯片。

相比之下,消费类芯片仅限于两个小芯片,这是一个不可变的限制,因为正如您在 Locuza 的图表中看到的那样,锐龙 7000 I/O 芯片只有两个全局内存互连 2 (GMI2) 链路,将计算小芯片连接到 IOD。这是一个遗憾 - 具有四个CCD的较低内核数的热那亚型号可以具有双GMI3链路(宽模式),这是一项新功能,可以在一些内存吞吐量密集型任务中提供优势。添加到消费芯片中会很有趣。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。


相关阅读

  • 如何回流重建IC供应链?

  • 本文由半导体产业纵横(ID:ICVIEWS)编译自semiengineering为什么先进的封装和制造对经济安全如此重要?MITRE Engenuity 的 CTO Raj Jammy着眼于高级封装、新节点和已建立节点、
  • 怎样查找芯片设计中的偶发错误?

  • 本文由半导体产业纵横(ID:ICVIEWS)编译自semianalysis异构设计、定制和日益增加的复杂性带来了很多硬件错误。将芯片分解为专门的处理器、存储器和架构对于持续改进性能和功率
  • 【国盛计算机】国产AI算力生态一览

  • 核心观点ChatGPT大模型计算量高速扩张,算力需求陡增。1)以ChatGPT为代表的大模型参数量、数据量高度扩张,GPT-3模型参数量高达1750亿,大模型训练需要强大算力支撑。2)当前Google
  • AI芯片专家会议纪要

  • 公众号改了规则,推送不按时间顺序,若不想错过文章,请设置“星标”,顺手点下“再看”,下次更新优先推送消息;欢迎点赞、在看;内容来源于网络,若不便发表,请联系后台删除;文章仅用于研究
  • AMD第二代3D V-Cache的技术细节,首次曝光

  • 来源:内容由半导体行业观察(ID:icbank)编译自Tomshardware,谢谢。AMD 的Ryzen 9 7950X3D是地球上最快的游戏 CPU,因为 AMD 决定将其颠覆性的 3D 芯片堆叠技术引入 Zen 4,但奇怪的是
  • 【面经】互联网寒冬,三年经验,前端面试~

  • 模拟面试、简历指导可私信找我,最低的价格收获最高的指导~已帮助50+名同学完成改造!前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 这是一幅专属中国人的画卷

  • 一幅《千里江山图》千古称颂。斗转星移,画中美景如何穿越古今,再现蓬勃生机?今天,我们邀您与公益检察官一同入画,共览神州大地千里江山↓↓(指导单
  • 如何回流重建IC供应链?

  • 本文由半导体产业纵横(ID:ICVIEWS)编译自semiengineering为什么先进的封装和制造对经济安全如此重要?MITRE Engenuity 的 CTO Raj Jammy着眼于高级封装、新节点和已建立节点、
  • 第二代3D V-Cache Chiplet速度高达2.5TB/s

  • 本文由半导体产业纵横(ID:ICVIEWS)编译自tomshardwareAMD在Chiplet发展道路上越走越有感觉,不断突破指标极限。AMD的Ryzen 9 7950X3D是地球上最快的游戏CPU,因为AMD决定将其颠覆
  • ​台积电今年新进“菜鸟”工程师年薪高达200万

  • 本文由半导体产业纵横(ID:ICVIEWS)综合冬去春来,一年一度的半导体人才争夺战又开始了。中国台湾2023年校园征才活动于3月4日正式启动,晶圆代工龙头台积电的求才计划最受瞩目。为
  • 怎样查找芯片设计中的偶发错误?

  • 本文由半导体产业纵横(ID:ICVIEWS)编译自semianalysis异构设计、定制和日益增加的复杂性带来了很多硬件错误。将芯片分解为专门的处理器、存储器和架构对于持续改进性能和功率