首页
1
最新消息
2
未分类
3
20230201 AMD、Intel、NVIDIA这些竞争对手纷纷拥抱大小核4
https://www.fcg899.com/cn/ FCG福韬略国际谘询有限公司
FCG福韬略国际谘询有限公司 302新竹县竹北市复兴二路229号7F-1&7-6(双翼大楼)
FCG观点~tsmc与美国社会暨产业20250331 研究部引用『魏哲家前几天在台大EMBA讲座,以「如果没有台积电」为题演讲(1/16)。他妙语如珠,幽默的演讲内容,现场笑声不断,让参与者明白,为什么台积电最新的制程不可能搬到其他国家,以及全世界如果没有台积电,那么,民众不仅苹果手机不能换新,就连电冰箱、电视、汽车等产品,都会受到影响,如果没有台积电,全世界会有什么样的变化?台积电董事长暨总裁魏哲家指出,「没有台积电,世界经济会停滞不动,如果没有台积电.当然我的对手会很高兴,但是高兴不了多久,因为没有台积电,2026年以后,所有的自动驾驶、会全部不见。」自从台积电2021年正式赴美设厂之后,市场中不少人都在担忧,台积电会不会将最新技术带到美国,使得台湾不再具有优势。在回答市场的疑虑之前,魏哲家先谈到,「如果要重复做一个台积电出来,大概要多久时间?也不长,你用2.5年时间,就可以盖一个生产线。」不过,这个2.5年,是有前提的,「要有土地、水、电、人才都够,你没有技术,那另外讲。」2.5年只是盖一个产线的时间,但每一次新技术出来,台积电至少要盖三个厂。魏哲家以3奈米为例,「盖3奈米厂要符合所有客户需求,大概5年就可以了。如果你想把台积电三奈米整个搬到任何一个国家,假设你的土地没问题、水电没问题、人才没问题。那也就用5年的时间,就可以。」而美国厂盖到现在,进度并不符合台积电原先预期。魏哲家笑著说,「我们在亚利桑那州,我一把鼻涕、一把眼泪,受尽各种训练。」他说得幽默,全场哄堂大笑,但却点出四点外人都想像不到的难题。第一,我们以为说美国这么大,盖个房子有什么了不起,错,盖一个房子很了不起,我在亚利桑那州要盖一个生产线,第一,他们没有听过生产线是什么东西,我说,我隔壁不是有IDM(意指IDM大厂英特尔)吗?他说,那是十年前啊,现在人都跑光了,所以不会盖。魏哲家说,第一个难题,跟当地的基础建设有关,就是他们不会盖厂,最后有一半的建筑工人都是从德州找来的。第二,从来没有想过在一个地方,会碰到当地政府各种法律条规不一样。「台积电是一个很受政府照顾的公司,我们走在前面,盖各种生产线,政府也不知道如何是好,我们跟台湾政府一起商量法规怎么订。」但是,到美国之后,美国政府虽然也不知道怎么订法规,但是,美国政府跟台积电说,「请你先出钱,我们用你的钱来聘请专家,来制定规则。最后,每一次开会,就有市政府的官员、用我们的钱聘请的专家、还有台积电,然后,由台积电发言、共同制定规则,制定出来才继续往前,总共制定出来的规则也才一万八千多个,花了3500万美金。」魏哲家笑说,「我不是抱怨,我只是说我的经验。」接著,他又提到了美国本地的化学品问题,美国做不出来台积电需要的等级,如果要做出来,价格会是台积电原本购买价格的五倍,「我们最后怎么解决,我们从台湾运硫酸到L.A.港口,从港口用卡车载到亚利桑那州,就算这样子都比在美国做便宜。」但明明美国半导体大厂英特尔就设厂在台积电旁边,那么,英特尔怎么面对化学品材料问题?魏哲家说,「他们看这样划算啊,所以他们也从台湾开始买。你听到这个很难相信,问他们Intel,那你以前怎么过活,他们说,以前过得很辛苦,现在有你们。」第三个难题,则与工会有关,魏哲家表示,「当初成立工会是很崇高理想,是帮工人争取比较好的福利,但之后,工会就变得很奇怪。」显见台积电在当地也遇到了劳资难题。第四个难题,则与当地政府行政速度有关,「台积电进步这么快,是因为两年半就可以盖一个生产线出来,但这两年半,我们技术一直在进步,技术每改进一次,整个生产线设计就要改变,包含产线底下接的水、电、化学品线路都要改变,每次改变都是跟著厂商一起努力,马上就做了。但在美国不行,任何改变,停下来,先把图画好,申请、批准之后再继续做。」以这样的速度来看,魏哲家直言,「最新技术跑到美国去,你认为可能吗?单单每个事情都要申请,申请完再进来,至少要花掉台湾两倍时间。」很显然地,台积电最新技术只会根留台湾,很难移到其他国家去。』20250331研究部暨公关部 https://www.fcg899.com/cn/hot_512207.html 20250331 FCG观点~tsmc与美国社会暨产业 2025-03-25 2026-03-25
FCG福韬略国际谘询有限公司 302新竹县竹北市复兴二路229号7F-1&7-6(双翼大楼) https://www.fcg899.com/cn/hot_512207.html
FCG福韬略国际谘询有限公司 302新竹县竹北市复兴二路229号7F-1&7-6(双翼大楼) https://www.fcg899.com/cn/hot_512207.html
https://schema.org/EventMovedOnline https://schema.org/OfflineEventAttendanceMode
2025-03-25 http://schema.org/InStock TWD 0 https://www.fcg899.com/cn/hot_512207.html

AMDIntel这些竞争对手纷纷拥抱大小核,NVIDIA这次落后了吗?

20230122/本社公关部20230201引用

虽然摩尔定律已经逐渐走到尽头,但我们却来到了一个更加看点十足的时代,不同於以往每隔18个月靠技术换代带来的常规演变,以IntelNVIDIAAMD为首的晶片巨头之间的竞争变得异常激烈。从IntelNVIDIAAMD三家的产品布局来看,三家几乎都集齐了CPUGPU甚至是DPU产品线。如今,他们正在酝酿更大的规划!

随著近日AMD推出CPUGPU组合的下一代资料中心APU——Instinct MI300,自此,三家的「多PU组合」争斗战已经开打。

在此之前:
1)IntelFalcon Shores XPU混合搭配CPU + GPU
2)NVIDIAGrace Hopper SuperchipGrace CPU + H100 GPU的组合,都是如出一辙。
3)AMDCES 2023上披露了其下一代资料中心处理器Instinct MI300.

他们都在做一件伟大的事情:在一个晶片中内建CPUGPUAI加速器,最终成为一个类似APU的产品,目标是更广阔的超级运算市场。

但是在实现方式上,NVIDIA落后了?

IntelXPU计画之一:Falcon Shores

首先来说下IntelXPU计画?XPU是指使用多种运算架构以最好地满足单个工作负载的执行需求的想法,这是Intel过去几年来最感兴趣的一个方向。

Intel希望将X86Xe结合起来用於超级运算/HPC市场。这也导致了Intel开始研发从CPUGPU个一些ASIC产品(如IPUVPUFPGA)等等各种产品。

Intel2022年年度投资者会议上,Intel披露了一个代号为Falcon Shores的处理器新架构,它将x86 CPUXe GPU硬体组合到单个Xeon插槽晶片中,利用下一代封装、记忆体和 I/O 技术,为运算大型资料集和训练巨大 AI 模型的系统提供巨大的性能和效率改进。

不过Intel的目标似乎不仅仅是将CPUGPU内建在一起,Intel正在寻求为拥有绝对巨量资料集HPC使用者开辟市场——这种资料集无法轻松适应独立GPU相对有限的记忆体容量。

Falcon Shores的目标是在2024年推出,采用埃米级制程,这意味著它可能会使用Intel 20AIntel 18A制造工艺制造。

Intel预计Falcon Shores在多个指标上比当前一代产品增长5倍,包括每瓦性能提高5倍,单个 (Xeon) 插槽的运算密度提高5倍,记忆体容量增加5倍,记忆体频宽增加5倍。

Intel表示,Falcon Shores的混合设计是透过使用tile(也称为小晶片)实现的,透过提供x86Xe核心之间的灵活比例,这将使晶片制造商在设计过程的后期组态晶片方面具有更大的灵活性。

AMD发布Instinct MI300 APU

近日,AMDCES 2023上披露了其下一代资料中心处理器Instinct MI300,被AMD称之为下一代资料中心APU。它采用了13Chiplet,共有1460亿个电晶体,MI300可以说是AMD迄今为止最大的晶片。

该晶片的运算部分由九个5nm小晶片组成,它们包含CPUGPU核心,但AMD没有详细说明每个小晶片的使用数量。

这九个裸片被3D堆叠在四个6nm基础裸片之上,而且这些裸片是有源的中介层,可以处理 I/O和各种其他功能。从下图中可以清晰的看到,Instinct MI300中心晶片侧面的八个HBM3堆叠。

MI300的关键优势除了将CPU核心和GPU核心放在同一设计中的操作简单性之外,还在於它可以让两种处理器类型共享一个高速、低延迟的统一记忆体空间。

这将使在CPUGPU两个核之间快速且轻松的传递资料,能让每个核处理他们最擅长的运算方面。此外,它还可以透过让两种处理器类型直接存取同一记忆体池,简化插槽等级的HPC程式。

但是MI300晶片并不是批次产品,因为其价格昂贵且相对稀缺,所以它们不会像EPYC Genoa资料中心CPU那样得到广泛部署。AMD预计将在2023年下半年交付Instinct MI300

但是,这一Chiplet的设计技术将会衍生出更多的变体。

NVIDIA Grace Hopper Superchip

不同於IntelNVIDIA采用Chiplet架构的做法,NVIDIA首款GPU+CPU组合——Grace Hopper Superchip还是单晶片的方式,下图是算绘图。

Nvidia对其Grace Superchip的算绘图:两个带有RAM的处理器合二为一

NVIDIA?Grace Hopper架构将NVIDIA Hopper GPUNVIDIA Grace? CPU结合在一起,在单个超级晶片中连接高频宽和记忆体一致的NVIDIA NVLink Chip-2-Chip(C2C)?互连,并支援新的NVIDIA NVLink开关系统。

NVLink C2CNVIDIA为超级晶片开发的记忆体相干、高频宽和低延迟互连。它是Grace Hopper超级晶片的核心,提供高达900 GB/s的总频宽。这比加速系统中常用的x16 PCIe Gen5通道的频宽高7倍。

结合NVIDIA NVLink切换系统,所有运行在最多256NVLink连接的GPU上的GPU执行绪现在都可以以高频宽存取高达150TB的记忆体。

NVIDIA表示,该超级晶片将为运行TB级资料的应用程式提供高达10倍的性能提升,NVIDIA已承诺在2023年上半年推出其超级晶片。

可以看出,IntelNVIDIAAMD都开始在CPU+GPU组合上发力,他们改采用的方式:要么晶片继续平铺做大,要么拼3D堆叠、Chiplet、拼架构。

目前从各家的CPU+GPU组合型产品推出的时间上来看,AMDNVIDIA都在2023年,而Intel将在2024年。软体支援方面,InteloneAPINVIDIACUDAAMD似乎还稍逊一些。

而在架构方面,IntelAMD均已奔向3D Chiplet,但NVIDIA似乎仍在单晶片上努力。

NVIDIA何时拥抱Chiplet

Chiplet用於CPU已经不是新闻了,AMD多年来一直在其RyzenEpicCPU处理器中使用Chiplet设计并取得了巨大成功。

Intel也於2023111日正式发布了基於Chiplet设计的第四代至强CPU-Sapphire Rapids,它透过内建加速器将目标工作负载的平均每瓦性能提升了2.9倍,在最佳化电源模式下每个CPU节能可高达70瓦,将总体成本降低52%-66%

但是就目前的情况来看,GPU也已迈入了Chiplet时代。

如今IntelAMD已经均已发布了3D Chiplet CPUGPU中的产品。

NVIDIA无论是GPU还是CPU似乎还在单晶片上努力,NVIDIA要落后了吗?

2023111日,Intel发布了其首款Chiplet小晶片封装的GPU,代号Ponte VecchioGPU Max系列单个产品整合47个小晶片,内建超过1000亿个电晶体。

这是Intel性能最高、密度最高的通用独立GPUIntel的这一晶片的具体性能对比情况暂未可知,但是我们暂且可以看看AMDNVIDIAGPU性能对比。

AMD最新一代的GPU Navi 31,是AMD第一款、也可以说是历史上第一个基於Chiplet设计的GPUAMD的两款最新显示卡Radeon RX 7900 XTXRadeon RX 7900 XT均是基於Navi 31

其中,XTX是旗舰机型,拥有更多的shader处理器,更高的记忆体频宽,更多的视讯记忆体,而XT则是有些弱化的版本。

如果我们将AMD的显示卡和NVIDIARTX 4080作对比,AMDGPU的性能非常接近NVIDIARTX 4080

chipsandcheese的评测对比资料,如下图所示,NVIDIA4080采用4nm制程,电晶体密度比AMD的低一些,面积也更大一些,但NVIDIA4080具有更高的SM数量,这意味著暂存器档案和FMA单元相比AMD要有更多的逻辑控制。

NVIDIA还具有更简单的快取层次结构的优势,它仍然提供相当大的快取容量。

AMD 7900/6900NVIDIA4080的比较(图源:chipsandcheese

NVIDIAGPU目前做法还是将所有的电晶体,都放在一个更大的单晶片上,采用尖端制程4奈米节点。

AMDNavi 31基於Chiplet设计和先进的RDNA3架构。其裸片由GCD核(图形运算晶片)和 MCD记忆体小晶片(记忆体快取晶片)组成。

从下图可以清晰的看到,中间部分是5nm制程的GCD核,周围分别是66nm制程的MCD,包含记忆体控制器和Infinity快取。

 AMD Navi 31裸片(图源:AMD

两种不同工艺的晶片组装在一起,所使用的尺寸更小,与此同时,Chiplet的设计方式使得晶圆的缺陷晶片数量也少的多,从这个意义上来说,Chiplet架构的使用降低了成本。

Chiplet的设计还助於透过在图形晶片上使用更少的区域来实现VRAM连接,进而做到更高频宽的 VRAM 设定。但是也不是万利的,代价就是AMD必须支付更昂贵的封装解决方案,因为简单的封装走线在处理GPU的高频宽要求方面表现不佳。

此外,AMD Navi 31 GPU很重要的一项创新是Infinity Link汇流排,为何要说到这个呢?

因为Chiplet的设计方式绝对定会产生更多的延迟,而GPU是对延迟极其敏感的,所以AMD特意为此开发了全新的Infinity Link汇流排(即 Infinity Fanout Links 系统)来连接GDCMCD部件,进而在GCDMCD小晶片部件之间实现5.3 TB/s的频宽,这种超级先进的互连系统无疑是小晶片GPU设计的关键决定因素。

可以说,AMDNavi 31为图形处理器世界带来了真正革命性的小晶片GPU设计,如果这一设计取得成功,那么未来GPU就可以不用依赖先进工艺来提升性能,而是透过堆叠更多的GCD来实现。GPU市场迎来新的战争。

3D IC设计逐渐成为了主流,Chiples也进一步崛起,在晶片大厂的推动下,基於Chiplet3D IC设计进一步展示了其说服力。Chiplet将彻底改变这个行业。

NVIDIA何时采用Chiplet,备受业界关注,不过应该也快了,毕竟黄仁勋已指出,"Moore's Law is dead"
(20230201本社公关部)