北京时间2021年10月19日凌晨,苹果发布了M1 Pro和 M1 Max处理器,其超强的性能足以“震撼”整个PC界。“虽然”其CPU性能比M1提升仅70%,GPU的速度提升最高达到4倍,NPU的速度提升3倍。但这些都不足以说明M1 Pro/Max的“震撼”,因为其目前的性能都是苹果自己所说而不是实测,而且,苹果每发布新一代处理器,官宣其性能都是动辄比上代提升40%以上。那真正让PC界震撼的是什么呢?苹果的每一代新处理器性能强劲的秘密是什么?
我们来看看M1 Pro和M1 Max的系统架构图:
在架构图上看到的最大的数字是33.7 billion和57 billion!
没错,真正让PC界“震撼”的其实是晶体管数量:M1 Pro的晶体管数量达到337亿,M1 Max更是达到恐怖的570亿。
谁是晶体管数量最多的芯片?
Graphcore 第2代 IPU GC200:594亿
在此之前,晶体管数量最多的处理器是英国AI公司Graphcore于2020年7月发布的第2代IPU GC200,采用7nm工艺制程,晶体管数量达到594亿,是10月19日前,无论是手机、PC界还是服务器界,迄今为止晶体管数量最多的单处理器。这是目前AI处理能力最强的处理器之一。其价格是三万美元起。
2019年,Graphcore公司CEO Nigel Toon参加了第二届“全球CEO峰会”(2021年11月3日举办第四届)。他曾表示:“将来他们可能会在英国构建第一个能够和苹果或者阿里巴巴媲美的大规模企业。”
Graphcore公开了基于GC200处理器的IPU-M2000的应用性能。Benchmark显示,相比NVIDIA的A100,在IPU-M2000上,ResNet的吞吐量提升了4倍,ResNeXt的吞吐量提升了5.4倍,EfficientNet的吞吐量达到了18倍,Deep Voice 3达到了13倍。
2021年10月22日,Graphcore发布了迄今为止最大型的最新产品IPU-POD128和IPU-POD256,分别能够提供32 petaFLOPS和64 petaFLOPS的AI计算。
关于GC200的性能详见:https://www.eet-china.com/news/10521.html
阿里巴巴平头哥“倚天710”:600亿
当然,阿里巴巴平头哥在10月19日举行的2021云栖大会上,发布了基于Arm架构的自研云芯片“倚天710”,采用5nm工艺,单芯片可容纳高达600亿颗晶体管。这应该是目前晶体管数量最多的单处理器了。其处理能力也非常强劲,当然,“这款芯片不出售,主要是阿里云自用。” 阿里云智能总裁、达摩院院长张建锋表示。其造价估计远超Graphcore的第2代IPU GC200。
晶体管数量=处理器性能?
根据摩尔定律:集成电路上可容纳的晶体管数量,约每隔两年便会增加一倍,同时处理器的性能也会成倍增长。
尽管最近几年,IC芯片界,特别是Inel CPU的挤牙膏式升级,让大家认为摩尔定律似乎也停滞了。不过,总体来说,目前为止摩尔定律一直都是有效的。
在处理器内部,晶体管数量正比于逻辑门数量,也正比于电路复杂度。如果新一代处理器单位面积晶体管数量翻番,那么这一代处理器的核心数量就可以加倍,性能也会相应提高,其制造成本也会降低。
在目前通用的串行处理器架构下,业界基本认为处理器性能与晶体管数量成正比。
但是,也并不完全认同。
CPU性能并非仅与晶体管数量有关,还与主频、制程、架构、流水线长度等有关系。
一个最经典的例子就是intel 奔腾4 , P4时代的时候英特尔一味追求主频,导致流水线过长并且功耗巨大。被当时的K8按在地上摩擦。
在同一时代,同一制程下,也晶体管数量也并非越多越好。拿AMD的Ryzen 7 1800X和Intel 的i7 6900K,两个性能不相上下的CPU来进行对比:1800X和6900K的性能不相上下,而且二者都是14nm制程。
Ryzen 7 全系都是192mm2,48亿晶体管。而i7-6900K为246mm2,34亿晶体管。这是因为AMD在FinFET技术上还是比较落后,这也证明晶体管数量不能决定一切。
从上面的对比来看,处理器性能的确与晶体管数量有关,但似乎单位面积的晶体管数量并不是影响CPU性能关键。晶体管数量也并非越多越好。处理器性能与晶体管数量、频率、高速总线,以及现在的GPU和NPU都有关系。
苹果M1 Pro/M1 Max 及A系列处理器性能分析
笔者Challey统计了苹果自开始公布晶体管数量以来的主要处理器的性能及参数,见下图:
苹果系列处理器性能分析-Full
性能参数详图
苹果处理器各信息详图
其中,M1 Pro/Max 提升的对比对象均为M1。
当然,在A系列处理器,苹果还发布了A8X等AnX处理器,有时候性能比An+1还强,那些处理器主要是配备在iPad系列上。
苹果在发布新一代处理器时,一般会官宣其CPU、GPU、NPU(A11开始)的性能会比上一代提升多少,偶尔还会与业界同行处理器进行比较,其性能提升一般都是30-40%以上。
笔者Challey用特定算法针对CPU、GPU、NPU的性能提升进行了处理,得出了一个有关处理器的整体综合性能提升情况分析(见上表中的“比上代综合性能提升”一列)。从这里发现处理器综合性能的提升确实与晶体管数量的增长比率成正比。
结语
2013年的Haswell是Intel最后一次透露晶体管数目的CPU,其4核的型号是14亿。与Intel恰恰相反,自A7开始,苹果每发布新一代,都要“大张旗鼓”的宣布其晶体管数量增加了多少,其性能提升了多少,虽然有其营销的成分在里面,但综合分析来看,没错,苹果处理器性能强劲的“密码”就在于晶体管数量的不断增加。
当然,其不断升级的制程和缩小的面积,还有功耗的降低也是苹果处理器性能强劲的原因,同样还离不开各种协处理器、GPU、NPU、不断提升速度的统一内存(M1 Pro 200GB/s, M1 Max 400GB/s)、以及整体架构的优化,更重要的是还有其自家的iOS或者macOS系统优化。
苹果M1 Pro 和 M1 Max处理器的推出,对整个桌面端处理器市场将带来长远的影响,对Intel和AMD也会带来不小的冲击。
基于M1 Pro/Max非常可期的市场预期,三星、英特尔、台积电已经展开对苹果处理器代工的激烈争夺战。
而更重要的是,M1 Max的晶体管数量级已经达到了Graphcore第2代IPU GC200和阿里平头哥倚天710服务器处理器500-600亿的水平。
因此,苹果M1 Pro/Max之后,其不断提高晶体管数量进而提升性能的新处理器,对服务器市场的冲击也将逐渐出现,未来,不同于针对普通边缘计算的嵌入式小处理器的大边缘计算处理器市场也将会很快出现。