手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)

首先让我们来了解GPU是什么？

事实上在笔者写过的科普文里面已经不是第一次提及GPU的基本概念了，这里为了内容的完整性就先简单重复一下。GPU即图形处理器（Graphics Processing Unit），就是显卡的核心处理单元，本质上是强调高性能高强度大规模多线程浮点运算的处理器单元。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图1

具体来说，GPU就是基于硬件加速思想，专门为图形加速任务和类似原理的用途所构建的专用处理器，和作为通用处理平台的CPU有着本质的不同，无论是基本构造还是运行方式。其中比较重要的一点在于我们知道CPU的规模翻倍，也就是核心数翻倍并不一定会大幅提高性能，尤其是对于受强调的单线程毫无贡献，但GPU相反，以用户视角而言，同频同架构，规模翻倍就可以认为是性能翻倍。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图2

MP、ALU与核心数的区别：

接下来我们就说说大家关心的核心数的问题。对于核心数我们更熟悉的还是CPU那边的定义，一个核心对应一个逻辑线程，而对于手机在内的移动平台而言，因为都基于ARM指令集，即便是有不少的自主架构，同期同档次的产品也是可以同台竞技，因为各自的核心之间并不会有太离谱的差异。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图3

然而GPU则不同，因为各家厂商都拥有独立迭代的图形技术体系，这就意味着即便核心二字十分生动形象，其实也不能用从CPU那边借来的“核心数”概念来直接衡量，因为厂商完全可以自己定义核心，这样同代同档产品的核心数很可能就会有几个数量级的区别，完全失去了横行比较的意义。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图4

目前为止，我们最常见的核心数所对应的概念是MP，出现在ARM Mali系列的GPU上，三星、海思、联发科等SOC厂商都是它的客户。具体而言，MP指的是“可独立运行和销售的基本规模”（实际是按照shader core的数量），对应的是ARM对外授权的销售需要，即依照GPU吃规模的特点，通过对shader核心进行有限数量的重复叠加，来满足客户们不同档次的需求，同时节省自家的研发和宣传成本。这样在同样核心的基础上，比如都是T880，粗略估算，T880MP4就是基本型T880MP1的4倍性能，而T880MP12则是12倍。

特别需要注意的是，由于Mali近些年的产品型号都以0结尾，这样也有另一种后面不接MP的简写，即T880MP4写作T884，T880MP12写作T8812。然而在某些地方比如一些OTT盒子的店家宣传上，这种写法被错误使用于虚假宣传，比如写成T884MP4实际4核但对外号称16核，这种则需要各位冷静辨明。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图5

此外，在Mali 400和450系列上，由于彼时是顶点和像素处理器分开而非现行的shader core统一渲染，一般只计算像素处理器的数量，或者将顶点和像素处理器分开计算。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图6

而在另外一家大厂，即Imagination的PowerVR系列上也有类似的计算方式，但除了5XT系列，都是将核心数融入产品型号的第二位数，即PowerVR 6230、GT7600等即分别是双核心和6核心。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图7

至于高通则是另一种做法，由于它的Adreno系列GPU只供给自家的骁龙SOC，完全的自产自销就没有像前面两位那样按照基础规模分级的必要，故而高通一直不宣传核心数，外界只知道型号，给人一种只靠单核打天下的印象。当然了解GPU基本构造的人当然知道Adreno肯定是多核规模，只是计算起来仅能通过数ALU即算术逻辑单元的方式进行，比如目前当红的Adreno530就是256ALU。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图8

那有没有直接计算ALU还宣传出来的厂商呢？当然有，就是以桌面GPU出名的厂商NVIDIA，自家Tegra4的72核和TegraK1的192核宣传都是直接以ALU（CUDA）计数，看起来很吓人。当然必须强调的是，其实别家定义的一个核心内也会包含一定数量的ALU，直接比较数量根本无法对应GPU实际规模上的不同，自然也毫无意义。事实上横向判断性能高低最好还是通过图形跑分。

规模、频率和能耗比：

无论是核心数还是ALU，最终指向的还是GPU的规模。那么除此之外还有什么会影响GPU的性能呢？当然还有频率，这里任何类型的处理器定义都一样，是指驱动处理器运行的时钟脉冲信号在单位时间内发射的数量，通常一次脉冲对应一次完整的核心计算，因此也可以视为处理器的性能跟随频率线性增减。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图9

举个例子，海思麒麟950的GPU是T880MP4@900MHz，而换算到满血Exynos 8890的MP12规模，对等性能大约需要300MHz，即在一定范围内，少核高频可以做到和多核低频一样的性能，毕竟8890实际在650MHz，是K950的两倍有余。然而高频会带来一个问题，即能耗比的降低，随着频率的提升，功耗的增加要比性能快得多，而同样的性能下，少核高频的耗能也要明显高于多核低频。

为什么海思和联发科不受待见？

这就可以解答为什么三星处理器的声望要高于海思和联发科，正是因为在旗舰平台上，三星是秉承和高通一样的大规模低频率的策略，而海思和联发科则相反。少核高频带来了更大的功耗和发热，好处则是节省成本，毕竟只需要改时钟不需要花钱买额外的晶体管，显然这说明海思和联发科过于抠门，不如三星堆料良心。

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图10

此外无节制的高频还是一种恶性循环，因为带来的额外功耗造成发热，会使机体更早触碰到温控限制而导致降频，使处理器的性能下降，所以频率不是随意提升的，要看制程工艺具体的可承受情况而定。

先说什么是GPU：

GPU英文全称Graphic Processing Unit，中文翻译为“图形处理器”。我们通常就叫它显卡，GPU是显示卡的“大脑”，它决定了该显卡的档次和大部分性能，对于传统PC上来说，GPU同时也是2D显示卡和3D显示卡的区别依据。2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力，称为“软加速”。3D显示芯片是将三维图像和特效处理功能集中在显示芯片内，也即所谓的“硬件加速”功能。显示芯片通常是显示卡上最大的芯片（也是引脚最多的）。现在市场上的显卡大多采用NVIDIA和 AMD-ATI两家公司的图形处理芯片。GPU，是一块高度集成的芯片，其中包含了图形处理所必须的所有元件，GPU和CPU之间通过RAM内存进行数据交换。在手机主板上，GPU芯片一般都是紧挨着CPU芯片的。

为什么海思和联发科不受待见？

手机gpu堆核的成本有多高啊(为何手机gpu可以堆核到16核)图10

原创文章，作者：普尔小编，如若转载，请注明出处：http://www.puerpx.cn/pxwd/9563.html