GPU要逆袭 解析NVIDIA新一代Tegra X1

2015-09-10 12:47
电脑爱好者 2015年3期
关键词:麦克斯韦开普勒功耗

GPU引起的军备竞赛

我们都知道,智能手机/平板电脑专用的ARM“处理器”实际上就是一整套SoC(系统级芯片),包含CPU(决定运算性能)、GPU(决定图形性能)、内存控制器(决定I/O性能)、基带射频芯片(决定网络支持)等诸多组成部分。由于ARM处理器大都以Cortex-Axx(如A15、A53等等)架构设计,所以在架构、核心数量和主频相近时,各大品牌的处理器很难拉开CPU性能上的差距。此时,GPU的强弱,则会直接表现在具体游戏中的流畅度。

因此,无论是高通(骁龙)、三星(猎户座)、联发科、华为(海思)、英特尔(凌动),大家最新款移动处理器都纷纷武装上了最新GPU技术(表1)。论及表中的GPU性能,专为苹果iOS优化的PowerVR GX系列GPU拥有毋庸置疑的优势,而其他GPU芯片则会受核心频率以及渲染单元数量的影响而互有优劣。比如Mali-T628MP6和Mali-T760MP2,虽然看起来“Mali-T760”是“Mali-T628”的升级版,但由于Mali-T628MP6配有6个(MP6)处理单元,因此它的实际性能可能就要在仅有2个(MP2)处理单元的Mali-T760MP2之上。

从开普勒到麦克斯韦

就在各大ARM处理器厂商为各自采用GPU技术的强弱而争论不休之际,NVIDIA始终是颇为淡定的。作为以做显卡起家的NVIDIA来说,从2011年初试啼声的Tegra2开始,其处理器所集成的GPU就始终领先于同期的其他ARM处理器。这也难怪,作为NVIDIA的“主场优势”,如果连GPU技术再拿不出手实在有点说不过去。

没错,NVIDIA能在GPU性能上领先的秘诀,就是源于在台式机/笔记本领域做显卡的经验。以上代Tegra K1为例,NVIDIA首次将与桌面平级的开普勒(Kepler)架构引入到了移动领域,凭借核心架构以及高达192个流处理器的优势,让Tegra K1在GPU性能上足以媲美苹果A8X。要知道,Tegra K1的上市时间要早于A8X半年以上。

而NVIDIA Tegra X1则在K1的基础上,将开普勒架构替换成了最新的第二代麦克斯韦(Maxwell)架构,与我们熟悉的GTX750/750Ti、GTX980/970、GTX850M/GTX970M等台式机/笔记本领域的大放异彩的独立显卡一致!如果以时间为线索,开普勒架构在诞生近2年后才被NVIDIA领进了移动领域,而二代麦克斯韦刚刚在桌面上亮相半年就被强行拉到了移动市场,由此可见NVIDIA对Tegra X1的重视,以及巩固其GPU性能优势的决心(图1)。

对DIY玩家而言,麦克斯韦绝对是显卡中的“神器”,其最大特色就是在提供比开普勒更强性能的同时却降低了功耗和发热量。如今,继承麦克斯韦核心竞争力的Tegra X1不仅具备架构上的优势,在其他规格上也是远胜前辈Tegra K1。

Tegra K1强悍的GPU性能

Tegra K1使用了一组阵列(SMX),而Tegra X1则改用了两组(SMM)(图2),也因此让X1获得了更多的CUDA、光栅和纹理单元数量(表2),这些参数上的改进可以让其更容易驱动4K级别的显示设备。如果说2015年有哪些ARM处理器带得动4K屏幕,那Tegra X1自是当仁不让之选。

对ARM处理器来说,显存带宽始终是制约GPU性能发挥的瓶颈所在。因此,Tegra X1保留了麦克斯韦架构特有的第三代Delta色彩压缩和端到端压缩技术,并辅以最新LPDDR4内存,彻底解决了内存(显存)带宽不够用的问题。除此之外,Tegra X1同样支持保守光栅化算法、体积区块资源(DX11.2)、多帧抗锯齿(MFAA)等等新架构特有的图形技术。

光说不练假把式。国外媒体已经曝光了Tegra X1的跑分成绩(图3),并与NVIDIA上代Tegra K1和苹果最新的A8X进行了对比(表3)。从成绩可见,Tegra X1具备“完虐”A8X的性能优势,而且其GPU部分的功耗只有1.51W,远远低于苹果A8X GPU部分的2.67W!可见,麦克斯韦的高性能低功耗特色被Tegra X1完美地继承了下来。

相对保守的CPU架构

虽然Tegra X1的GPU架构非常激进,用最新桌面级的麦克斯韦秒杀了众多竞争对手,但它在CPU的架构选择上却显得有些保守(图4)。我们知道,NVIDIA上代Tegra K1引入了自主研发多年的64位“丹佛”,而最新的Tegra X1却选择了已被ARM规范化的“四核Cortex-A57+Cortex-A53架构”,与骁龙810相同。

需要注意的是,在A57和A53“协同工作”方面,Tegra X1并没有采用普遍的big.LITTLE技术,而是选择了自家的互连总线技术,同样可以让全部八个核心同时运行,供系统和应用随意调用。在其他方面,Tegra X1还支持HDMI 2.0、HDCP 2.2、4K级别解码、eMMC 5.1等特色技术或功能。

小结:功耗决定最终胜负

据NVIDIA表示,Tegra X1与三星旗舰级的Exynos 7410处理器相比,在同等功耗下性能会高出40%,在同性能时功耗则会下降50%。由此基本就能奠定Tegra X1在ARM移动处理器领域的霸主地位了。可惜,决定某颗ARM处理器能否成功的关键永远不是性能,要知道NVIDIA上代Tegra K1就因没能解决性能和功耗的矛盾,最终仅在平板电脑领域小有建树。而Tegra X1的A57+A53架构会带来更高的功耗和发热,只能借由20nm工艺加以缓解。最乐观的估计是,Tegra X1有望成为新一代旗舰平板的杀手锏,但想塞进更纤薄的智能手机中,很可能会采用降频方案来缓解电池续航和机身发热的压力。

猜你喜欢
麦克斯韦开普勒功耗
基于任务映射的暗硅芯片功耗预算方法
双麦克斯韦分布下极区中层尘埃粒子带电研究
『老师,您写错了!』
数字电路功耗的分析及优化
开普勒的最新发现:第二地球
“死而复生”的开普勒
开普勒的大发现
孤独远行的开普勒
IGBT模型优化及其在Buck变换器中的功耗分析