从《深海》制作中牺牲的几十台“高配电脑”说起

2023-05-30 10:48
电脑报 2023年20期
关键词:线程深海工作站

要说最近最令人震撼的电影,情怀大片《灌篮高手》都得靠边站,必属画面美轮美奂、特效逆天的大片《深海》。很多观众看后感叹:这绝对是动画片画质的“新天花板”。而这部冲击10亿元票房的动画巨作,仅制作成本就超3亿元,制作周期长达7年。它的官方纪录片,为我们呈现了制作的艰辛。其间还记录了一个“惨烈细节”,那就是在制作過程中,因为屋顶漏雨,损失了四十多台“高配电脑”,而它们中的大部分,其实就是“工作站”。

而提到工作站(Workstation)这种产品,话题就变得非常有趣了!简单说,它是一种80%的人“完全不懂”,近20%的人“懂一点,但又‘着实看不明白”,真正弄得明白的人不到1%的“神秘产品”。

你就是那80%完全不懂的人?没关系,请往下看一分钟,你马上就能晋升为“懂一点,但又‘着实看不明白”的Level2人群^__^!3、2、1,计时开始!

PART1

简单说,工作站和普通电脑硬件上有什么不同?

从硬件端说,最典型的工作站电脑是由“专用处理器+专用主板+支持ECC(错误校验)的内存+专业显卡”构成的。

对比个人电脑(PC),工作站(Workstation)的硬件区别很明显,比如英特尔平台端:

·个人电脑常用处理器是酷睿(Core)品牌,如今基本上每代酷睿处理器都分了i3/i5/i7/i9四个档次。

·个人电脑常用显卡是NVIDIA的消费级显卡GeForce系列,比如GeForceRTX3060/4070/4080/4090等。

·主板也是个人电脑专用的,比如第13代酷睿可用Z790/B760芯片组款型。

·工作站使用的处理器则是至强(Xeon)品牌。至强处理器分为服务器用和工作站用两大类,而最新的工作站处理器是W-2400和W-3400系列,再细分,就是W3/W5/W7/W9四个档次。

·工作站通常搭载专业显卡,时下比较新的是NVIDIA的RTXA6000/A5500/A5000/A4500/A4000等,还有入门级的T1000、T600;另外还有用于深度学习的GV100等。

·主板也是工作站专用的,比如W790芯片组主板,就对应最新的至强W-2400和W-3400系列处理器。

看到这里,恭喜,你已经从“80%的Level1人群”进阶到了“近20%的Level2人群”。

不过为什么又说这Level2是“懂一点,但又‘着实看不明白”呢?因为,只要你看看工作站的价格和奇特的现象,你极有可能“又整不明白了”^__#!

PART2

谜一般的工作站(配件及整机)售价,和“奇怪的现状”

如今大家配台24核32线程的i9-13900K处理器+RTX4070显卡高性能台式机,价格也就万元起,品牌机1.8万元左右。若是笔记本,甚至万元不到就能买到。但处理器核心数量和显卡规格类似的典型工作站产品,价格则是以“万元”为单位的。下图中是国内品牌的“DIY工作站”,使用至强W-3400处理器,显卡还是消费级的而非专业卡,价格动辄六七万元!若是搭载多块专业显卡的至强W9-3495X工作站,价格要20万元以上——注意,这还仅是“DIY品牌”的价格,还不是联想戴尔这样的整机品牌,后者会更贵。

典型的工作站整机,价格缘何这么贵呢?

答案是:因为构成典型工作站产品的各种配件,价格都比个人电脑配件贵很多!有些价格差异甚至是十倍!

处理器端,目前最新的第13代酷睿i9-13900K,建议零售价为589美元;而至强W9-3495X处理器,建议零售价格则是十倍差异,高达5889美元!

显卡端,当下主流的RTXA6000/A5500/A5000专业显卡,价格都在万元之上;如果是高端的QuadroGV100显卡,价格更是高达50000元+!相比起来,消费级顶级显卡RTX4080/4090只要8700元/14000元,“主流强卡”RTX3060甚至只要2500元左右,价格也不在一个档次上。

主板端,相同品牌情况下,消费级主板(比如最新的Z790芯片组)和工作站用主板(比如W790芯片组)也有数倍差价。

OK,现在大家知道了一点:典型的工作站电脑超级贵,是因为处理器、专业显卡、主板等配件都贵。不过,这有啥“看不明白”呢?那么,请用消费级和工作站的处理器、显卡,具体对比一下规格和售价

和消费级处理器进行对比,先按照相同线程比较:

·20线程(14核20线程)的消费级处理器i5-13500建议售价为232美元;而20线程(10核20线程)的W5-2445建议售价为839美元,是前者的3.6倍!

·32线程(24核32线程)的消费级顶级处理器i9-13900K建议售价是589美元;32线程(16核32线程)的W5-2465X/W5-3435X建议售价分别是1389美元和1589美元,是前者的2.3倍和2.7倍!

再按照同物理核心数比较:

·24核的消费级顶级处理器i9-13900K建议售价是589美元;24核的W7-2495X/W7-3455建议售价是2189美元和2489美元,是前者的3.7倍和4.2倍!

然后看看专业显卡和消费级显卡的对比。按照一般性常识,比较CUDA核心数相近的款型:

·CUDA核心数16000+的消费级显卡RTX4090,零售价人民币14000元左右;CUDA核心数18000+的最新款专业显卡RTXA6000Ada架构版,零售价人民币58000元,是前者的4.1倍!

而这,就是大部分“稍懂行的人”看不明白的点:看似相同的规格,凭什么工作站配件贵那么多?就因为它叫至强或是专业显卡?

但,以上还不是真正让人看不明白和糊涂的,如今,让人“彻底晕菜”的是:当你在电商平台搜索“工作站”,会发现铺天盖地而来的并不是我刚才给你看的那些天价产品,而是几千元,甚至“3999元的工作站”。它们基本都搭载酷睿消费级处理器,内存甚至仅8GB,也不用专业显卡,大部分甚至是集显!所以,前面讲的都仅仅是“理论知识”?关于工作站的一切都已经彻底颠覆?那些天价处理器和昂贵的专业显卡其实无人问津??

看到这里,恭喜你正式成为一个“迷惑的Level2”!关于工作站的传统认知突然给打破了。似乎,传统的工作站产品如今已无人问津了?但,也正是从这里开始,才进入这篇文章的核心。我们将一步一步,把所有关于“工作站”电脑的困惑一一解答。

PART3

工作站变迁史

消费级处理器多核爆发,消费级显卡性能飙升,EasyMoney生意消失

故事要从N年前讲起,那时,消费级处理器还长期停留在4核8线程上,所以彼时工作站产品是“EasyMoney”(轻松赚钱的生意)!6核8核的至强处理器工作站,搭载入门级专业显卡就能卖几万元。

但随着处理器竞争的加剧,“核战争”爆发,消费级处理器的核心数量在几年之内狂翻几倍到现在的16核、24核!同期,消费级显卡性能也突飞猛进,如今已有CUDA核心数高达16000个的消费级显卡了,最大显存也来到了24GB!

如此一来,之前很大一部分低端工作站干的活儿的确给消费级处理器+消费级显卡抢了!大家不再需要掏几万元去买6核、8核至强+入门级专业显卡的入门级工作站了。而恰好,“工作站”产品本来就没有特别严格的配置标准,所以現在大家看到,大量入门级工作站,虽然有“工作站电脑的外壳”,但里面基本就是消费级配件,价格也非常便宜——这,就是时代的变迁。早期的EasyMoney生意,从此消失了!

PART4

从至强系统的真正特性说起PART4典型的工作站,活跃在真正的专业领域

那么,我们是否可以理解为“搭载至强处理器、专业显卡、ECC内存”的“典型工作站产品”日渐式微了呢?

不!其实“被取代的”,是相对低端、入门的产品。而“真正典型的工作站产品”,其“独特卖点”是消费级电脑无法比拟的。而且,它们也在进化,开始以不同的形态,活跃在真正的专业领域。而且,这种“需要典型工作站产品的专业领域”,如今越来越多了(后面会解释)。

Ⅰ.至强处理器和专业显卡真正强的特性是什么?

前面的“同规格比较”,数倍的价差,让不少人困惑!但实际上,是因为大家“还不够真正懂行”。无论是至强处理器,还是专业显卡,都有自己“真正强大的、消费级配件难以比拟的特性”。

先从“工作站专用”的至强W-2400和W-3400系列处理器说起:

●至强W系列处理器,CPU内置的PCIe通道数多得多,W-2400/W-3400系列内置64条/112条PCIe5.0通道!而消费级处理器,如第13代酷睿,CPU内置PCIe5.0通道仅20条。新一代至强W是消费级处理器的3.2倍/5.6倍。

●另外,至强W支持的内存通道数和内存容量都极大,W-2400支持4通道最大2TB内存,W-3400支持8通道最大4TB内存。而第13代酷睿最大支持的内存通道/容量是2通道/192GB。至强对内存通道的支持是消费级的2倍/4倍;内存容量是消费级的11倍/21倍!

●至强处理器支持ECC错误检验内存,而消费级处理器并不支持。ECC内存可确保任务不会在半途报错、宕机——这对于动辄上百、数百小时的项目运算非常重要。而一些大型工程,往往是由上千个“数百小时的子项目”构成的,ECC内存的价值可见一斑。

●真正的多核至强处理器,L3级缓存容量也更大一些,某些应用的性能会更好。

●至强W-2400和W-3400系列都支持AVX-512指令集,可用于AI、高性能计算应用加速。酷睿消费级处理器目前都不再支持AVX-512指令集。

再来说说专业显卡的特性。

●以RTXA6000为例(它算是当下较强的工作站用专业显卡),其CUDA核心数10752个,显存容量高达48GB;而CUDA核心数类似的GeForceRTX3080Ti/4080消费级显卡,显存容量仅12GB/16GB。也就是说,专业显卡,尤其是高端专业显卡,显存容量更大,最大可至3~4倍。

●还有个细节就是对ECC的支持——如今的RTX专业显卡,大部分采用了ECC错误校验显存。而消费级显卡,再高端都不支持。

●高端的专业显卡还支持“NVLink”,可通过桥接实现“火力翻倍”。而新款的GeForceRTX消费级显卡大部分不再支持NVLink功能了,只能“单兵作战”。

Ⅱ.体现在产品形态上,终于明白了“真·工作站”形态为何能如此豪横

看完了上面的介绍,现在大家应该明白:至强处理器、专业显卡,并非“智商税”,也不是简单地“换个名字赚大钱”,而是“有真本事的”!而结合上面这些数据,大家也就很容易明白,为什么工作站主板、真正的典型工作站产品,看起来总是那么“豪横”了^___^。

Ⅲ.那么,什么应用需要这些生猛的特性和夸张的配置呢?

了解了典型工作站配件的特性,了解了“真·工作站”产品能达到的夸张配置上限,一个自然而来的问题就是:究竟什么样的应用,才会需要用到如此豪横的配置呢?

前面我已说过,在消费级处理器核心数量暴增、消费级显卡性能飙升后,的确抢走了传统工作站产品的很多业务。且如今,专业设计软件领域的几家大佬(AUTODESK、达索、西门子、Adobe等),它们的大量设计类软件,只要任务负载不重,其实用消费级平台就能搞定,而这也是如今游戏电脑(高性能电脑)热销的主要原因之一——不少人用它们做相对简单的CAD、视频剪辑和简单的3D建模,以及平面设计。

但,如果涉及真正负载高的活儿,消费级电脑是完全没办法搞定的!必须,或者说至少要借助强大配置的工作站产品。

●比如游戏场景设计、电影特效和动画特效建模等(渲染就更别提了,得靠服务器集群、渲染农场来完成,这是另外的话题了)。

●比如设计汽车发动机、飞机发动机,或者一辆汽车、一架飞机。

●另外,即便是一些看起来很常见的应用,当负载程度和精度提升后,消费级电脑也难以搞定,也需要高配置的工作站。比如视频剪辑,如今用轻薄本都能剪辑FHD级别的手机拍摄视频,但当你的视频素材变成高码率8K时,相信我,消费级电脑是搞不定的!

另外大家还得明白:不同的应用类型,对工作站的性能需求点也是不同的,甚至是截然不同的。

●先说游戏、电影、动画的三维建模。

而涉及如此大规模的特效的建模、粗渲染,对处理器和显卡都有极高的要求,且是属于“上不封顶的需求”——处理器核心数越多、功率释放越强、頻率越高,显卡的CUDA核心数越多、显存越大,效率就越高。这也就是我们看到动画制作公司、影视制作团队,每个人都使用高性能工作站的缘故。

而且,在这个大的领域内,不同的软件,不同的项目,需求也有细分的:比如用MAYA做动画建模和简单渲染,核心是显卡要强;但若用AE做粒子特效,那基本是靠处理器硬扛,且内存容量越大越好;但若是Blender建模和简单渲染,则处理器方案和显卡方案都可选。

前面提到的这台插满了内存和RTX专业显卡的顶规工作站就相对适合电影、动画、游戏设计领域。

知识加油站:关于工作站产品的“投入产出比”

不少懂点硬件知识的“老鸟”都持有这样的观点:至强处理器、专业显卡、ECC内存,同等规格下比消费级电脑贵太多,用消费级的顶规电脑不行吗?即便慢点,但能节约大量开支啊。

但实际上,对于真正需要用到高配置、顶级配置工作站(甚至服务器)的应用来说,这点硬件的钱根本不是个事儿!比如电影《深海》的制作费用就高达3亿元以上,而发行费用也超过了1亿元,工作站的钱其实占比很小。常规性价比思维中,“效率低一倍,但价格便宜两三倍”的成本逻辑在这里完全不适用。还有隐性成本问题:工期长一倍,从正常4年(动画电影正常制作周期为4年,《深海》是遭遇了特殊情况,长达7年)变8年,人工费得增加多少?

而且,人的工龄中,能有几个8年?

●再说工业设计领域。比如发动机设计、汽车设计。这并非单一需求,而是巨大的、复杂的系统工程,需要的工作站产品也有不同。

工业设计是复杂的“系统工程”,尤其是复杂工业品的设计,里面可能涉及数百上千个甚至几千上万个零部件,是巨大的协同工程。也正因如此,工业设计往往是“不同软件商的好几款软件联立使用”,有些是设计单个零部件的,有些是用于全局协同的,有些是用于仿真计算的。而不同的细分应用,对硬件的需求是不同的。

举几个例子:·比如用西门子NX(UG)做一个发动机的外壳,需要渲染出来看效果。这种渲染是“不断迭代的”,迭代次数越多,就越接近真实的视觉效果。而这种渲染,就是吃处理器资源的。处理器核心越多越好,频率越高越好。

·而在工业产品设计中,存在大量的“仿真计算”环节。比如设计汽车,设计师需要知道车在不同速度的行驶中的空气阻力情况、周遭气流分布状况,还得进行碰撞仿真来优化和改进车的框架设计;设计发动机,设计师要知道空气流在发动机内的压力变化、流向变化、速度变化;设计管道系统,设计师得知道管道里的液体流动、相互撞击的情况……这些东西,不可能“一次又一次地实际做实验”,那成本和时间都是难以想象的,所以,就要用到计算机仿真计算。

而仿真计算,基本是靠处理器运算。另外不少仿真计算对内存的要求也极高。消费级处理器最高192GB?不好意思,复杂仿真计算恨不得都用TB级的内存——这也就是很多仿真计算用的工作站采用双路至强处理器,插满了内存,但显卡却是一个入门级T1000显卡的道理,因为它不太需要显卡的性能。

●最后举些大家不容易想到的例子,比如医学影像、地质勘探等。

这是台高端CT机,很多医院都在用。病人如果做心肺HRCT,CT机会将人体上腹部“切片成像”数百张,然后合成为连贯的三维立体影像,这样医生就可以360°无死角地观察病人的心脏、肺部等各器官的情况,包含血管的细节,甚至是血管各个角度的粗细变化、血流影像等。而这个成像与合成的过程,当然是越快越好,这样才能提升接诊效率,让医院在尽可能短的时间内收回设备投资(高端CT机价格超贵)。因此,每台这种高端CT机都会配套一台高端图形工作站,来强化图像处理能力。

这是地质勘探应用中的一个环节,似于CT断层扫描成像,适用领域如石油、天然气勘探等。这种勘探是真正的“巨型工程”,并不是发现地下有油有气,就伸个钻头进去捅那么简单。就举一个例子,地下天然气、石油的贮藏结构是什么样的得探明。而且,一旦从一个点开始开采,其内部会产生如何的流向,会不会影响进一步的开采,会不会导致地质结构不稳定……这些,都需要根据前期采集到的信息进行仿真分析——这种运算,也是吃处理器和内存资源的。但勘探中的成像和组合环节,则是吃显卡算力的。如前所述,不同的细分应用往往需要用到不同的工作站产品。

PART5

工作站需求旺盛,产品百花齐放

很多“个人电脑专家”往往抱有这样的观点:“多核的消费级电脑抢了部分工作站生意,所以宏观上,传统工作站的生意机会变少了。”——而这个观点是完全错误的!

前面我们的确提到了“低端工作站生意被抢,EasyMoney生意消失”,但另一方面,更高的需求在不断诞生,甚至于,越来越多了。

举一个应用需求变迁的例子大家就明白了:七八年前,还没多少人玩得起视频制作和剪辑——因为相关设备少,专业性强,价格也高。但现在手机都能轻松拍摄和快速剪辑视频后,并没有让人们做视频的时间因为效率的提升而减少——相反,因为门槛低了,人人都花费大量时间折腾视频,我们彻底进入了视频时代。而在视频时代中,大家对高清、高质量的视频需求越来越旺盛,视频的清晰度和精美程度越来越高,各大影视剧、电影都开始推出高清、超清版,电影的特效也越来越华丽、绚烂……从宏观上说,对高性能的视频制作、编辑、渲染硬件(包括工作站、服务器等)的需求反而是暴增的,从业人数也在暴增——所以,这个道理很明确了吧。

而需求的暴增,也意味着产品端的百花齐放。前面给大家展示的主要是台式工作站,也称桌面工作站,造型就是传统台式机的样子,当然个头往往更大。但实际上,工作站这种产品形态可以是千变万化的。可以是台式机造型、可以是笔记本造型,也可以像机架式服务器,甚至可以是柜子或箱子,形态上并没有严格的限定。

而除了形态的丰富,工作站的配置也是千变万化、千差万别的。在前文中,各位已经看到——消费级个人电脑,厂商也可以定义它是“工作站”。当然,典型的工作站配置还是以至强(或线程撕裂者)处理器、ECC内存、专业显卡和专用主板构成的,也只有这种配置的典型工作站產品,才能“拔高配置上限”,真正满足高负载专业需求。而具体到不同类型的专业应用,有些配置强调的是处理器的核心数量和内存容量,有些强调图形性能,有些强调存储,也有要求兼顾的。

最后,工作站产品的“制造商”如今也越来越多。传统的“三大家”(戴尔、联想、惠普)名声虽响,但其他国际OEM厂商也在奋起直追。而国内也有大量的OEM厂商和行业厂商制造工作站产品,如曙光、浪潮、紫光等。甚至于国内个别新锐PC品牌如今也推出了工作站产品,如雷神。另一方面,在工作站、服务器领域,还有不少“专精厂商”,如超微(SuperMicro),它不仅为工作站、服务器提供核心配件(如主板、机箱),也参与整机的制造和销售,甚至可构建行业整体解决方案。还有大量的系统集成商,也在根据客户的需求,组装对应配置的工作站或服务器产品。总之,工作站产品的“参与者”越来越多,产品呈现百花齐放态势。

写在文末

至此,你已掌握了关于工作站电脑的绝大部分知识,从典型的硬件构成,到它的发展变迁,到它的独特卖点和真正强大所在,以及具体的细分应用,还有相关生态。恭喜你,你已经成为那“不到1%”的懂行专家!

当然,这篇科普文章也仅仅做了宏观层面的梳理,工作站无论是产品还是具体的应用,都还有很多很多的细节和知识点留待大家去发现和探秘。比如,大家猜猜看,至强W9-3495X(56核112线程)处理器,“火力全开”时的爆发功率能有多高?而稳定输出的最高功率又能有多高?^___^

猜你喜欢
线程深海工作站
左权浙理大 共建工作站
戴尔Precision 5750移动工作站
深海特“潜”队
隐藏在深海里的神秘生物
深海里的神秘生物
浅谈linux多线程协作
移动式CIP及SIP工作站(可记录型)
基于上下文定界的Fork/Join并行性的并发程序可达性分析*
Linux线程实现技术研究
么移动中间件线程池并发机制优化改进