评估vSAN群集闪存生命周期

2018-11-07 07:15
网络安全和信息化 2018年9期
关键词:群集持久性磁盘

vSAN群集中闪存设备概述

SSD既是磁盘组读写性能的关键,其质量好坏、寿命也对整个磁盘组数据安全性有重要的影响。

如果磁盘组中的某块容量磁盘损坏,只会影响这块磁盘所涉及的虚拟机;但如果某块缓存磁盘损坏,则会影响到这整块磁盘组中所有的虚拟机。在机械磁盘中,很少有机械磁盘在短时间内连续出错,所以用作容量磁盘的机械磁盘(HDD)出错,vSAN还有重建或恢复的时间。但如果用作缓存磁盘的SSD在短时间内连续出错,那影响的有可能是整个架构!

闪存磁盘(SSD,或固态硬盘)有擦写寿命,在使用相对平均的vSAN磁盘组中,同一批闪存磁盘有可能是同一时间达到其寿命从而导致闪存磁盘报废!所以,在vSAN架构中,闪存磁盘的选择与使用期限至关重要。

在规划vSAN群集时,要合理地评估磁盘组数据变动量(写入、删除、重复数据写入),并根据所用SSD的容量、寿命,合理评估缓存磁盘的使用寿命,在其寿命终结之前逐步、有序地用全新、更高级别、更大容量的闪存磁盘替换。

例如,在一个vSAN群集系统中,每块磁盘组选择MLC的200GB的SSD,设计(评估)SSD的使用寿命是1000天,则应该在第900~950天的时间,花费大约1周~1个月的时间,用400GB的SSD一一替换原来200GB的SSD(不要一次全部替换,正确的作法是将某台主机置于维护模式,并撤出全部数据。当数据迁移到其他主机后,删除该主机的磁盘组,然后从主机移除缓存磁盘,添加新的缓存磁盘,最后重新添加磁盘组,使用新的缓存磁盘和原来的容量磁盘组成新的磁盘组),等这台主机添更新完成并运行24小时甚至更长时间无误之后,再为下一台主机更换缓存磁盘。

用400GB的SSD替换,原因有两点:首先vSAN群集的数据写入量整体应该是持续上升的,用容量增加1倍的SSD,相同P/E次数的持久性会增加;其次电子产品整体价格是下降的,900天后400GB的SSD的费用应该比现在200GB的SSD的费用要下降。

为vSAN选择SSD时,有两个重要参数:读写性能与P/E擦写次数。由于SSD所选择的芯片不同,每秒写入次数决定了其读写性能,而P/E次数(闪存完全擦写次数)决定了其使用寿命。

1.VMware兼容性指南中的闪存设备的性能分级(SSD Performance Classes)如下。

例如,对于400GB的SSD来说,要达到Class D级别,TBW大于等于7300。则总写入次数= 7300×1000÷400=18250(次)。即其P/E次数为18250次以上,这是数据中心级SSD所能达到的次数。

如果规划SSD使用寿命为5年,一年365天,则每天可写入次数=18250÷5÷365=10。每天写入次数10,对于400GB的SSD来说,允许每天写入4000GB的数据,连续使用5年。

VMware闪存持久性定义的 A、B、C、D级别,根据SSD硬盘总写入量来定义的。但并没有限制硬盘容量的大小。举例来说,Class D级的7300:

对于400GB的SSD来计算,写入7300TB的数据其写入次数是18250次;

对于800GB的SSD来计算,写入7300TB的次数是9125次;

对于1200GB的SSD来计算,写入7300TB的次数是6083.3次。

在当前的vSAN 6.x的规格中,每个磁盘组中使用的SSD缓存容量上限为600GB,但这并不影响选择使用更大容量的缓存磁盘,例如800GB。由于P/E次数的存储,虽然vSAN只使用600GB用作缓存,但800GB的硬盘比600GB的硬盘具有更高的TBW。

例如,对于P/E次数为10000次的相同SSD芯片来说,800GB的 SSD其持久性将达到8000TBW;而600GB的SSD其持久性则达到6000TBW。

根据VMware建议,在全闪存架构中,作为缓存层的SSD持久性应选择Class C及其以上级别;在混合架构中,作为缓存层的SSD持久性至少要选择Class B级别。其中VMware的建议如表1所列。

表1 VMware建议持久性级别及对应选择

评估闪存设备的生命周期

在使用闪存设备时,可监控闪存设备的使用频率并估算其生命周期。

在产品规划设计时,为vSAN选择的较高持久性的SSD。但在产品上线一段时间之后,还需要实际统计计算ESXi主机中用于缓存设备的SSD的实际写入量,以及在全闪存架构中缓存SSD与容量SSD的实际写入量,以正确的评估闪存设备的寿命。

下面通过某4节点vSAN群集为例(混合架构,每主机2个磁盘组,每个磁盘组一块400GB的 SSD、5块 900GB的HDD),介绍评估闪存设备生命周期的方法。

1.某单位使用4台联想3650 M5服务器组成标准vSAN群集,每台服务器配置有2个E5-2620 V4、256GB内存、2块Intel S3700 400GB SSD、10块 900GB 10000转 /分的2.5寸SAS磁盘、2端口万兆网卡,如图1所示。

2.在vSphere Web Client中导航器中选择群集或数据中心,在右侧单击“主机”选项卡,查看并记录每台主机正常运行时间,如图2所示。此时看到3台服务器连续运行83天,一台运行35天。

图1 某4节点vSAN群集

图2 计算每台主机连续运行时间

图3 记录每块闪存设备的标识符

3.记录每台主机闪存设备的标识符。本示例以记录其中一台主机为例。在导航器中选中一台主机,在“配置→存储设备”中,查看并记录闪存设备的“标识符”,如图3所示。

可以将这4台主机每块SSD的标识符复制、粘贴并保存到“记事本”中,例如:

4.为主机启用SSH,使用xShell等软件以SSH方式登录到ESXi主机,运行 “esxcli storage core device stats get -d=device_ID” 命令。

例如,对于ESXi主机-1的第一块SSD来说,其命令格式为:

表2 某vSAN群集中SSD写入数据统计

Blocks Written后 面的数据显示从上次重新启动后写入设备的块的数量。在本示例中,该值为121329054632。每次重新引导后,该值会重置为0。

之后在该主机执行:

然后在其他主机,分别执行类似命令获得该主机每块SSD的写入块数并记录下来。

5.计算每块SSD的总写入量。

一个块是512字节。要计算写入的总量,请将“写入的块”值乘以512,然后将得到的值转换为GB。

在ESXi主机-1的示例中,从上次重新启动后写入的总量分别为62120GB、69033GB。

其计算公式为:写入的块 ×512÷(1000×1000×1000)。

【说明】正常情况下1GB=1024MB,1MB = 1024KB,1KB =1024B。但设备厂商是10进制,即1GB=1000MB。例如120GB的固态硬盘,实际是111.79GB。为了计算方便,在计算时以1000为例计算。这并不影响实际的计算结果。

6.估算每天平均写入量(以GB单位),这可以用距上次重新启动后写入的总量除以距上次重新启动的天数。

在本示例中,ESXi主机-1正常运行时间为83天,硬盘大小为400GB,则2块SSD每天写入数量约748.44GB、831.73GB。本示例中4台主机每块SSD写入数据统计如表2所示。

7.使用以下公式估算设备的生命周期。

供应商提供的每天写入量乘以供应商提供的生命周期除以每天实际平均写入量。

例如,如果供应商保证在每天写入20GB的情况下生命周期为5年,而每天实际写入量为30GB,则闪存设备的生命周期约为3.3年。

当前选择的Intel S3700固态硬盘,其400GB的写入寿命约7.25PB,800GB的写入寿命约14.5PB。其P/E次数为18125。

当前ESXi主机1配置的2块400GB的固态硬盘,其每天的P/E次数分别为1.87、2.08。以当前选择的P/E次数大于18125次的固态硬盘来说,当前固态硬盘的使用寿命大约是25年。当然,一个vSphere群集的设计寿命一般是5~8年左右。在生命周期内,不需要更换固态硬盘。

猜你喜欢
群集持久性磁盘
叶腊石聚合成型及其旋转磁盘的制作方法
试论持久性有机污染物在中国的环境监测现状
湖北省持久性有机物(POPs)产排特性分析
Cecilia Chiang, pioneer of Chinese cuisine
它的好 它的坏 详解动态磁盘
具有授粉互惠关系的非自治周期植物传粉系统的持久性
解决Windows磁盘签名冲突
修改磁盘属性
配置vCenter Server
高稳定被动群集车联网连通性研究