郭涛
之前,吸引了全球大众目光的事,就是首张黑洞照片的曝光。在数字化发展日益走向深入的今天,数据的爆炸性增长造就了“数据黑洞”,无边无际,同时又具有极大的能量。IDC预测,到2025年,全球数据产量将突破160ZB,它将对IT架构,尤其是存储提出更严峻的挑战。IDC中国企业级研究部助理副总裁周震刚指出,为有效应对数据爆炸,软件定义、智能化、多云间的数据流动将成为存储的中流砥柱。分布式存储是未来。
说起来,分布式存储也算是一个老生常谈的话题了。为什么现在再次强调其重要性和必要性?不会是炒冷饭吧?因为有众多互联网大咖的加持,分布式存储可以说是含着金钥匙诞生的。接着又因为云计算的快速兴起,分布式存储享受到了“网红”的待遇。今天,分布式存储已经成了云原生应用的默认选择。那么,分布式存储还有什么不满足吗?
分布式存储的红利
市场研究机构IDC并没有将分布式存储作为一个单独的研究对象,而是把它归于一个更宽泛的概念——软件定义存储。从2016年开始,IDC就一直在跟踪软件定义存储市场的发展,见证了其快速成长。IDC发布的《中国软件定义存储(SDS)及超融合存储(HCI)系统市场季度跟踪报告,2018年第四季度》显示,2018年,软件定义存储市场达到了54.9%的同比增长,超融合市场规模同比增长幅度更大,达到88.2%。目前,软件定义存储和超融合系统在中国整体存储市场的占有率稳步上升,分别达到了22.1%和17.0%的市场占有量。从供应商表现来看,华为凭借文件解决方案在政府、广电和电信等行业得到认可,在2018年中国软件定义市场排名第一。
软件定义存储易于扩展和管理,其成本低、硬件灵活度高以及可快速集成等特点,对于正在经历数字化转型的企业来说非常重要,越来越受到不同行业用户的青睐。一个新的存储时代已经来临。
分布式存储的快速发展得益于两大“红利”。
第一,云原生应用的红利。云计算的出现加速推动了企业的“互联网+”进程,以金融行业为代表的传统企业客户纷纷搭上互联网的快车,推出了种类繁多的线上应用。以银行为例,琳琅满目的电话银行、信用卡业务、线上银行等成了金融消费的“新常态”。再比如,在电力行业,由于大量以互联网、云计算为依托的新兴应用的出现,直接导致了分布式存储对传统存储的替代。特别值得一提的是,在中国,视频云正在以前所未有的速度发展,已经渗透至四、六级市场,海量的非结构化数据的处理仰仗分布式存储的效率和灵活性。
第二,存储硬件持续演进和优化的红利。以闪存为代表的新一代存储介质逐步蚕食传统存储市场,文件、块、对象三种形式的存储的进一步融合,让分布式存储更加贴近企业用户的需求。
分布式存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,不仅提高了系统的可靠性、可用性和存取效率,而且易于扩展。正是得益于先天的优势,包括较低的总拥有成本、灵活的扩展能力、线性增长的性能、统一的资源池管理等,分布式存储成了有效处理非结构化和半结构化数据的利器。IDC认为,软件定义存储系统受到了全球企业用户的广泛认可,已被逐步应用于大规模数据应用的场景中。
IDC中国企业级研究部助理副总裁周震刚给出的IDC预测,2017-2022年,全球软件定义存储市场规模的平均增速为14.7%,而中国软件定义存储市场的平均增速为32.5%。有分析师乐观地预测,未来3年,在中国市场上,软件定义存储将占据整个存储市场的半壁江山。
关键应用并非不可进入
虽然分布式存储随着云原生应用的兴起得到了迅速普及,但从分布式存储本身来说,它肯定不愿意将自己仅仅限制在云原生应用领域,从新兴应用、边缘应用向关键核心应用领域延伸和拓展是必然的。企业在数字化转型的过程中,不仅要更好地支持新一代云原生应用,更要兼顾传统应用,这也是“双模IT”“混合IT”等被经常提及的原因。
华为有一种观点:在未来5-10年甚至更长时间里,混合云架构将大行其道,成为大中型企业最重要的基础架构。在这个统一的架构中,企业倾向于将数据中心业务分成两类,一类是核心业务,另一类是非核心或新兴业务,两者采用不同的IT模式。
云原生虽然是一个新名词,也带来了一批新的技术,比如软件定义、分布式、超融合等。但是从应用的角度看,传统应用与云原生应用之间的界线其实是越来越模糊的。用戶关注的是如何满足其应用需求,而对于具体的技术实现并不关心。从技术的角度讲,无论是本地数据中心还是云端,最终的趋势是从底层上打通,为用户呈现一个统一的架构,同时很好地支持传统应用与云原生应用。一方面,本地数据中心的应用和数据逐渐向云迁移,反过来,云端的一些特殊应用需求又要回到本地数据中心,找寻更适合的解决方案。
具体到分布式存储,因其架构、灵活性、成本等方面的独特价值,让它有能力承担更重要的负载,进入企业的关键业务应用。但我们也不得不承认,像数据库这样追求高IO性能、低延迟的核心应用,还不太可能马上采用分布式存储。有分析师指出,至少两年内,分布式存储还不能用于数据库类的应用,因为在延迟上,分布式存储仍有“短板”,必须持续优化,并且与硬件有更充分整合。不过我们也注意到,在一些小型数据库的应用中,已经有软件定义存储的身影。另外,在一些所谓的“次关键”应用中,比如广电行业的采编播系统中,已经大量应用了分布式存储。
未来,关键、次关键和非关键应用划分的标准可能会有所变化。所以,分布式存储能否应用于所谓的关键应用未来也会有不同的说法。有分析师指出,分布式存储替代传统存储,除了技术和产品上的因素以外,用户的使用习惯也是一个关键因素。这就需要分布式存储通过在大量不同业务场景中的成功实践来证明自己。
中桥咨询首席分析师王丛十分认同,分布式存储是未来的发展方向。但她也提到,分布式存储能否满足银行交易系统的需求,主要取决于应用和节点间的网络连接能否满足数据一致性,以及低延迟的要求。从目前看,私有云、企业级分布式数据中心、NFV和物联网的发展会刺激市场对分布式存储的需求。未来,保证分布式到超可扩展的升级能力,将成为决定分布式存储可持续发展的关键因素。
路在何方?
现在,几乎所有主流的存储厂商都在做分布式存储。像阿里云、青云、UCloud等云服务商都成了“新存储厂商”,分布式存储就是他们的杀手锏之一。在分布式存储领域,文件、块、对象存储的进一步融合对于满足用户全面的需求是必须的。有分析师指出,在助力企业数字化转型的过程中,存储要在以下几方面做出更多改变:承载更多不同的应用负载,为用户提供更好的应用体验;闪存要持续优化,不断完善高级功能,比如重删、压缩,以及远程复制等;与AI进一步结合,实现运维智能化,以及管理的自动化。
随着云原生应用的兴起,企业用户对存储提出了新的要求,在保证安全性的前提下,灵活、敏捷、扩展性等能力的提升是永远的追求。从工作负载上来看,分布式存储已经越来越深入传统意义的关键应用领域。