达沃时代雷迎春:超融合需要统一存储

 中国电子报、电子信息产业网  作者:
发布时间:2016-06-29
放大缩小

  超融合对提升运营效率、降低成本、硬件升级等数据中心面临的运维问题带来较大帮助,云计算和大数据时代,数据飞速增长为数据中心带来很大压力,业务的快速变化也为IT架构带来许多挑战,超融合正是为解决这类问题而生,这也是市场和用户追捧超融合的原因之一。

  从产业上来说,超融合的火与多股力量有关系,有Nutanix、Simplivity这样的行业明星企业,有戴尔、HPE、联想这样的传统服务器厂商,有提倡软件定义存储的力量,有虚拟机厂商的力量,时间长了我们就会发现,超融合里提到的计算、存储和网络,唯有网络厂商的存在感比较少。

  在中小规模中,网络不具备在超融合领域的支配权

  这反映出一个现状,可以说是当前做超融合的厂商中大家对网络都不是很擅长,也可以说网络厂商在超融合领域的参与感较低。对此,达沃时代雷迎春博士表示,在中小规模领域,由于IT结构较为简单,网络并不具备在超融合领域的支配权。

  我们看到一个现象,就是一些超融合系统在简化网络部分,比如一些超融合解决方案会把网络交换机直接省掉,遵循的是超融合简化部署,降低成本的初衷。

  达沃时代新推出的小金刚C-ONE就是这样一款产品,它采用达沃时代自研的分布式存储系统加上主流的虚拟化平台,在标准服务器上实现存储和计算的无缝融合,最大的特点就是不需要万兆交换机,节点之间直接用万兆网线互连。

  

  达沃时代的雷迎春博士是这样解释的,“许多中小企业对成本比较敏感,如果三、四台服务器之间的网络连接使用万兆交换机,那么,采购成本和管理运维是一个问题。对于那些仅仅需要服务器虚拟化的用户,我们希望把网络的复杂度降下来,从而降低采购和运维成本。”

  由于把万兆交换机省掉,三台服务器之间彼此互连,毫无疑问降低了成本和部署的复杂度,当需要增加服务器节点,可另行再增加交换机。随着规模的增大,如近十台节点,万兆交换机的采购成本和维护、管理成本,对于用户来说,更易接受。

  这一产品是针对中小企业市场的,但中小企业不是小众市场,因为许多数据中心都是从很少的规模开始的。

  最近某厂商的新闻稿上宣称,其超融合平台可以承载包括Oracle RAC和DB2等核心应用,具体情况不详,只是让笔者看到这样一种趋势,超融合的应用范围正在扩大或者说一些厂商在努力扩大超融合的适用范围,从两三台服务器开始,朝着更大规模应用,更多应用类型发展,来势汹汹。

  超融合需要统一存储

  在采访过程中,达沃时代雷迎春博士将参与超融合领域的公司归纳为三类:一类以虚拟机切入,以VMware为代表,充分发挥虚拟化的优势;一类以存储切入,以Nutanix为代表,达沃时代也属于这一类,但与Nutanix的商业发展路线和技术路线有明显区别;最后一类以云管理平台切入,如一些 OpenStack厂商。

  现在随着开源KVM和容器技术的兴起,用户有更多可选择的虚拟化技术,商业虚拟机产品在超融合系统中的权重有所降低,这使得存储在超融合系统的重要性日益凸显。VMware VSAN的高速发展,以及VSAN对容器的拥抱,和Nutanix推出以KVM为核心的虚拟化平台,都在佐证这个潮流。雷迎春表示:现阶段,超融合的关键部分可能还是存储,而对存储的要求,不仅仅是支持虚拟机的运行,还需要支撑虚拟机中的应用对存储资源的使用,换言之,超融合的存储需要具备统一存储的特性,即提供块、文件,甚至对象功能。

  以统一存储为突破口,在众多国产超融合系统厂商中脱颖而出

  超融合需要有核心技术支撑,达沃时代就是这样的一家。达沃时代不仅有自主研发的分布式文件系统,还有分布式块存储和分布式对象存储。其中,分布式文件系统的开发难度较大,不仅要实现块存储的语义,还要实现文件存储的语义。文件系统的最大工作是元数据服务,达沃的元数据服务从最初的主备式,发展为现在的分布式,且对外的元数据操作具有原子语义,使文件系统的Posix接口达到工业标准。

  另外,雷迎春认为,超融合是在一个共享硬件平台上同时运行分布式存储和虚拟机,存储服务和虚拟机不仅竞争系统资源,而且,彼此都是系统的故障点,使得维护整个系统的有效性和数据可靠性,增加了很大的难度。

  很多人都在关注分布式存储,我们看到,开源存储领域非常火的一个项目是Ceph,Ceph也是一个分布式存储系统,是OpenStack生态力足有影响力的存储项目之一。雷迎春对Ceph的发展是看好的,但也指出Ceph的一些不足。类似XSKY这样的公司正在增强Ceph,使其更好地被使用。

  谈到这一问题不由得想起Nutanix宣布推出全闪存的超融合产品这条新闻。用全闪存加速超融合怎么样呢?雷迎春博士介绍说,如果超融合使用全闪存,那么,一个潜在问题是存储服务是否会占用较多的CPU资源。一般地,为充分发挥全闪的性能或提高利用率(如启动去重或压缩特性),存储服务会占用较多的CPU资源,因此,存储服务如果不精心设计,而使得CPU的使用率较高,这样的全闪存对超融合是没有意义的。

  如果存储服务对CPU和内存资源的占用过多,就不太适合超融合了,这种情况下来谈存储的高性能,意义不大。超融合的全闪存部署在一些场景下有明显益处,但是,现阶段的大多数应用场景,混合存储仍是主要的部署形式。

  不久前,360的一位工程师分享的用闪存加速Ceph的议题引起了广泛关注,而今年的闪存峰会上,雷迎春博士将分享达沃在开发超融合过程中经历的技术挑战,同时还会与大家探讨闪存如何高效地应用在超融合系统中,我们还将对这一问题展开讨论。

  超融合的开发难度要显著高于分布式存储的难度。笔者了解到,达沃最近参加了一次厂商主导的测试,在可靠性环节,厂商设置了拔硬盘、拔网络、全部断电的极端情况,其他友商的方案在断电重启后出现虚拟机不能正常启动,而达沃时代顺利通过,展现出对系统可靠性和数据一致性方面的重视。达沃始终认为可靠性才是用户最关心的,性能排在第二位。

  雷迎春博士表示,分布式存储的开发工作已经很难,而超融合的故障点又多于分布式存储,所以,在做超融合时更加谨慎,诚惶诚恐。目前各个厂商对超融合的理解和提供各家的方案都有所不同,达沃也在不断的改变自己,超越自己。


来源:            责任编辑:丹璐
分享到:
0