随着云计算业务的快速发展,国内外云计算企业的专利之争也愈发激烈。在云计算这样的技术领域,专利储备往往代表着企业新的技术实力。华云数据本期“智汇华云”专栏将针对“秒级可用助力企业业务快速伸缩”技术,与大家共同分享云计算领域的新技术。
随着企业上云的步伐越来越快,公/私有云承载的业务量的爆发式增长,越来越多的企业用户深刻认识到在云端快速部署应用并迅速提供服务的重要性,尤其是关键业务如何能够快速部署一直困扰着企业用户。也因此云平台虚拟机开通时间甚至是批量开通时间成为云平台的一个重要性能指标。华云数据在私有云的客户实践中发现几乎所有的客户均将此需求作为关键指标之一。
有人说容器技术可以使云平台主机秒级启动迅速提供服务,这是虚拟机技术之前无法做到的,尤其对于弹性伸缩这个场景下。但当业务量陡然增长如果后端响应时间过长很容易产生DoS,甚至是虚拟机扛不住压力直接内核calltrace和宕机。
我们的方案
华云数据基于多年来的自主研发能力,大规模云平台运营经验以及面向性能、网络等关键领域的创新研究,对云平台主机启用时间进行创新改造,以下(图1)是整个虚拟机开通过程(当触发scale out动作后开始批量创建虚拟机的流程类似):
图1 云平台主机创建流程
云平台主机1s响应,快速应对流量高峰
T1即为云平台创建开始返回运行态的时间;T2是虚拟机从PowerOn到可以提供服务的时间,这部分时间是被大家饱受诟病的,也是难以与容器竞争的痛点。
华云数据基础平台团队通过对libvirt和KVM的深度定制以及在OpenStack这一层的定制化,让T2这部分时间缩短在1s左右达到可以登录状态(login,即便在有图形界面的情况下),大大缩短用户开通虚机所需要的时间,尤其在需要秒级计费的场景,时间就显得尤为重要。
重要的场景莫过于弹性伸缩,例如在电商促销节日618或者双11阶段,如果伸缩缓慢会造成拒绝服务,甚至严重的压力得不到快速缓解而造成系统宕机。但是使用该技术后将大大降低伸缩时间,提前响应,降低高峰值,减少不必要的风险,同时也降低成本。
以下是一组测试:
图2
第一轮是测试带图形界面的CentOS7从创建到可以登录的时间,如图2所示,在此场景下,普通VM耗费时间将近是秒级可用的10倍。
第二轮仅仅测试LB后端从0到1,HTTP服务最快正常工作时间,图中单位为秒,包括从触发伸缩到调度到启动系统、启动HTTP服务并提供服务的时间。不同的操作系统及配置时间可能会有差异,下图是CentOS7在同等配置下的时间对比图:
图3
由图二可以看出,这种场景下可服务时间足足降低了11s左右,普通云主机是秒级可用技术下的1.4倍。
第三轮测试是后端从1个VM伸缩到2个VM提供服务,后端VM的CPU使用率对比图,如图4,红色的为秒级可用虚拟机负载,蓝色为普通虚拟机负载,在同一时间分两组加压对比,创建VM(启动qemu)时间几乎都是10:42:21,秒级可用VM在10:42:52左右开始明显下降,而普通VM则是在10:43:01左右开始下降,足足提前了9s左右,这还只是在简单的HTTP服务,如果遇到大型服务尤其是启动耗时的服务将更占优势。
图4
由此可见云平台主机秒级可用技术确实可以大大缩短用户伸缩时间,降低运营风险(Dos和系统承压),同时快速消除峰值持续时间,为用户带来巨大的价值。该项技术仅华云数据独家所有,在OpenStack波士顿峰会上与来自世界各地的嘉宾进行分享交流。同时,该技术发明已经在华云数据数十客户的云平台环境中应用,助力客户业务进行灵活的资源调度并答复提升业务速度,有效降低IT资源使用成本,保证业务平稳健康运行,获得了客户的高度认可。