《专家观察 | 王李明:“一步上云:FlexHCS定义新型数据中心”》要点:
本文介绍了专家观察 | 王李明:“一步上云:FlexHCS定义新型数据中心”,希望对您有用。如果有疑问,可以联系我们。
由工业和信息化部指导,中国信息通信研究院主办,业界知名组织云计算开源产业联盟(OSCAR)承办的2017全球云计算开源大会于4月19日-20日在北京国家会议中心顺利召开.本文为本届大会嘉宾分享的PPT内容,敬请浏览.
嘉宾介绍:王李明
公司职务:赛特斯信息科技股份有限公司云基础平台产品线研发部高级架构师
大会演讲速记
各位领导、各位来宾,大家下午好.我是来自赛特斯信息科技的王李明,我今天跟大家分享的题目是“一步上云:FlexHCS定义新型数据中心”.
大家看到这个题目可能会有几个疑问,第一个问题大家会问FlexHCS是什么东西?以及什么是一步上云?我们FlexHCS是怎么定义新型数据中心的?这几个问题我今天可能会主要跟大家来讨论这三个主要问题.
第一个问题我说一下我们的公司背景,赛特斯原来是做网络的,刚开始的时候有智慧城市、网络监控软件层面的网络产品.
在2010年的时候公司开始转型做SDN+Openstack方面,转型到SDN+Openstack有很大的优势,而且这也是一个趋势.
在2010年转型SDN以后,大概是在2012年的时候,因为我们发现SDN其实跟云也可以很好的结合起来,我们公司就开始把我们SDN产品跟云去进行结合,也就是我们引入了SDN的产品形态.FlexHCS这个发展比较迅猛,我们公司又开始做跟FlexHCS相关的东西.我们公司曾经研发出世界上第一个运营商级别,大家可以到我们官网看一下,我们是世界第一家作出的产品.
我今天跟大家更多讨论的是我们的FlexHCS,我们公司是做SDN的私有云产品,私有云产品大家的感觉应该是可能需要很多的网络设备、很多服务器才拥有一个自己的私有云产品.
一般对于中小型企业他可能也根本就没有这么多的资源,但是他又想用到这些云的一些很好的功能.我们公司把我们原来的云平台缩减到一台X86的服务器上,也就是我们的FlexHCS,也就是我们的超融合产品.我们的FlexHCS可以讲就是我们公司自己独立研发的一个超融合产品.
说到超融合,在座应该很多人都听过这个概念,因为超融合这两年非常的火,有很多厂家也在做.现在讲一下什么是超融合?以及我们为什么要用超融合.我们为什么需要超融合,这是我们公司为什么从原来的做很大的运营商私有云以及很大的IDC的私有云,为什么后面需要做超融合的云平台.
从我这个PPT里面可以看出来,经过不同的时代,我们这个设备会有不同的演进形态.比如说我们在大机时代,这个我们也不再多说了,因为大机时代可能现在用的厂家也不会很多.
当然不能说它没有,它还确实有存在的.更多现在可能是大家用的是独立服务器以及这种计算虚拟化这种形态所用的厂家一般是用比较多的.这两种形态其实都有它的优点也有它的缺点,比如说独立服务器的形态,更多企业买到这个服务器以后通过网络把这些服务器之间相互打通,他就可以灵活的去进行各种管理配置.
但是这种独立服务器也会有它的很多缺点,比如说我们很多企业买了这种服务器以后,他会发现他在服务器上面我去装了几个自己开发的应用.如果这个应用业务量很高的时候,可能还好一些,它的CPU、内存利用率还是可以的.如果它的业务量达不到的时候,你会发现这个服务器上面经常CPU、内存都处于很低的状态,而且长时间处于这样的状态,这对企业就是一种资源的浪费.
这样的话有的时候我们的应用可能还不能铺在一台服务器上,这时候他为了能够部署更多的应用,他还要去买更多的服务器.所以有些服务器他里面资源没有用完,你又要去买新的服务器,说白了这更是一种浪费.
这时候可能虚拟化就提出来了,更多的代表像VM他做了计算虚拟化.他可以实现我们一台物理机上面虚拟出很多虚拟机,这个大家也都比较清楚了.这种虚拟机相当于可以从一台物理机上面可以衍生出很多独立的物理机,里面各种架构和物理机都是相似的.
这种形态存在之后,也会有一些问题.我们虽然有一种虚拟机存在了,但是我的虚拟机里面的数据要保存在哪个地方,还是要保存在存储里面.我们的存储要保存在哪个地方?简单来讲就保存物理机上面,物理机存储不是无限的,可能要买磁阵.计算和存储是分离的,我的计算可以在物理机上跑,还要专门买额外的存储设备.这时候的存储设备需要更好的管理系统.
这时候我们能不能把这个计算和存储合在一起呢?后面到了这时候我们提出了计算与存储融合,也就是我们现在说的超融合.
我们现在公司做的不仅可以做到计算与存储融合,还可以把计算、存储、网络三个融合在一起,甚至你可以两两融合在一起.比如你把计算和存储融合或者是计算跟网络融合都可以.这是我们大概分析了一下我们为什么提出超融合这个原因.
下面还有市场对超融合产品的一些关注点.排在首先就是成本,因为像刚才我们分析了说如果你单买服务器不用超融合的时候,这个成本和我们现在的超融合的成本是有很大的差距.所以第一考虑就是成本,你用了超融合,也就是说企业更多的考虑我用了超融合,我的成本节约多少.我们做这个产品的时候,首先也是把这个排在重点,我们能为企业节约多少成本.
第二不仅需要节约成本,还要提供高可用性.我们上了超融合产品以后,我们的应用不可能说经常没事就会挂掉,这是用户也不能接受的.因为你这个成本再低,服务不可用,也是不能当做一个产品来卖.
第三我们考虑的是性能以及扩容.超融合有一个好处是什么意思?相对重型企业才开始的时候他的服务器不是很多,后面随着他的业务量慢慢增加,他会发现他需要买更多的机器.他这个云平台虚拟的数据中心需要加进来,和我们原来已经存的服务器能够对接起来,把自己的搭建的超融合里面的节点能够很容易的横向扩展.所以这个横向扩展,也是我们要考虑的一个方面.
最后可能还有数据备份,因为存储安全是大家都比较关心的.
其他的几个我们大概就不列举了,主要我们可以看出来这里面用户更多关注是成本以及可靠性以及灵活性.
超融合现在有这么多厂家做它,以及为什么这个时候我们能把它做出来.其实也是有一定的原因的,因为现在硬件资源以及网络它的速度以及硬件的性能已经可以达到我们可以用一台X86服务器可以把网络存储全部在台服务器上去实现.
早些年这个概念能提出来,他也实现不了.因为早些年一台这种X86服务器上面可能它的性能以及我们外面的网络的速率,他也根本不可能允许我们在一台服务器上能把这个计算、网络、存储全部实现掉.现在硬件和网速上面都能满足我们,我们现在的超融合也是可以去把它给做出来的.
还有虚拟化和云计算,因为云计算也经过这几年的发展,他也已经相当于是可以到了一个商务阶段,也有很多厂家开始在上云计算的东西.所以云计算这个技术的成熟也标示着我们可以把超融合的产品能做出来.
这是我们超融合里面一些定义,超融合大概需要哪些东西.
第一我们是天然耦合,什么意思?我们可以把这个计算、网络、存储它们几个全部合在一台物理机上面.我举个比较形象的例子,公司可能原来你还要去买一个很贵的存储设备,你还要去再买一个很贵的网络设备,你还要去再买一个很贵的服务器设备,这样才把网络、计算、存储全部给聚齐,你才去部署你的应用.
但是我们现在如果用了我们的超融合,我们可以不用这么费事,可以买了一台X86服务器,当然网络的资源你还要是买,但是不会像你原来那样买一个很贵的交换机或者是很贵的路由器,你可能只需要一个成本很低的交换机就可以实现你们企业想要的私有云出来.这个X86里面会聚集计算、网络、存储.像我刚才讲的它可以两两以上组合.
还有NoSAN,你原来还去买很贵的存储设备,现在就不需要了,如果用到超融合产品,你的存储设备就彻底不要买了.你的网络设备可能还要去买,但是如果你超融合之后,存储设备就彻底不用买了.因为我们在X86上面装了我们的存储软件以后,我们可以给你提供类似SAN设备的存储系统.
还有软硬结合,这个好处相当于原来我们厂商直接卖给你一个X86服务器,上面不会有软件,你自己装操作系统,自己装一些应用.如果用了我们的超融合,可以一体机的形式交付给你.
你如果想要一个超融合的产品,我可以把我的一体机抬到你那边去,这里已经装好我们现成的超融合软件,可以在里面包含我们说的计算、存储、网络组件,你把服务器开启,在浏览器上简单配置一下,这样一个X86服务器立刻变成一个虚拟交换机,就变成了一个虚拟的存储设备,就变成了虚拟机的管理器,你就可以把它当成一个我们说的SAN设备挂给其他服务器去用,可以把它当成一个我们起虚拟机的一个管理系统,去创建它的虚拟机.
最后就是虚拟化,我们就不多说了,因为这里面计算虚拟化、存储虚拟化和网络虚拟化是我们做超融合里面必须的这几个技术.
我刚才说了一下我们为什么需要超融合,大概讲了一下,我们超融合能够给企业带来哪些价值?我下面稍微讲一下.我们的这个超融合产品能够给我们企业带来什么价值?
这个PPT里有两张图,主要是描述了一个我们传统数据中心的构建,传统数据中心构建要有服务器、交换机还有SAN设备和NAS设备,这些东西都是需要自己独立去买的.
如果说用了超融合的产品以后,它就是像类似这种图里面,大量的X86服务器我可以大量的通过硬件,根据自己的实际需求.什么意思?我如果公司规模很大,我可以末多买一些这种服务器然后去做超融合一体机.如果我的规模很小,我可能就买两三台就可以了.按需求的购买.还有SAN设备和NAS设备不需要买了,交换机可以买低成本的交换机.
我刚才讲了一下我们的FlexHCS是什么东西,我再讲我们的一步上云到底是什么意思.和我们怎么去定义数据中心.
这里有几个东西,第一个是我们快速部署和弹性扩展,这个是什么意思?就我们现在的云无论是公有云还是私有云已经到达一个成熟的地步了.这个成熟地步以后我们如果想让这个云让某个企业给搭建起来,还是很困难的事情.
云这个东西牵扯很多技术细节,不仅是软件的问题,还有硬件的问题.这时候我们想能够做出一个产品,能够让一个企业能够很快速的拥有自己的一个云,其实对企业是会很有价值的.这个是我们说的一步上云.
我不会让你的企业再去招聘自己很专职的技术人员把云搭建好、升级好、运维好.而是需要我们这边拥有自己的安装系统,自己的升级系统,自己的运维系统,我会帮你们去做到你们企业里面只需要拿到我们的超融合一体机在浏览器上面进行一键升级和安装以及自动化的运维.我们说快速部署就是为了让企业能够轻松的拥有自己的私有云产品,也就是我们说的一步上云.
说到定义新型的数据中心是什么意思?我们公司提出一个柔性网络以及软件定义的概念,软件定义现在也是很火的一个概念,我们软件定义网络,软件定义存储很多很多这些概念.
我们公司把软件定义的东西全部集中在一个服务器上,我们可以实现这种软件定义的数据中心.大概的意思是什么意思呢?原来你可能一个数据中心,我们大概有50台机器只能给一个企业用.现在不需要了,你可以在你的服务器上面装上我们的超融合产品,装上我们的系统以后,我们可以在所有的服务器之上我们再模拟出来很多很多的虚拟的数据中心.
我们知道数据中心里面,一定会有交换机,所以我们可以给你模拟出虚拟交换机,一定有路由器,我可以给你模拟出虚拟路由器.他一定有服务器,我可以给你模拟出虚拟机.他有防火墙,我可以给你模拟出虚拟防火墙.我们的数据中心的小盒子,小设备可以用软件定义掉.因为软件定义的东西你只要在把底下的物理层面的东西全部给维护好,给网络连通好以后,剩下交给我们的超融合系统,我们的超融合系统会帮你定义出所有你们想要的数据中心里面的各个设备.
还有我们说的云它能为你安装,快速部署以及安装完了之后,后期就会进入维护期了,因为云的维护也是需要很多的专业人员,需要有专业知识才能做.我们是把我们这么多年来对云的一些做维护的一些经验,我们都把它在我们的系统里面进行了展现,进行了保存,把我们经验做成自动化的运维,我们系统可以根据我们原来的经验,把自己原来系统里面出现的问题,我可以自动化的去自动修复掉,不需要运维人员再来干预.
我们说的设备利旧经济环保,说到经济环保可以看出来我们超融合产品可以大量的减少原来服务器和符合SAN设备,我们会减少机房里面更多的这种设备,可以给我们节省更多的能源的消耗,也可以为企业减少更多的购买设备的成本以及聘请这些专业人员的运营成本.
如果我们云平台已经帮你们部署完了以后,它在使用的时候,一定要是确实是可以给企业用的,一定要有这种高可用以及高可靠.这种高可用和高可靠,更多不仅仅体现在我们说的存储设备上.我们说的存储设备高可靠是我们的最低保证.否则你比如说数据都没有保证,我们的虚机数据很快丢掉了,说白了这个高可靠也没有什么谈论的一个地.
我们首先数据的高可靠这块我们是第一个优先考虑的,数据高可靠的基础之上我们又做了一些应用层面的高可用.比如我们的虚拟HA,比如说我们的跟其他的PaaS上合作,做了应用的高可用.
这个图里面我大概说了一下我们的FlexHCS提倡的一步上云,以及软件定义的数据中心大概是怎么实现以及它为我们所带来的一些价值.
这里面应该是我刚才所描述的部分做了一个更详细的说明,第一个我们是在基于X86服务器上的超融合,而且我们是X86服务器没有跟厂家锁定,只要你是X86服务器,我们都是可以支持.
国内很多厂家,浪潮宝德,像华为我们都测试.国外服务器像惠普、戴尔知名厂家我们都测试过.我们数据中心里面所有设备都可以通过虚拟化把它虚拟化掉.比如说防火墙,比如服务器我们有虚拟机,交换机我们有虚拟交换机.还有分布式,这种数据是分布式存储和处理,这是什么意思?
我在上一页讲的,我们首先要保证数据的高可用,所以我们的数据现在全部都是分布式来处理的,每一个用户所产生的数据都用多副本机制实现.当你产生一个数据我们可以在多台服务器上把它进行保存,如果某一台服务器或者某一台服务器上面的硬盘出现故障,我们可以从其他的服务器或者是从其他的磁盘上面把这个数据进行恢复.
云平台也是基于分布式,可以任意进行扩容,有哪一天你发现你的虚拟机建的很多,你的云平台负载有点高了,你可以直接买一个X86服务器,装上我们超融合系统,可以自动注册加入到我们的云平台里面去.
还有自我修复系统就像我刚才说的我们是把我们运维经验会放到我们的平台里来,让它自动运维.以及我们的数据故障隔离以及多副本机制.最后是API驱动,我们考虑到生态方面,我们给其他厂家提供API,其他厂家调动我们的API,和我们的超融合系统进行对接.
我们刚才看了FlexHCS提供的价值,下面介绍一下我们FlexHCS的产品概念以及它的一些架构.
这个图里面首先看到系先有我们传统的X86服务器,很普通的的X86服务器.这个X86服务器我们会把它变成计算、存储和网络功能都具有的一个服务器.这个X86服务器上面会有宿主机的操作系统,这是很常见的一种形式.这也是我们最底层的一个架构,就跟我们原来的普通的X86服务器一样,你买了服务器上面装了客户机的操作系统,宿主机的操作系统.
这上面是我们自己的部分,这部分是我们自己的部分.它是用我们的HCS Server+Agent Docker实现底层容器云平台,实现对容器的编排、调度和管理.
我们为什么用容器?为什么把存储、计算和网络放在台X86服务器的时候,为什么会不产生冲突,我们用了容器的隔离.为什么我们要用容器的隔离?在座有很多人了解容器,我不再详细的去描述了.我们用了容器隔离了这种计算、存储和网络,这样的话这三个功能的组件之间实现了他们在服务器上之间隔离,功能上可以相互引用的.
这个大概是我们的上面写的一个组件,第一个是我们有Docker容器,上面有Agent,是监控这些Docker容器组件的.在容器里面我们会部署我们的云平台,我们的云平台开始进行生命周期管理,在每一个容器里面会起不同的计算组件、网络组件和存储组件.
在这个组件搭建好的基础之上,我们可以开始提供我们的虚拟机创建,云平台这层搭建好基础之上,我们开始提供这个网络功能以及我们的存储功能和我们的计算功能,开始去创建一个这种存储的池子,这个存储池子可以给虚拟机用.我们上面只是画了虚拟机,我们存储池子还可以给服务器用.可以直接把这个服务器当成一个SAN设备,可以把它挂给另外一个X86服务器.它是磁针,可以这样用.
这是我们超融合的大体架构,分为三层,一个是通路服务器层,一个是我们的容器组件管理层,一个是云平台层.然后这个加入几个优势,第一个我们是容器的资源隔离以及它的资源限制,保证计算存储网络在同一台设备上也可以运行稳定以及安全.
因为我们现在如果把这个计算、存储、网络同时放在一台服务器上,他们很有可能会出现比如说抢占资源,比如说会出现引用内存会出现重叠,我们用这个容器功能保证计算、存储、网络在这个服务器上不会出现相互之间的干扰,不会出现他们之间会有一些问题存在.我们利用容器便捷和轻量特性,进行云平台的快速部署和升级.
我们谈到容器的话,很多人会想到容器可以提供很快速的部署以及它的便捷升级.我们确实用了容器很快捷的部署以及它的升级来实现我们云平台本身的快速安装部署以及升级.所以这也是为什么我们说的可以实现一键安装和一键升级,就是用了容器本身自己的特性.
我们针对这个容器自己又开发了一个容器管理系统,容器管理系统可以去管理大量的容器以及对这些容器进行监控,进行负载均衡,进行调度,进行自动化运维,保证云平台的高可用以及高性能.
容器虽然有这么多特征,这么多容器在一起还是需要管理系统,这个管理系统是我们自己开发,我们说的第三点怎么对容器进行负载均衡以及进行管理,这需要额外的工作来做.这个容器管理系统可以保证我们云平台的高可用以及高性能.这是大概介绍一下我们的大概架构以及我们所用到的一些技术.
还有我们这个云也是用了Openstack,我们跟其他的Openstack厂商不同的地方就是我们不仅用了Openstack,我们这里还可以支持SDN.我们Openstack大部分的厂家可能,回用SDN会少一些,不能说没有,也是有人在Openstack+SDN.我们公司才开始做 DN,我们是把Openstack+SDN都融在超融合产品里面.还有我们可以支持很多的Hypervisor和ESXI五和KVM.
下面这个图演示了一下我们超融合里面的一些功能,比如我们在集散方面,我们有虚拟机的高可用,可以实现我们比如说有一个虚拟机某一台服务器上面运行,有可能这个服务器不知道什么原因宕机了,我们可以实现能够自动做迁移,可以迁移到其他物理机上,保证虚拟机的高可用.我们可以实现计算的弹性伸缩,我们可以根据你的自己的业务规模,某一天你的业务量达到很高的时候可以自动在云平台上帮你新建虚拟机,实现虚拟机的扩展.
还有NFV概念在里面,软件定义防火墙,软件定义VPN,还有租户级的QOS,还有可以做到某一个企业可以限制他的网络带宽,还有SDN架构以及VPC.这几个不详细讲了,大家可能也听的比较多了.存储这方面有多负荷安全保证,我们能保证数据可靠性,我们用多副本机制,我们现在其实实现异地灾备我在这里没写.运维方面我们可以实现虚拟机和物理环境的统一监控以及多角色控制以及日志统一管理.平台方面可以做到一键升级微服务架构,无缝对接,实现高可用.
在后面这里面大概说了一下我刚才讲的一些特性在里面.简单易用,就实现了一步上云的东西,当你把它给装好以及升级好了以后,剩下就是后面你怎么让它去运行,运行的时候我们要求稳定可靠.当你运行完了一段时间之后想扩容怎么办,我们还支持水平扩展.三个联合起来它的成本会不会很高,我们又提供这种可控成本.这是我们的安装升级部分做到简单易用.这是我们的运行方面保证它稳定可靠,以及运行了之后要能做到水平扩展,总体成本要能可控.
这是产品形态,多字星系列,可以让你的机柜里面占用空间很少,就能够实现一个2U里面实现四个服务器.这是我们的天蝎系列,整个机柜.还有通用系列就是X86服务器.这里有每个优点,可以看一下.
这是我们一体机的样子.这是我们一体机刚才说的第二个机柜的的一些优点,开放架构无厂商锁定,开箱即用,可以一键安装.还有为了提高节省能源,我们有一些电力和散热模块优化,还有集中供电,也有一些效率提升.
这个大概说明了一下我们怎么把一个X86服务器变成了一个云的这样一个动态的图.因为时间有点赶,我这个图不给大家详细讲了.刚才大概描述基本也就这些东西.
最后可以看一下我们给上海某贸易公司搭建的超融合的一个产品.
当时这个客户是一个贸易公司,因为贸易公司对服务器这些东西懂得不是太多,他们想让我们很快的大概也就是两个星期之内跟他们搭建一个他们能够用的一个私有云出来,所以我们当时给他推荐的方案就是一体机的形式.
我们连硬件和软件一起卖给他,在客户那边他要求我们是两个星期,但实际上我们是三天把他的服务器报过去之后,对他机房里面网络升级都进行了一下改造,实现我们开箱即用,浏览器配了之后.也就是说那个三天里面可能更多的时间是跟他沟通它的网络应该怎么部署,真正去安装的时候可能就是需要几个小时就做完了.这个跟他用的三台服务器里面大概的部署形态.
后是客户的一些收益,可以降低他的成本以及开箱很感谢大家的聆听,谢谢.
文章来自微信公众号:云计算开源产业联盟
转载请注明本页网址:
http://www.vephp.com/jiaocheng/4210.html