随着移动支付、生物特征识别、智慧城市、自动驾驶、智能家居、5G网络和物联网等新技术的出现和快速发展,数据生产的越来越多,越来越快,企业对数据存储和处理的要求也越来越多,越来越高。2016年全球数据总量大约是2.5万亿GB,而且每年还以高达60%的速度递增,需要大量的存储空间和存储设备。
2015-2020年全球IP流量CAGR为22%(单位:EB/Month )
为了应对这个问题,少数规模强大财力雄厚的公司采用自建的模式,大多数的公司采用租赁机柜自己部署网络设备和服务器的方案,还有不少公司采用 IaaS 的云服务模式。比较常见的解决方案是采用自建、租赁和云服务的混合模式。因为数据中心的解决方案意味着大量资本的投入,所以选择数据中心的策略就成为 CTO 和运维总监必须认真思考的大问题,它不仅涉及到技术,更多的是考虑是业务和财务。
考虑因素
在建设数据中心时,我们要考虑位置、网络、服务、成本,产品、业务等众多因素。而其中最优先考虑的是哪些因素呢?1、产品成熟度
首先应该是产品,产品的成熟度是确定数据中心策略的最重要因素。当产品不太成熟时,尽可能不要拥有过多资产,而是以云服务为主;当产品的成熟度提高后,增加对数据中心资产所有权的比例,租赁机房和机柜,购买自己的服务器和网络设备;当产品高度成熟之后,可以考虑完全拥有数据中心和设备。产品成熟度与数据中心所有权的具体逻辑关系见下图:
产品成熟度与数据中心解决方案所有权之间的关系2、业务增长率
选择数据中心的第二个重要考虑因素是业务的增长率与设备利用率之间的关系。
当业务快速增长,支撑业务系统的设备利用率很高时,最佳的数据中心解决方案是自建机房。
相反,当业务的增长率很低,支撑业务系统的设备利用率也很低时,尽可能利用云服务。
当业务快速增长,而系统的设备使用率很低时,考虑先使用云服务,然后逐步引进租赁机柜、自购服务器和网络设备。
如果业务增长率很低,而支撑系统的设备利用率却很高时,属于反常的情况,可以考虑用云服务解决。
业务增长率与设备使用率之间的关系
把前面的根据业务确定数据中心选择策略的方法总结成下述判断过程:
3、用户的分布情况
数据中心的位置要尽最大的可能靠近自己所服务的用户。下图是某个服务的用户在9月份的分布情况,可以看到广东地区拥有最大的用户群,其次是江浙地带,因此该服务应该部署在广东或江浙地区。
根据用户的分布情况选择数据中心的位置4、互联网核心节点位置
除了要靠近所服务的用户以外,还要考虑互联网核心节点的分布情况。目前我国的互联网核心节点主要分布在沈阳、北京、西安、南京、上海、武汉、成都和广州八个城市。从这些地区的数据中心可以快速联结到我国的骨干网络,缩短网络延时,最优化网络路径。
数据中心要靠近八大核心节点5、联结三大通信网络
由于我国的移动互联网终端用户分别来自于联通、移动和电信三大运营商,所以提供互联网服务的企业要确保无论用户来自于哪个通信网络,都可以通过最短的路径,直接找到所需要的服务,无需在不同的运营商之间来回交换数据。
6、数据中心的等级
数据中心共分为以下几个等级:
不同等级数据中心的可用性不同。
2001 年 911 事件发生后,金融机构聚集的世贸大厦里大量数据化为乌有,这是对所有金融机构的重大挑战。
德意志银行(Deutsche Bank)早在 1993 年就制订了严谨可行可信的业务连续性计划(BCP)。灾难发生后,德意志银行调动 4000 多名员工及全球分行的资源,短时间内在距离纽约30公里的地方恢复了业务运行,得到了客户和行业的好评。
摩根士丹利(Morgan Stanley)在 25 层办公场所全毁,3000 多员工被迫紧急疏散的情况下,半小时内就在灾备中心建立了第二办公室,第二天就恢复全部业务,可谓金融灾备的典范。
与之相反,纽约银行(Bank of New York)在数据中心全毁,通讯线路中断后,缺乏灾备系统和有力的应急业务恢复计划,在一个月后不得不关闭一些分支机构,数月后破产清盘。
所以数据中心的灾备方案非常重要。灾备数据中心的解决方案要按照特定业务所需要的 RTO(灾难恢复时间目标,业务可以容忍的服务中断事件)和 RPO(灾难恢复数据目标,业务可以容忍的数据损失量)来做具体的设计,并通过定期的演练确保灾难到来时可以有效地恢复业务。7、建设双活或多活数据中心
另外,很多业务,特别是金融、铁路、航空、电力、医疗等行业,对服务可用性的要求非常高。即使第三、四级的数据中心也未必能满足其要求,这就需要设计合理的数据中心解决方案,通过双活甚至多活数据中心来解决更高的可用性要求。下面的两地三中心方案就是一个例子。
对于多活数据中心,除了能提高服务的整体可用性和灾备水平以外,还可以提高数据中心的资源使用率,降低单位交易的成本。
如下面的双活数据中心解决方案允许两个数据中心同时处理服务请求,具体的服务请求由哪个数据中心来处理取决于数据中心流量的分配策略。
我们可以根据用户请求来源的IP地址作为判断的依据,河南、山东、江苏、浙江、安徽的用户请求送到无锡数据中心,广东、广西、福建、海南、江西、湖南的用户请求送到广州数据中心。也可以采用流量的百分比来分配用户请求,如50%的流量送到无锡数据中心,50%的流量送到广州数据中心。
双活数据中心可以有效地提高服务的可用性,如果一个三级数据中心原来的可用性是 99.982%,那么两个双活数据中心的可用性就是:
1 -(1-99.982%)*(1-99.982%)= 99.999%,
即两个数据中心同时失败的机会大大减少,因此可用性大幅度提高。
另外,双数据中心,无论是双活还是主备模式,其方案总成本都是单数据中心的 200%。让我们再研究一下三活数据中心的方案。如果采用三活数据中心的方案,一倍的冗余数据由三个数据中心共同承担,每个数据中心保存 2/3 的数据量,但服务器的数量由 12 台减少为 9 台,即原来的 2/3,总体上该方案的总成本是单数据中心的 166%。
很多人都认为数据中心越多,资源的投入就越大,实际情况并不是这样。由上面的例子可以看出,三活数据中心要比双活数据中心节省更多资源,当然可用性也会更高。
8、其他因素
除了要考虑上面这些因素以外,在选择数据中心时,还要考虑下述这些因素:
总结
总之,数据中心方案的选择是一个复杂的系统工程,需要从业务、位置、软件、硬件、网络、合规、拓扑、人员、服务、可用性、业务连续性、灾备和投入产出等各个方面进行深入的分析、研究和平衡,制订出所有可能的解决方案,并从中找出最佳的解决方案。好消息
易宝 CTO 陈斌翻译的新书《数据即未来》正在京东和当当网同步发售!
| 留言与评论(共有 0 条评论) |