高可用性指标说明及容灾的几个衡量指标

很多朋友对高可用可能就只停留在一些基础概念,没有深入的了解,例如5条9代表什么意思可能都没什么概念,今天分享一篇之前整理的HA,带大家入个门。

高可用性(HighAvailability简称HA)多被定义为IT系统的运营综合指标,其体现形式就是一个多个九的百分数,表征IT系统运营的稳定可靠程度,越靠近100%,就表明系统约稳定可靠,当然这种稳定与可靠需诸多方面的努力才能获得,例如应用程序结构设计、IT系统冗余架构、灾备机制、环境基础(水、电、空、火、间)、设备质量以及精细化运维管理,几乎缺一不可,那么HA的百分数,具体表示什么意思呢?

最直接的解释就是表明1年时间内允许中断服务(运营)的时间,具体的算法如下:

T=365*24*60*(1-HA)单位:分钟

网站可用性

所谓网站可用性(availability)也即网站正常运行时间的百分比,业界用N个9来量化可用性,最常说的就是类似“4个9(也就是99.99%)”的可用性。

描述通俗叫法可用性级别(HA)年度停机时间基本可用性2个999%87.6小时较高可用性3个999.9%8.8小时具有故障自动恢复能力的可用性4个999.99%53分钟极高可用性5个999.999%5分钟

容灾恢复能力的关键指标

RPO:(RecoveryPointObejective,恢复点目标)是指业务系统所允许的在灾难过程中的最大数据丢失量,用来衡量容灾系统的数据冗余备份能力。

RTO:(RecoveryTimeObjective,恢复时间目标)是指信息系统从灾难状态恢复到可运行状态所需的时间,用来衡量容灾系统的业务恢复能力。

我国的国家标准《GB20988-2007-T信息安全技术信息系统灾难恢复规范》对灾备数据中心根据RPO与RTO两项指标分成了6个相应的等级,如下所示:

总结

关于高可用的更重要的是怎么去做一个高可用方案,例如weblogic做集群实际上体现的就是一个高可用、LVS+nginx也是高可用、oracle做rac等等体现的都是高可用的思想,大家后面可以尝试下自己搭建。篇幅有限,只能写到这了~

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();