几款优秀的分布式关系数据库

关系SQL数据库自上世纪80年代以来就有了,以前运行在大型机或单一服务器上。如果想让数据库处理更多数据、运行得更快,只好将数据库放在配备更多更快的CPU、内存和磁盘的更庞大服务器上。换句话说,你求助于纵向扩展性即“向上扩展”。以后,如果你需要能够故障切换以改善可用性,可以将热备用服务器与活动服务器放在同一个“主动-被动”集群中,通常采用共享存储。

需要ACID的四个属性:原子性、一致性、隔离性和持久性,才能确保数据库事务始终有效,即使出现网络分区、电源故障及其他错误。单一服务器上的数据库遵循ACID的全部四个属性比较容易,但针对分布式数据库实施这些属性要难一点。

最近市面上出现了几种“横向扩展”的SQL数据库。更棒的是,其中一些数据库可以处理地理位置分散的服务器,而不牺牲一致性。由于光速带来的限制,边远的服务器节点比本地节点需要更长的时间来更新,但几种技术可以缓解这个问题,包括使用共识组quora和超高速网络及存储。

通常,你一直使用的数据库和想要使用的新分布式数据库应尽可能兼容,尽量降低模式和应用程序转换成本。简单的情况是,你可以迁移模式和数据,然后只需更改应用程序中的连接字符串。复杂的情​​况是,你需要完成数据转换过程,全面重写存储过程和触发器,大范围重写应用程序的数据层,包括SQL查询。


Amazon RDS和Amazon Aurora

Amazon RDS(关系数据库服务)这种Web服务让用户更容易在云端安装、操作和扩展关系数据库。Amazon RDS支持MySQL、MariaDB、PostgreSQL、Oracle Database和微软SQL Server。

可以使用面向故障切换的同步辅助实例来配置Amazon RDS数据库,以实现高可用性。遗憾的是,你无法从备用辅助实例中读取。可以使用MySQL、MariaDB或PostgreSQL Read Replicas来加强读取扩展,但复制是异步的,因此副本的状态可能落后于主实例的状态。

Amazon Aurora是Amazon RDS中的一项服务,可在快速分布式存储上提供高性能的MySQL和PostgreSQL数据库集群。你可以在数据库集群中最多创建15个Aurora Replicas以支持只读查询,可以在多个可用区(AZ)中创建副本,以实现全局分布。

据亚马逊声称,Aurora可以提供最多五倍于MySQL的吞吐量,最多三倍于PostgreSQL的吞吐量,无需更改大多数现有应用程序。亚马逊还声称更新Aurora读取副本的延迟时间约20毫秒,这比MySQL读取副本快得多。

Azure SQL Database

Azure SQL Database是一种全面托管的关系云数据库服务,提供广泛的SQL Server引擎兼容性,让你可以动态增减数据库资源。Azure SQL Database包括创建活动地理副本的选项,这些地理副本是地理位置分散的辅助数据库。

在相同或不同的区域支持最多四个辅助数据库,辅助数据库还可用于只读查询。如果你需要将主数据库故障切换到其中一个辅助数据库,可以手动或通过API执行此操作。

ClustrixDB

ClustrixDB现归MariaDB所有,这个横向扩展的集群关系HTAP(混合事务/分析处理)数据库采用无共享架构设计。ClustrixDB主要与MySQL和MariaDB兼容。我测评ClustrixDB时,该产品不支持空间扩展类型和全文搜索;上一个版本仍缺乏这两项功能。

为ClustrixDB添加节点可以扩展读写。ClustrixDB允许集群跨多个区域部署,以便在非计划区域故障期间提供容错功能。在独立实验室(但不是《InfoWorld》)运行的测试)中,ClustrixDB能够以15毫秒的延迟每秒处理4万个事务,其负载是90%的读取和10%的写入,为其提供了适用于电子商务的“网络星期一”可扩展性。

CockroachDB

CockroachDB是一种可横向扩展、与PostgreSQL兼容的开源分布式SQL数据库,由熟悉Google Cloud Spanner的前谷歌员工开发。CockroachDB借鉴了Spanner的数据存储系统设计,并使用Raft算法在其节点之间达成共识。CockroachDB不需要GPS和同步Spanner的原子钟。

CockroachDB立足于事务性一致性的键值存储系统RocksDB上。CockroachDB背后的主要设计目标是支持ACID事务、横向扩展性和(最重要的)生存性,因此得名。CockroachDB默认使用可序列化隔离模式,这胜过其他大多数数据库实施的隔离机制。

我在2018年初测试CockroachDB时,其JOIN性能不是很好。从那以后,这点已得到解决。CockroachDB支持将集群分散在多个可用区上,还在谷歌云平台和AWS上提供全面托管的云数据库集群。

Google Cloud Spanner

Google Cloud Spanner是一种托管分布式数据库,拥有NoSQL数据库的可扩展性,同时保留了SQL兼容性、关系模式、ACID事务和外部一致性。Spanner看起来像是颠覆了CAP定理。

Spanner是分片、全局分布、复制的,使用Paxos算法在节点之间达成共识。Spanner使用分两个阶段的提交以确保强一致性,但将Paxos组视为事务的成员。每个Paxos组只需要额定数(quorum),而不是需要100%的成员。

在谷歌内部使用时,Spanner的可用性超过五个9,即高于99.999%,这意味着每年停机时间不到5分钟。这足以让大多数程序员通常不必为编写代码来处理Spanner可用性故障而操心。

Spanner使用Google Common SQL,这是ANSI 2011 SQL的一种方言。Common SQL与PostgreSQL、MySQL、SQL Server或Oracle Database使用的任何SQL方言都不完全相同,数据类型略有不同,数据操纵方面大不相同。

天下数据是国内屈指可数的拥有多处海外自建机房的新型IDC服务商,被业界公认为“中国IDC行业首选品牌”。

天下数据与全球近120多个国家顶级机房直接合作,提供包括香港、美国、韩国、日本、台湾、新加坡、荷兰、法国、英国、德国、埃及、南非、巴西、印度、越南等国家和地区的服务器、云服务器的租用服务,需要的请联系天下数据客服!

除提供传统的IDC产品外,天下数据的主要职责是为大中型企业提供更精细、安全、满足个性需求的定制化服务器解决方案,特别是在直销、金融、视频、流媒体、游戏、电子商务、区块链、快消、物联网、大数据等诸多行业,为广大客户解决服务器租用中遇到的各种问题。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();