获得世界互联网大会领先科技成果,OceanBase是如何炼成的

11月9日,2022 世界互联网领先科技成果在乌镇揭晓。来自中国、俄罗斯、美国、英国、瑞典等国家的近 300 项优秀成果中,15 个技术项目脱颖而出。蚂蚁集团自主研发的原生分布式关系数据库 OceanBase 正是其中之一。这也是蚂蚁集团连续两年,历年来第三次入选世界互联网领先科技成果。

蚂蚁集团副总裁、OceanBase首席科学家阳振坤(左三)出席大会并领奖

作为中国自研数据库,OceanBase十余年来从无到有,并正在努力突破自我,力争弯道超车。如今,OceanBase不仅已承担了蚂蚁集团的全部核心业务,更在工商银行、山东移动、中国石化、江西人社等400多家客户的核心系统得到部署应用,广泛覆盖政务、金融、通信、能源等多个核心支柱领域。

OceanBase勇闯“无人区”

数据库,被誉为“基础软件皇冠上的明珠”。如今,无论是“双11”线上购物、点外卖、存取款还是办公等,都离不开底层数据库的支持。可以说,数据库是一切应用软件运行的基础,是关键的信息基础设施,数据库的安全、稳定、可靠、性能、容量等对国计民生有着根本性的影响。然而,我国这一关键领域却曾一度被国外厂商长期垄断。

由于数据库处在整个IT产业链中处于最基础的位置,替换成本很大。这也是为什么像 IBM、微软这样的后来者也难以取代甲骨文(Oracle)的原因。这就导致数据库变成了一个门槛极高、强者恒强的领域。

然而,时代的发展往往会打破惯例。数字化转型浪潮汹涌而至,发展数字经济已经成为推动经济社会高质量发展的重要驱动力。数字经济和数字化转型对数据库的高并发、大数据量提出了更高的要求,而传统的单机集中式数据库面临成本高、难扩容的瓶颈。对于国产分布式数据库而言,这既是巨大的机遇,更是巨大的挑战。毕竟在此之前,分布式数据库可以说是一个“无人区”,自主研发数据库要从零开始。

说干就干。从2010年开始,OceanBase选择了一条最难的路,勇闯分布式数据库“无人区”。OceanBase创始人阳振坤回忆:“长期的分布式经验让我觉得像Oracle那种单机数据库总会有个尽头。毕竟业务数据量没几个月就要翻一翻,分布式绝对是个机会。”加上从淘宝到支付宝,OceanBase有条件从内部不是特别关键的应用场景开始尝试,一步步地将数据库做到关键系统。

攀登海量数据处理技术高峰

历经无数次的技术升级,OceanBase已经成为原生分布式数据库的执牛耳者。2019年,OceanBase一鸣惊人,在国际事务处理性能委员会(TPC)的TPC-C基准测试中登上榜首。在此之前,TPC-C排行榜长期被甲骨文、IBM和微软等传统数据库和硬件厂商占据。而OceanBase当时的成绩,打破了由美国公司甲骨文(Oracle)保持了9年之久的世界记录,成为首个登顶该榜单的中国数据库产品。

OceanBase分布式数据库已服务金融、政务、智能制造等产业400多客户的数字化升级

如今的OceanBase更在不断超越自我。2021年5月,在最新的数据分析型基准测试(TPC-H)榜单中, OceanBase 以 1526 万 QphH 的性能总分排名 30000GB 第一。这意味着,OceanBase 成为全球唯一在事务处理和数据分析两个领域测试中都获得第一的中国自研分布式数据库。

OceanBase已在功能丰富性、系统安全性、产品易用性上向国际顶尖产品看齐,并具有数据强一致、高可用、高性能、在线扩展、高度兼容SQL标准和主流关系数据库、低成本等特点。经过十余年的自主创新,成果已获授权发明专利202项,申请发明专利314项,软件著作权6项,发表论文9篇,主导和参与国家/行业/团体标准20余项,出版中文专著1部。成果300万行核心代码已基于木兰许可协议并采用OpenCore模式对外开源,致力于构建我国自有产权的数据库产品技术路线和生态体系。

OceanBase的成绩激励了更多人从事我国数据库研发工作,中国数据库市场也在逐渐发展壮大。中国信通院测算,2020年全球数据库市场规模671亿美元,其中,中国数据库市场占全球5.2%,约35亿美元。预计到2025年,全球数据库市场规模将达798亿美元。2025年,中国数据库市场总规模将达到688亿元,年复合增长率(CAGR)23.4%。

让更多企业用得上、用得起好的数据库

近年来,我国高度重视数字经济发展,今年出台的《“十四五”数字经济发展规划》明确要求,加快企业数字化转型升级。2021年,工信部印发《“十四五”信息化和工业化深度融合发展规划》,明确提出加速分布式数据库等产品研发和应用推广。

在政策引导下,如何让更多的企业能用上数据库、用得起数据库,加快应用推广成为OceanBase发力的方向。

今年8月,OceanBase发布4.0版本,推出业内唯一单机分布式一体化数据库,这是中国在数据库领域实现的又一技术突破。

OceanBaseCEO杨冰发布4.0产品“小鱼”

新发布的OceanBase 4.0,打破了分布式技术的不可能,推出业内首个单机分布式一体化数据库,让分布式数据库走向通用。

OceanBase 4.0的特点是既可以像单机数据库一样使用,又拥有分布式数据库无限水平扩展的能力。这种架构让它可以适应从个人小站点到银行核心系统、大型电商网站等各种规模的业务。企业选用后,可以在业务发展不同阶段根据自身特点,灵活满足性价比和高可用的要求,极大地降低了企业使用数据库的门槛。

“OceanBase 4.0单机部署最小支持4核8G。”OceanBase 首席执行官杨冰介绍,目前OceanBase 4.0已经可以运行在如名片一般大小的电脑树莓派开发板上。而且,单机部署同样具备分布式数据库所具备的完整功能。同等硬件条件下,性能超越国外主流数据库MySQL。

与前几个版本相比,OceanBase 4.0在功能和性能方面实现大幅提升:大幅度提升交易处理能力,分析处理能力再上台阶,实现了由全场景向量化能力覆盖,业内率先将故障恢复时间从30秒提升到8秒,引领故障恢复真正进入秒级时代。

本月,OceanBase社区版4.0 Beta(公测)正式亮相,与企业版拥有同等性能,更兼容、更易用,2分钟内即可完成快速部署。这意味着,业内首个兼容MySQL的单机分布式一体化数据库正式上线。

随着数字化、在线化、智能化的演进,企业面临着指数级递增的海量存储需求和挑战,同时企业需要降本增效,进行更好更智能的数据决策。传统的商业数据库已经难以满足和响应快速变化、持续增长的业务诉求。

“中国基础软件行业已经有能力‘根创新’,坚持长期投入,中国数据库必将迎来大爆发。作为一款完全自研的企业级原生分布式数据库,我们希望通过不断地技术创新,为不同类型客户降低企业数据库的使用门槛,助力产业数字化。”杨冰说。

如今,蚂蚁集团也正在持续攻坚包括数据库在内五大重要“根技术”领域,即:隐私计算、区块链、图计算、分布式数据库和绿色计算,以解决数字化发展中的安全可信、协作共识、大规模复杂数据关联分析、存储计算规模爆炸、降低耗能等问题,努力以高水平安全助力数字经济高质量发展。

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章