484104223216ef1bcb2eda28ac45425b.gif

54d61143e414fecf41d9ee5d9a4097ea.png

109d7ffb3b8b1d426e3d606cf9771a22.png

《中智观察》第1709篇推送

作者:赵满满

编辑:小宏

编审:杨小天

头图来源:idc快讯

d5c106009e10df0d886584d4793925a5.png

近日,国产数据库企业武汉达梦数据库股份有限公司(达梦数据)拟在科创板上市。如果IPO成功,那么达梦数据将成为国产数据库“第一股”。

国产数据库+自主研发+国产数据库市场占有率第一等标签,为达梦数据披上了“科技自强”的外衣。投资者关心的数据也被一一披露:达梦数据此次发行上市拟募资23.51亿元,估值高达500亿元。

达梦数据2021年的营收7.43亿元,净利3.48亿元。主营业务收入主要来自于数据库管理系统软件及其相关产品、数据及行业解决方案。

消息传出,引发了人们的无限遐想。现在数据库市场迎来新风口,从2021年开始,大批数据库企业获得融资。不过风口对准的不仅仅是传统的关系型数据库及其延伸,而且是能处理非结构化数据的NoSQL数据库或者专用数据库。

此前,国内关系型数据库市场一直被海外巨头Oracle、IBM和Microsoft等所垄断,而传统的国产数据库“四巨头”——达梦数据、人大金仓、南大通用、神舟通用等几十年来一直积极迎战,但市场份额增长有限。

海比研究院认为,在数据库风口再起的时候,达梦数据如果能成功募资,那么毫不疑问会带动国产数据库的发展,也会带动关系型数据库其他几家企业的发展,为信创事业发展注入新的动力。

25b731e1c2bf4e1ed1b0ddfec97bb747.png

自主研发的关系型数据库是达梦数据的看家本领

f6ef6ac80e1e85289862d7694ea411fa.gif

在达梦数据申请IPO的时候,大多数人看到的是500亿的估值,并没有人真正关心其从事的领域。

达梦数据是搞数据库的没错,但是数据库市场其实已经非常庞杂了,正像一份研究报告所言,数据库领域,云原生和分布式技术融合;大数据与数据库一体化,OLAP+OLTP一体化形成HTAP,以及离在线一体化;智能化技术深度融合,Multi-Model多模数据库涌现等。

所以数据库的风口是看技术与产品。那么武汉达梦的核心数据库产品是什么呢?

正像Oracle和人大金仓、南大通用、神舟通用一样,达梦数据库主攻传统的关系型数据库,并牢牢地把握主了HTAP的发展大势。

根据招股书,达梦数据库管理系统(DM)是具有自主知识产权的大型通用关系型数据库,其核心源代码为100%全自主研发,不依赖开源数据库。最新版本DM8。

在技术上,DM采用行列融合存储技术,在支持联机分析处理(OLAP)和联机事务处理(OLTP)业务的同时,可满足混合事务和分析处理(HTAP)应用场景。

在安全上,达梦数据参与制定了国家相关安全标准,是国产数据库安全领域的领导者,产品安全性高,达到等保四级和 EAL4+,具备目前国产数据库的较高安全级别。

性能上,满足全球500强级别大型企业的ERP、财务大集中等大规模信息系统要求。

在应用上,具有高兼容性,支持x86架构等主流软硬件平台,支持SQL标准,以及主流编程语言接口和开发框架,应用迁移成本低。

产业界当前正基于创新的计算存储框架研发HTAP数据库,能够基于同一套引擎,同时支撑业务系统运行和分析决策场景,避免在传统架构中,在线与离线数据库之间大量的数据交互。而达梦数据库的核心产品DM实现HTAP数据库,确实值得称道。

随着企业数据量的不断增大以及数据分布应用的增多,达梦数据也主推了数据库集群。

数据库集群是指利用至少两台或者多台数据库服务器来共同构成一个逻辑上的数据库,其可像单数据库系统一样,向客户端提供透明的数据服务。

达梦数据在大型通用数据库产品的基础上,可针对行业特征和业务场景对数据处理的要求,通过不同的达梦数据库管理系统“拼接”方式,提供多种类的数据库集群形态。

如达梦数据共享集群软件(DMDSC)适用于OLTP密集交易型场景,如金融行业核心生产系统的解决方案,已在银行、保险、证券行业的核心生产系统有大量的实践应用。

达梦大规模并行处理集群软件(DMMPP)适用于OLAP海量数据分析场景,如经侦、刑侦分析等海量数据分析应用,已应用在公安、信用等行业的数据分析与服务平台。

达梦透明分布式集群软件(DMTDD)具备计算与存储分离架构,可实现计算和存储的独立扩展,适用于金融科技、工业互联网、物联网应用。

达梦读写分离集群软件(DMRWC)适用于高并发事务型系统中读多写少场景,适用于办公 OA、网站等以读为主系统,已应用于各地政府党政机关内部OA、信息管理系统、政务网站等平台。

用户可根据业务场景需要,以不同形态组织具有相同内核的达梦数据库管理系统,形成差异化的集群服务,提高系统的性能和可靠性,实现企业级的数据库系统解决方案。

与行业内流行的分布式关系型数据库不同,数据库集群往往是同构的系统,要求集群各节点都具有相同的操作系统和数据库系统版本,甚至补丁包的版本也要求保持一致;而分布式数据库系统可以是异构系统,包含不同的操作系统和不同的数据库系统。

专家介绍,达梦数据库集群软件是达梦数据在市场需求引导下,原始创新的代表性成果。例如共享存储集群属于关系数据库领域的技术皇冠,长期以来仅有Oracle公司推出此类软件产品,并占据我国数据库高端应用市场,形成了技术壁垒。

达梦数据依靠原始创新完成了共享存储集群技术零的突破,并率先推出了商用化国产共享存储集群软件。

在国内数据库市场,不但有达梦数据、人大金仓、南大通用、神舟通用、瀚高为代表的老牌厂商,而且有华为(openGauss、GaussDB)、阿里(OceanBase、PolarDB)、腾讯(TDSQL)等大厂,还有星环科技、TiDB、海量数据(Vastbase)、优炫(UXDB)等初创厂商,也有基于自身业务需求延伸到数据库领域的跨界厂商,如中兴、浪潮、东软、亚信科技等。

但是在商业关系型数据库领域,达梦数据、人大金仓、南大通用、神舟通用的实力与贡献不容小觑,其自研的思路一直都为人称道。同时这些企业是以卖许可证和服务的方式,获得软件收益。

408d5ac7a722a1daf8ee9f96507ce5e6.png

开源的国产数据库的竞争力何在?

fc1c29cb9d830e79ba0abc136fcfdec9.gif

伴随着商业数据库市场发展所形成的巨大许可成本压力,开源数据库因倡导群策群力、免费应用而日益壮大。

根据DB-Engines相关统计数据,目前商业数据库与开源数据库所占的市场份额日渐趋近对半分的成度,分别接近50%的份额。

开源数据库不但对商业数据库的市场地位提出挑战,而且也把数据库应用的成本降下来了,让更多的企业能够用得起数据库。如果用户的技术力量够强,可以使用这些免费的开源数据库产品。

开源数据库以MySQL、PostgreSQL为代表,通过全球化的开源社区形成强大生态,并孵化出诸多商业数据库发行版产品。

墨天轮《国产数据库流行度排行榜》所收录的数据库就多达189款(2021年12月)。多数国产数据库产品是基于PostgreSQL、 MySQL两大开源流派衍生而来,较为分散。

另外,云计算时代下新场景对数据库提出了新的需求,华为、阿里、腾讯等厂商基于自身云生态,推出了大量数据库产品并开源。openGauss、TiDB、OceanBase 等数据库源代码已对外开放,合作伙伴可在此基础上发行属于自己的商业版数据库。

例如,2021年,阿里云正式宣布开源 PolarDB for PostgreSQL 分布式版,包括数据库内核、相关插件、工具脚本、测试用例以及设计文档,适用于中大型企业核心业务场景。

PolarDB针对不同的数据库协议开发了不同的兼容版本,包括兼容MySQL、PostgreSQL和Oracle的版本,及每个版本的分布式形态。这次开源的是兼容PostgreSQL的PolarDB数据库分布式版。

蚂蚁集团自研数据库产品OceanBase开源。OceanBase是蚂蚁集团完全自主研发的应用于金融核心业务的分布式关系型数据库,诞生于2010年,2017年开始对外输出技术服务,2020年6月,OceanBase正式独立进行公司化运作。


腾讯云自主研发的分布式数据库引擎TDSQL PG版从2019年正式开源(开源代号TBase)开始,依托社区,在经过内部业务系统的实践检验后,基本保持每月一次小型升级、每半年一次重大升级的节奏,助力众多开发者应用前沿数据库技术,推动开源社区生态不断完善。

今年,TDSQL PG版重磅升级,是一款具备HTAP能力、经过腾讯多年持续投入研发的数据库产品,能够提供成熟的一站式解决方案。开源不久,就受到了欧洲航天局、国家天文台,以及医疗健康、零售等各个行业用户的青睐。

 2019年9月,华为宣布开源其数据库产品,开源后命名为 openGauss,并于2020年 6月30日正式开放源代码。内核源自PostgreSQL。

openGauss 是一款开源关系型数据库,是全球首款AI-Native数据库,也是业界首个支持ARM架构的企业级数据库,能够同时支持x86、ARM、GPU、NPU等异构计算。

相对于本地部署的数据库,数据库上云成为另一大发展趋势。

随着互联网时代流量的剧增,企业对数据库的要求也在不断提升,完全为云打造的数据库才能更好地满足业务快速增长的需求。于是,云厂商撕裂了传统商业数据库固若金汤的防线,将云原生数据库带入了IT行业。

云原生数据库代表着未来,Gartner 预测,到2023年,全球3/4的数据库都会跑在云上。

云原生数据库的核心理念就是利用云计算的本质,运用虚拟化的技术,将数据库的核心资源进行池化,以此解决资源弹性、高可用的挑战。同时,通过存储与计算分离与解耦,灵活弹性地满足客户业务需求。

云服务商提供的数据库服务在成本上大大低于商业数据库,性能上也得到了优化,同时降低了用户使用的门槛,用户只需专注于业务,维护等技术工作交给云服务商就可以了。

在国内,用户的数十万的Oracle数据库的数据被迁移到更多云数据库。云数据库拥有了上百万的用户。

阿里云、腾讯云、华为云成为新一波国产数据库的典型代表。根据Gartner 数据,阿里云排名中国数据库行业第一,腾讯云和华为云也进入了其象限。

除了智能化的企业级云数据服务RDS之外,阿里云还自研了面向不同核心应用场景的云数据库产品,形成了以PolarDB、AnalyticDB、Lindorm为核心的面向在线交易处理、分析与多模、HTAP、物联网等不同场景的云数据库产品矩阵。

93f0cba0f4c6af9716c35d5dd757cb10.png

非关系型数据库自主研发的出路在哪儿?

d3a37b9d6e02575d0f393bc4f6fd110f.gif

数据库通常分为关系型数据库管理系统和非结构化和/或特殊应用数据库。

关系型数据库是主流的数据库产品。根据艾瑞咨询统计,中国市场中约90%的数据库是关系型数据库。尤其在金融和电信行业,数据库系统需要支撑大量涉账业务,对于业务连续性、安全性、数据一致性要求极高,所以主要应用以关系型数据库为主。

DB-Engines列出了395种不同的数据库管理系统中,关系型数据库占比最高,如图1所示。

cd93a8e2f6780172517bcb23c8ef9baa.png

图1 DB-Engines不同数据模型数据库的数量统计

尽管关系数据库仍然必不可少,但在当今世界,仅有“关系型”数据模型,显然无法适应发展的需求。

显然非关系型数据库迅速发展。据中国信通院统计分析,截止2021年6月,我国数据库产品共有135款,其中关系型数据库81个,非关系型数据库有54个,占比分别为60%和40%。

非关系型NoSQL数据库(也称为“no SQL”或“not only SQL”)包括键值型、文档型、图、时序、空间等不同的类型。

NoSQL数据库是一种分布式非关系数据库,专为跨许多商用系统的大规模数据存储和大规模并行、高性能数据处理而设计。与传统的关系数据库方法不同,NoSQL数据库提供了一种更靠近应用位置的处理数据的方法。

NoSQL数据库是为特定的数据模型构建的,并且具有灵活的架构,允许程序员创建和管理现代应用程序。

与SQL数据库不同,NoSQL数据库系统最初是作为开源开发的,几乎所有这些数据库系统现在都有一个可用的企业选项。

DB-Engines调查显示了395种数据库中每类别的受欢迎程度。如图2所示。

9a8a4f5335a7dc30afcff56afd24ecf3.png

图2 DB-Engines不同数据库模型数据库的收欢迎程度

达梦数据投资的公司就推出了NoSQL数据库——蜀天梦图数据库。图数据库主要应用于海量数据环境下深层关系网络挖掘和关系图谱展现场景,是一种主要应用于大数据分析领域的新型数据库。

蜀天梦图数据库是具有自主知识产权的分布式图数据库管理系统,其采用计算和存储分离的分布式架构,多节点并行计算,利用 PageRank、最短路径、三角计数、杰卡德相似度、环路检测等多种图算法,实现大图、超大图的高性能图算。

蜀天梦图数据库适合应用于通联数据、金融数据、人物关系等线索分析,可广泛应用于银行反欺诈,金融风控,制造业供应链管理,互联网社交,智慧交通等领域。

为具体的工作选择正确的工具。在一些特殊的场景,开发人员必须选用许多新兴的专用数据库模型。

为响应客户的需求,AWS提供了针对特定工作负载和访问模式而优化的各种专用数据库。目前,AWS 拥有15个数据库引擎,未来还会不断增加,能够提供最齐全的商业级专用数据库。

除了3大关系型数据库外,AWS专用数据库包括键值数据库WS Amazon DynamoDB,兼容MongoDB的文档数据库Amazon DocumentDB,Amazon ElastiCache内存数据库,快速、可靠且完全托管的图形数据库服务Amazon Neptune,一种快速、可扩展且完全托管的时间序列数据库服务Amazon Timestream,分类账数据库Amazon Quantum Ledger Database (QLDB) 等。

目前,不同的云服务商,包括微软、谷歌云、阿里云、腾讯云等都开始提供多种数据库服务。

e52629bf0217236471839195d66e6191.png

 图片来源:redis.com

除了云服务商外,开源的NoSQL数据库也开始走向商业化。如MongoDB等,其商业没道路也比较成功。

自研的NoSQL数据库企业也可是涌现,如在图数据库方面,中国就出现不少自研的企业。

目前来看NoSQL数据库的优势包括高扩展性、分布式计算、成本更低、架构灵活性、非结构化/半结构化数据、没有复杂的关系等。

在NoSQL的土地上,并非一切都是阳光和彩虹。但NoSQL有一个非常光明的未来,但是NoSQL还有很长的路要走。

e4d541d9446ba1afaba3613de93b71f0.png

国产数据库自主研发当自强

9f49e9ea62221662fce2ad9f47895043.gif

数据库被誉为“基础软件皇冠上的明珠”,数据库市场空间巨大,有望开启千亿市场。

中国信通院报告显示,2021年,全球数据库市场规模为697亿美元,中国数据库市场规模为47亿美元,占比5.2%。

其中中国公有云和本地部署的数据库市场规模分布为144.59亿元和161.19亿元,增速分别是34.3%和21.0%。

预计到2025 年,全球数据库市场规模将达到798亿美元,中国数据库市场总规模将达到688 亿元人民币(占全球约 12.3%),市场年复合增长率为 23.4%。

海比研究院认为,现在进入国产数据库市场的厂商越来越多,可以说是百花齐放。同时现在国产数据库实际上是一个红海市场,找准自己的定位非常关键。

信通院的报告认为,从产业角度看,宏观政策利好推动了存量数据库市场上行,我国数据库产业进入蓬勃发展的初期,产品供应商、服务提供商、支撑产业从业者均积极行动,各自发挥技术、渠道、运营等优势,寻求对于自身最优的发展路径。

完全自主研发的道路是一条切实可行的途径。自主研发的国产数据库才是中国数据库市场的良心,才是根基。而达梦数据库最大的一个特点就是从41年前做数据库开始便一直坚持自主研发。“从41多年前开始,达梦数据就选择了自主研发这样一条比较艰难,但是现在看来更有先见之明的道路。所有的源代码和核心技术都完全掌握在自己手里,从根本上保证了系统的安全性。”

在信创方面,中国必须要构建自己的基础软件,包括整个IT生态的构建。通过不断加强与产业链上下游合作伙伴的携手共赢,达梦正在逐渐构建一个独立自主的国产基础软硬件生态。

另一方面将云基础设施与开源结合,是数据库发展另一条途径。云基础设施的发展成熟将接近一半的传统数据库市场转移到了线上,云计算企业利用既有基础设施优势,成为最大获益者。

当前数据库的技术起点已经处于一个较高且成熟的水平,开源社区也打破了技术垄断,国产厂商得以站在前人的肩膀上谋发展。 依靠开源发展国产数据库可以做大做强国产数据库,特别是在NoSQL新型数据库方面。

另外,抓住数据库技术发展趋势,不管是开源还是自研,或者两者结合,也是发展国产数据库的一条途径。在这方面,HTAP数据库、多模数据库、图数据库、时序数据库等存在机会,而事在人为。

这也为什么数据库再次成为风口,吸引更多投资的主要原因。


科技媒体·企业演化科学·战略托管综合体

本文作者系赵满满

寻求报道,以及对相关话题感兴趣,请评论区留言

Logo

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。

更多推荐