新闻资讯

热点事件

实时资讯

东方国信CirroData:行走在数据库百花齐放时代

  • - 2021 -
  • 03/12
  • 00:00
  • — 分享 —
CirroData

芯片、操作系统、数据库是现代信息技术领域的三大核心基础,其中,数据库是数据存取、管理和应用的核心工具。


随着科技自立自强成为国家发展的战略支撑,国产数据库迎来了百花齐放、百家争鸣的时代,机遇与挑战并存。


前不久,东方国信CirroData数据库研发中心总经理金正皓接受IT168专访,分享国产数据库技术的发展趋势,并介绍了东方国信自主研发的CirroData数据库。


国产数据库:从“跟随”到“替代”


数据库作为基础软件三大件之一,在我国的发展大致经历了四个阶段。

 

2000年前后,我国数据库发展处在对国外领先数据库的跟随阶段。当时国内数据库技术比国外落后很多,国外数据库成熟的产品、成熟的客户、成熟的使用案例都是国内跟随者所不具备的,只集中在OLTP场景下,通过国家的扶持,商业环境比较艰难,是国产数据库技术的拓荒者。

 

2009年前后,针对数据仓库领域的MPP数据库技术蓬勃发展,国产MPP数据库领域与国外同类产品的技术差距逐渐缩小,同时国内客户对国产MPP的接受度逐渐提升。这个阶段MPP数据库主要应用在非核心业务场景,客户对系统可靠性、稳定性接受度较好。国产MPP数据库在数据仓库领域得到了较大的发展。

 

2010-2020年,信息技术迎来大爆发,在大数据、互联网、开源等技术的发展推动下,已有数据库技术无法满足国内企业应用场景的规模和性能等需求,随着国内技术人员对数据库内核相关技术掌握越来越深入和全面,CirroData高性能分布式数据库应运而生。东方国信没有采用基于开源数据库进行改造的开发路线,而是通过自主研发,将CirroData打造为完全自主知识产权的国产数据库。

 

现在,随着国家对自主可控的需求不断提高,国产数据库百花齐放,迎来更大的发展机遇。一些重大的核心业务系统已经开始逐步向国产数据库迁移。


金正皓认为,国产数据库从早期的跟随到替代国外产品,未来一定会在数据库行业出现局部的领先,最终走向全面的突破。


CirroData:分布式云化架构支撑新时代需求


东方国信是国内较早做商务智能(BI)的综合大数据公司,2002年就开始参与电信行业和金融行业的数据仓库建设。2011年上市,同期开始了CirroData数据库的自研之路。

在为电信行业和金融行业构建数据仓库的过程中,业务量和复杂程度的不断进阶,东方国信越来越感觉到集中式数据库和MPP数据库都不足以满足其需求,定位为分布式云化数据库的CirroData能有效解决这些问题。

早期电信领域企业数据仓库项目的架构中,设计了大量的多维立方体模型,用于支撑报表和多维分析。随着时间的进展,大量立方体很少被使用,但是这些立方体的仍然被定期加工,浪费了存储和计算资源。粗略统计有60%到80%立方体被废弃。CirroData具备高性能统计分析的能力,可以基于明细数据快速生成相关分析数据,支撑全维度全指标的即席分析,很大程度上替代了原有的多维立方体,释放了存储和算力。

2016年,CirroData已经能够支持存储计算分离架构,为下一代云原生架构提供了底层技术支撑,并持续解决算力、存储的共享和隔离问题;2018年是CirroData发展的重要节点,当时基于电信运营商大规模数据集中的IT架构体系考虑,提出了逻辑集中、物理分散的大规模跨地域数据中心架构。

经过多年的发展,CirroData已经成为一个产品家族,包含了OLAP和OLTP产品和HTAP产品,跨域多数据中心平台(Multi-data Center,MDC)产品,时序数据库、图数据库等,目前在OLAP场景比较成熟,已经在全国二十八省拥有数百客户,跨域多数据中心平台也有逐步推广应用。

CirroData是一款分布式云数据库,金正皓对于分布式数据库和集中式数据库的关系有自己的判断。“我认为集中式永远有它存在的空间。”他指出,集中式架构仍然适用于在高端用户的极端场景需求,在分布式架构成熟可靠之前,该场景或许在未来十年仍然存在,但这部分市场会逐步缩小。此外,集中式架构还存在一些长尾用户,它的数据规模、并发量、数据量都不大,类似于部门级应用或者小企业应用,依然有集中式架构的需求。未来长尾用户可能会逐步迁移到分布式系统里,以免产生数据孤岛。

回望2020年,金正皓认为大数据在新冠疫情期间的防疫、防控让全国人民真正接触到大数据的应用。他对未来也充满信心,“在我国庞大数据体量和丰富的应用场景的基础上,随着国产数据库不断实践,中国的数据库技术未来一定能走向世界。”