湖仓一体

建设背景

将数仓建设在数据湖上,存储更廉价和弹性,提升数据质量,减少数据冗余,传统的数据分析和高级分析均可以在同一数据存储中对数据进行操作,对接上层多样化计算生态,提升业务效率

优势特性

减少数据冗余

统一存放数仓和湖数据,去除数据重复性,降低数据不一致的风险

存算分离

使用低成本硬件和集群架构存储数据,计算集群则按需分配计算资源进行运算

多模态建模

支持贴源、数仓范式、维度等多种模型,按需组织数据

事务支持

在数据管道同时读取和写入数据时,保证支持ACID事务一致性