ByConity 技术详解：内置 ELT 能力实现原理和使用

【作者】ByConity 开源团队

谈到数据仓库，一定离不开使用Extract-Transform-Load (ETL)或 Extract-Load-Transform (ELT)。将来源不同、格式各异的数据提取到数据仓库中，并进行处理加工。传统的数据转换过程一般采用Extract-Transform-Load (ETL)来将业务数据转换为适合数仓的数据模型，然而，这依赖于独立于数仓外的ETL系统，因而维护成本较高。

ByConity 作为云原生数据仓库，从0.2.0版本开始逐步支持 Extract-Load-Transform (ELT)，使用户免于维护多套异构数据系统。本文将介绍 ByConity 在ELT方面的能力规划，实现原理和使用方式等。

ETL场景和方案

ELT与ETL的区别

ETL：是用来描述将数据从来源端经过抽取、转置、加载至目的端（数据仓库）的过程。Transform通常描述在数据仓库中的前置数据加工过程。

ELT 专注于将最小处理的数据加载到数据仓库中，而把大部分的转换操作留给分析阶段。相比起前者（ETL)，它不需要过多的数据建模，而给分析者提供更灵活的选项。ELT已经成为当今大数据的处理常态，它对数据仓库也提出了很多新的要求。

资源重复的挑战

典型的数据链路如下：我们将行为数据、日志、点击流等通过MQ/ Kafka/ Flink将其接入存储系统当中，存储系统又可分为域内的HDFS 和云上的 OSS& S3 这种远程储存系统，然后进行一系列的数仓的ETL操作，提供给 OLAP系统完成分析查询。

但有些业务需要从上述的存储中做一个分支，因此会在数据分析的某一阶段，从整体链路中将数据导出，做一些不同于主链路的ETL操作，会出现两份数据存储。其次在这过程中也会出现两套不同的ETL逻辑。

当数据量变大，计算冗余以及存储冗余所带来的成本压力也会愈发变大，同时，存储空间的膨胀也会让弹性扩容变得不便利。

业界解决思路

在业界中，为了解决以上问题，有以下几类流派：

数据预计算流派：如Kylin等。如果Hadoop系统中出报表较慢或聚合能力较差，可以去做一个数据的预计算，提前将配的指标的cube或一些视图算好。实际SQL查询时，可以直接用里面的cube或视图做替换，之后直接返回。

流批一体派：如 Flink、Risingwave。在数据流进时，针对一些需要出报表或者需要做大屏的数据直接内存中做聚合。聚合完成后，将结果写入HBase或MySQL中再去取数据，将数据取出后作展示。Flink还会去直接暴露中间状态的接口，即queryable state，让用户更好的使用状态数据。但是最后还会与批计算的结果完成对数，如果不一致，需要进行回查操作，整个过程考验运维/开发同学的功力。

湖仓一体&HxxP:将数据湖与数据仓库结合起来。

ELT in ByConity

整体执行流程

ELT任务对系统的要求：

整体易扩展：导入和转换通常需要大量的资源，系统需要通过水平扩展的方式来满足数据量的快速增长。

可靠性和容错能力：大量的job能有序调度；出现task偶然失败（OOM）、container失败时，能够拉起重试；能处理一定的数据倾斜

效率&性能：有效利用多核多机并发能力；数据快速导入；内存使用有效（内存管理）；CPU优化（向量化、codegen）

生态&可观测性：可对接多种工具；任务状态感知；任务进度感知；失败日志查询；有一定可视化能力

ByConity 针对ELT任务的要求，以及当前场景遇到的困难，新增了以下特性和优化改进。

分阶段执行（Stage-level Scheduling）

原理解析

当前 ClickHouse的 SQL 执行过程如下：

第一阶段，Coordinator 收到分布式表查询后将请求转换为对 local 表查询发送给每个 shard 节点；

第二阶段，Coordinator 收到各个节点的结果后汇聚起来处理后返回给客户端；

ClickHouse 将Join操作中的右表转换为子查询，带来如下几个问题都很难以解决：

复杂的query有多个子查询，转换复杂度高；

Join表较大时，容易造成worker节点的OOM；

聚合阶段在Cooridnator，压力大，容易成为性能瓶颈；

不同于ClickHouse，我们在ByConity 中实现了对复杂查询的执行优化。通过对执行计划的切分，将之前的两阶段执行模型转换为分阶段执行。在逻辑计划阶段，根据算子类型插入exchange算子。执行阶段根据exchange算子将整个执行计划进行DAG切分，并且分stage进行调度。stage之间的exchange算子负责完成数据传输和交换。

关键节点：

exchange节点插入

切分stage

stage scheduler

segment executer

exchange manager

这里重点来讲一下exchange的视线。上图可以看到，最顶层的是query plan。下面转换成物理计划的时候，我们会根据不同的数据分布的要求转换成不同的算子。source层是接收数据的节点，基本都是统一的，叫做ExchangeSource。Sink则有不同的实现，BroadcastSink、Local、PartitionSink等，他们是作为map task的一部分去运行的。如果是跨节点的数据操作，我们在底层使用统一的brpc流式数据传输，如果是本地，则使用内存队列来实现。针对不同的点，我们进行了非常细致的优化：

数据传输层

进程内通过内存队列，无序列化，zero copy

进程间使用brpc stream rpc，保序、连接复用、状态码传输、压缩等

算子层

批量发送

线程复用，减少线程数量

带来的收益

因为ByConity 彻底采用了多阶段的查询执行方式，整体有很大的收益：

Cooridnator更稳定、更高效

聚合等算子拆分到worker节点执行

Cooridnator节点只需要聚合最终结果

Worker OOM减少

进行了stage切分，每个stage的计算相对简单

增加了exchange算子，减少内存压力

网络连接更加稳定、高效

exchange算子有效传输

复用连接池

自适应的调度器（Adaptive Scheduler）

Adaptive Scheduler 属于我们在稳定性方面所做的特性。在OLAP场景中可能会发现部分数据不全或数据查询超时等，原因是每个worker是所有的query共用的，这样一旦有一个worker 较慢就会导致整个query的执行受到影响。

计算节点共用存在的问题：

Scan 所在的节点负载和不同查询所需的扫描数据量相关，做不到完全平均；

各 Plan Segment 所需资源差异大；

这就导致worker节点之间的负载严重不均衡。负载较重的worker节点就会影响query整体的进程。因此我们做了以下的优化方案：

建立 Worker 健康度机制。Server 端建立 Worker 健康度管理类，可以快速获取 Worker Group 的健康度信息，包括CPU、内存、运行Query数量等信息。

自适应调度：每个SQL 根据 Worker 健康度动态的进行选择以及计算节点并发度控制。

查询的队列机制（Query Queue）

我们的集群也会出现满载情况，即所有的worker都是不健康的或者满载/超载的，就会用查询队列来进行优化。

我们直接在server端做了一个manager。每次查询的时候manager会去check集群的资源，并且持有一个锁。如果资源不够用，则等待资源释放后去唤醒这个锁。这就避免了Server端不限制的下发计算任务，导致worker节点超载，然后崩掉的情况。

当前实现相对简单。server是多实例，每个server实例中都有queue，所持有的是一个局部视角，缺乏全局的资源视角。除此之外，每个queue中的查询状态没有持久化，只是简单的缓存在内存中。

后续，我们会增加server之间的协调，在一个全局的视角上对查询并发做限制。也会对server实例中query做持久化，增加一些failover的场景支持。

异步执行（Async Execution）

ELT任务的一个典型特征就是：相对于即时分析，他们的运行时间会相对较长。一般ELT任务执行时长为分钟级，甚至到达小时级。

目前 ClickHouse的客户端查询都采用阻塞的方式进行返回。这样就造成了客户端长期处于等待的情况，而在这个等待过程中还需要保持和服务端的连接。在不稳定的网络情况下，客户端和服务端的连接会断开，从而导致服务端的任务失败。

为了减少这种不必要的失败，以及减少客户端为了维持连接的增加的复杂度。我们开发了异步执行的功能，它的实现如下：

用户指定异步执行。用户可以通过settings enable_async_query = 1的方式进行per query的指定。也可以通过set enable_async_query = 1的方式进行session级别的指定。

如果是异步query，则将其放到后台线程池中运行

静默io。当异步query执行时，则需要切断它和客户端的交互逻辑，比如输出日志等。

针对query的初始化还是在session的同步线程中进行。一旦完成初始化，则将query状态写入到metastore，并向客户端返回async query id。客户端可以用这个id查询query的状态。async query id返回后，则表示完成此次查询的交互。这种模式下，如果语句是select，那么后续结果则无法回传给客户端。这种情况下我们推荐用户使用async query + select...into outfile的组合来满足需求。

未来规划

针对ELT混合负载，ByConity 0.2.0版本目前只是牛刀小试。后续的版本中我们会持续优化查询相关的能力，ELT为核心的规划如下：

故障恢复能力

算子Spill

Sort、Agg、Join 算子Spill；

Exchange Spill 能力；

Recoverability 容错恢复

算子执行恢复：ELT任务运行时长较长时，中间 Task的偶发失败会导致整个Query失败，支持Task 级别重试可以极大地降低环境原因导致的偶发失败；

Stage重试：当节点失败时，可以进行 Stage级别的重试；

保存队列作业状态的能力；

Remote Shuffle Service：当前业界开源的 shuffle service通常为Spark定制，没有通用的客户端，比如c++客户端。后续我们会补充这部分能力。

资源

计算资源可指定：用户可指定query需要的计算资源；

计算资源预估/预占：可动态预估query需要的计算资源，并通过预占的方式进行调配；

动态申请资源：当前worker均为常驻进程/节点。动态申请资源可以提高利用率；

更细粒度的资源隔离：通过worker group或者进程级别的隔离，减少各query之间相互影响；

标签：

猜你喜欢

华为WhatsApp下载好了，多亏了出境易这个APP

爱乐未来三周年庆暨新财富策略研讨会圆满成功

双节同庆，Fit.Q低碳生酮三重豪礼享不停

重磅！“中国视谷”产业政策体系正式构建，杭州有何深意？

西瓜创客少儿编程获2023年度中国经济大会口碑影响力教育服务企业

孔令波市长一行赴江苏环迅信息科技有限公司参观考察

IMG众瑞供应链促进跨境物流革新，Hailify新产品服务亮相17届物博会

世贸通EB5投资移民：2024财年美国职业移民签证配额公布

时尚教育新生态：保兰德PLD携手高校，引领时尚产业新发展

投资招募 | 价值26亿元！北京亚运村金泉广场资产包整体转让！

优立科技列入元宇宙专委会首批成员

看章方良博士的关键抉择领航金斯瑞迅速成长

58同城携手网约车企业“直播带岗”，吸引超4万人围观投简历

“共和国脊梁”科学家丛书（青少图文版）新书预告会在京举行

抗衰老促进会功能医学专委会成立，研源医疗为发起单位

9.28-10.04 华强北首届茶饮生活节开启城市趣玩新模式

3年时间遍布全国？揭秘中国名酒折扣店成就百城盈利的秘诀

首届“鄂尔多斯杯”创新创业大赛成功举办

千城齐“热”看味家！健康餐厨点燃“黄金周”消费新浪潮

第九届上海国际喜剧节十月开启开幕大戏《爱情神话》引期待

三雄极光智能照明品牌馆（沈阳店）盛大开幕，构筑数智光未来

2023抖音电商作者峰会获奖名单出炉，优质直播间、作者精神开始闪光

普强深思大模型发布会在澳成功举行，助推产业创新发展

龙脊康受邀出席大湾区生命健康产业高峰论坛，并为企业家健康义诊

众惠相互启动2023年“金融消费者权益保护教育宣传月”活动

国际企业（徐闻－海口）科技创新中心揭牌仪式成功举办！

疆果果——新疆首家登录《崛起的民族品牌》企业陈文君：奋进新疆，呵护果农梦想

中储智运推动主题教育见行见效汲取奋发进取的智慧和力量

YISHION Y:2 旗舰店「湘」约长沙，引爆高辣年轻态度

再夺“华樽杯”，黄金酱酒品牌价值达166.35亿元，斩获双项大奖

热点图片

要闻

老庙有鹊——与Z世代共启“自由式”婚礼时代
随着时代的不断发展，当代年轻人的婚恋观展现出自由、多元和个性化的面貌。追寻真爱至
未来已来区域共享 ——2023京津冀产业国际合作对接会在京召开
9月27日，2023京津冀产业国际合作对接会在北京丰台创新中心成功举办。此次活动以未来
四川安岳石窟：乡野国宝焕发新生
伴着丝丝桂香，沿着滨河步道一路前行，不出片刻便抵达四川省资阳市安岳县卧佛院景区。
“2023全国预防出生缺陷”公益主题活动暨「一个都不能少」预防出生缺陷40年礼赞启动会圆满礼成
为了贯彻落实《健康中国2030规划纲要》和妇幼健康行动等相关文件精神，进一步宣传普及
喜报！合肥普瑞儿童眼病与视光专科汪丽娟主任荣获“安徽医科大学临床医学院优秀外聘教师”
所谓医师，亦医亦师显微镜下，方寸之间，承载光明之重躬身杏坛，三尺讲台，擎着爱与责
德昌：“80后”夫妻共奏和谐之音助力傈僳族文化传承
他们是一对恩爱夫妻，共同热爱着自己的傈僳族文化；他们也是一对文艺夫妻，长年以来致
彭州市龙门山镇人民政府关于不要进入未开发（开放）区域活动的通告
彭州市龙门山镇人民政府关于不要进入未开发（开放）区域活动的通告各位市民朋友：龙门
2023西昌邛海湿地马拉松赛11月18日举行
2023西昌邛海湿地马拉松赛11月18日举行免费参与火把民俗活动、乘船游邛海观光、优惠品
到成都街头走一走｜乐游都江堰，赏花好月圆，观万千气象
9月29-10月6日当中秋遇见国庆双节同庆，快乐加倍到都江堰的街头走一走拜水问道，探访
衣邦人方琴出席杭州第19届亚运会赞助企业答谢大会
9月26日，让品牌绽放，让世界注目杭州第19届亚运会赞助企业答谢大会在杭州圆满召开。

ByConity 技术详解：内置 ELT 能力实现原理和使用

相关阅读

猜你喜欢

热点图片

要闻