Pipeline执行引擎
- 原理
- 使用方式
  - 设置Session变量
    - enable_pipeline_engine
    - parallel_fragment_exec_instance_num

Pipeline执行引擎

SinceVersion 2.0.0

Pipeline执行引擎是 Doris 在2.0版本加入的实验性功能。目标是为了替换当前Doris的火山模型的执行引擎，充分释放多核CPU的计算能力，并对Doris的查询线程的数目进行限制，解决Doris的执行线程膨胀的问题。

它的具体设计、实现和效果可以参阅 [DSIP-027](DSIP-027: Support Pipeline Exec Engine - DORIS - Apache Software Foundation)。

原理

当前的Doris的SQL执行引擎是基于传统的火山模型进行设计，在单机多核的场景下存在下面的一些问题：

无法充分利用多核计算能力，提升查询性能，多数场景下进行性能调优时需要手动设置并行度，在生产环境中几乎很难进行设定。
单机查询的每个instance对应线程池的一个线程，这会带来额外的两个问题。
- 1. 线程池一旦打满。Doris的查询引擎会进入假性死锁，对后续的查询无法响应。同时有一定概率进入逻辑死锁的情况：比如所有的线程都在执行一个instance的probe任务。
- 1. 阻塞的算子会占用线程资源，而阻塞的线程资源无法让渡给能够调度的instance，整体资源利用率上不去。
阻塞算子依赖操作系统的线程调度机制，线程切换开销较大（尤其在系统混布的场景中）

由此带来的一系列问题驱动Doris需要实现适应现代多核CPU的体系结构的执行引擎。

而如下图所示（引用自[Push versus pull-based loop fusion in query engines](jfp_1800010a (cambridge.org))），Pipeline执行引擎基于多核CPU的特点，重新设计由数据驱动的执行引擎：

将传统pull拉取的逻辑驱动的执行流程改造为push模型的数据驱动的执行引擎
阻塞操作异步化，减少了线程切换，线程阻塞导致的执行开销，对于CPU的利用更为高效
控制了执行线程的数目，通过时间片的切换的控制，在混合负载的场景中，减少大查询对于小查询的资源挤占问题

从而提高了CPU在混合负载SQL上执行时的效率，提升了SQL查询的性能。

使用方式

设置Session变量

enable_pipeline_engine

将session变量enable_pipeline_engine 设置为true，则BE在进行查询执行时就会默认将SQL的执行模型转变Pipeline的执行方式。

set enable_vectorized_engine = true;

parallel_fragment_exec_instance_num

parallel_fragment_exec_instance_num代表了SQL查询进行查询并发的instance数目。Doris默认的配置为1,这个配置会影响非Pipeline执行引擎的查询线程数目，而在Pipeline执行引擎中不会有线程数目膨胀的问题。这里推荐配置为16，用户也可以实际根据自己的查询情况进行调整。

set parallel_fragment_exec_instance_num = 16;

[Experimental] Pipeline执行引擎

Pipeline执行引擎

原理

使用方式

设置Session变量

enable_pipeline_engine

parallel_fragment_exec_instance_num