SUBPLAN FILTER 算子用于驱动表达式中的子查询执行。

OceanBase 数据库以 NESTED-LOOP 算法执行 SUBPLAN FILTER 算子,执行时左边取一行数据,然后执行右边的子计划。SUBPLAN FILTER 算子可以驱动相关子查询和非相关子查询计算,并且两种执行方式不同。

驱动非相关子查询计算

示例 1:SUBPLAN FILTER 算子驱动非相关子查询计算

  1. obclient>CREATE TABLE t1(c1 INT, c2 INT);
  2. Query OK, 0 rows affected (0.09 sec)
  3. obclient>CREATE TABLE t2(c1 INT, c2 INT);
  4. Query OK, 0 rows affected (0.09 sec)
  5. obclient>EXPLAIN SELECT /*+NO_REWRITE*/c1 FROM t1 WHERE
  6. c2 > (SELECT MAX(c2) FROM t2)\G;
  7. *************************** 1. row ***************************
  8. Query Plan:
  9. | ===========================================
  10. |ID|OPERATOR |NAME|EST. ROWS|COST |
  11. -------------------------------------------
  12. |0 |SUBPLAN FILTER | |33334 |167652|
  13. |1 | TABLE SCAN |T1 |100000 |68478 |
  14. |2 | SCALAR GROUP BY| |1 |85373 |
  15. |3 | TABLE SCAN |T2 |100000 |66272 |
  16. ===========================================
  17. Outputs & filters:
  18. -------------------------------------
  19. 0 - output([T1.C1]), filter(nil),
  20. exec_params_(nil), onetime_exprs_([subquery(1)]), init_plan_idxs_(nil)
  21. 1 - output([T1.C1]), filter([T1.C2 > ?]),
  22. access([T1.C2], [T1.C1]), partitions(p0)
  23. 2 - output([T_FUN_MAX(T2.C2)]), filter(nil),
  24. group(nil), agg_func([T_FUN_MAX(T2.C2)])
  25. 3 - output([T2.C2]), filter(nil),
  26. access([T2.C2]), partitions(p0)

上述示例中,执行计划展示中 0 号算子 SUBPLAN FILTER 驱动右边 SCALAR GROUP BY 子计划执行,outputs & filters 详细列出了 SUBPLAN FILTER 算子的输出信息如下:

信息名称

含义

output

该算子输出的列。

filter

该算子上的过滤条件。

由于示例中的 SUBPLAN FILTER 算子没有设置 filter,所以为 nil。

execparams

右子计划依赖左子计划的参数,执行期由SUBPLAN FILTER 从左子计划中获取,传递给右子计划执行。

由于示例中 SUBPLAN FILTER 算子驱动非相关子查询没有涉及该参数,所以为 nil。

onetimeexprs

计划中只计算一次的表达式,如果右子计划是非相关子查询,每次重复执行的结果都是一样的,所以执行一次后保存在参数集合中。

每次执行 SUBPLAN FILTER 时,可以直接从参数集获取右子计划的执行结果。参数 subquery(1) 表示 SUBPLAN FILTER 右边第一个子计划是 onetime expr。

initplan_ids

该算子中只需要执行一次的子计划。

它与 onetimeexprs 的区别是,initplan返回多行多列,onetimeexpr 返回单行单列。

由于示例中的 SQL 查询未设置此项,所以为 nil。

SUBPLAN FILTER 算子驱动非相关子查询计算的一般执行流程如下:

  1. SUBPLAN FILTER 在启动时会执行 onetime_exprs_。

  2. 从参数中拿到右边非相关子查询的结果,下推 filter 到左边计划,执行左边的查询。

  3. 输出左边查询的行。

驱动相关子查询计算

示例 2:SUBPLAN FILTER 算子驱动相关子查询计算

  1. obclient>EXPLAIN SELECT /*+NO_REWRITE*/c1 FROM t1 WHERE c2 > (SELECT
  2. MAX(c2) FROM t2 WHERE t1.c1=t2.c1)\G;
  3. *************************** 1. row ***************************
  4. Query Plan:
  5. | ===============================================
  6. |ID|OPERATOR |NAME|EST. ROWS|COST |
  7. -----------------------------------------------
  8. |0 |SUBPLAN FILTER | |33334 |8541203533|
  9. |1 | TABLE SCAN |T1 |100000 |68478 |
  10. |2 | SCALAR GROUP BY| |1 |85412 |
  11. |3 | TABLE SCAN |T2 |990 |85222 |
  12. ===============================================
  13. Outputs & filters:
  14. -------------------------------------
  15. 0 - output([T1.C1]), filter([T1.C2 > subquery(1)]),
  16. exec_params_([T1.C1]), onetime_exprs_(nil), init_plan_idxs_(nil)
  17. 1 - output([T1.C1], [T1.C2]), filter(nil),
  18. access([T1.C1], [T1.C2]), partitions(p0)
  19. 2 - output([T_FUN_MAX(T2.C2)]), filter(nil),
  20. group(nil), agg_func([T_FUN_MAX(T2.C2)])
  21. 3 - output([T2.C2]), filter([? = T2.C1]),
  22. access([T2.C1], [T2.C2]), partitions(p0)

上述示例中,执行计划展示中 0 号算子 SUBPLAN FILTER 驱动右边 SCALAR GROUP BY 子计划执行,outputs & filters 详细列出了 SUBPLAN FILTER 算子的输出信息如下:

信息名称

含义

output

该算子输出的列。

filter

该算子上的过滤条件。

例如,示例 2 中的 SQL 查询过滤条件为 t1.c2 > subquery(1)

execparams

右子计划依赖左子计划的参数,执行期由SUBPLAN FILTER 从左子计划中获取,传递给右子计划执行。

左边输出一行数据后需要下推的参数,在非相关子查询中一般没有下推的参数。

onetimeexprs

计划中只计算一次的表达式,如果右子计划是非相关子查询,每次重复执行的结果都是一样的,所以执行一次后保存在参数集合中。

每次执行 SUBPLAN FILTER 时,可以直接从参数集获取右子计划的执行结果。参数 subquery(1) 表示 SUBPLAN FILTER 右边第一个子计划是 onetime expr。

由于示例中的 SQL 查询未设置此项,所以为 nil。

initplan_idxs

该算子中只需要执行一次的子计划。

与 onetimeexprs 的区别是,initplan返回多行多列,onetimeexpr 返回单行单列。

由于示例中的 SQL 查询未设置此项,所以为 nil。

SUBPLAN FILTER 算子驱动相关子查询计算的一般执行流程如下:

  1. SUBPLAN FILTER 在启动时会执行 onetime_exprs_

  2. 执行左边的查询,输出一行后,计算相关参数,下推到右边,执行右边的子查询。

  3. 执行 filter,输出符合条件的数据行。