执行计划(EXPLAIN)是对一条 SQL 查询语句在数据库中执行过程的描述。

用户可以通过 EXPLAIN 命令查看优化器针对给定 SQL 生成的逻辑执行计划。如果要分析某条 SQL 的性能问题,通常需要先查看 SQL 的执行计划,排查每一步 SQL 执行是否存在问题。所以读懂执行计划是 SQL 优化的先决条件,而了解执行计划的算子是理解 EXPLAIN 命令的关键。

EXPLAIN 命令格式

OceanBase 数据库的执行计划命令有三种模式:EXPLAIN BASICEXPLAINEXPLAIN EXTENDED。这三种模式对执行计划展现不同粒度的细节信息:

  • EXPLAIN BASIC 命令用于最基本的计划展示。

  • EXPLAIN EXTENDED 命令用于最详细的计划展示(通常在排查问题时使用这种展示模式)。

  • EXPLAIN 命令所展示的信息可以帮助普通用户了解整个计划的执行方式。

命令格式如下:​​

  1. EXPLAIN [BASIC | EXTENDED | PARTITIONS | FORMAT = format_name] explainable_stmt
  2. format_name: { TRADITIONAL | JSON }
  3. explainable_stmt: { SELECT statement
  4. | DELETE statement
  5. | INSERT statement
  6. | REPLACE statement
  7. | UPDATE statement }

执行计划形状与算子信息

在数据库系统中,执行计划在内部通常是以树的形式来表示的,但是不同的数据库会选择不同的方式展示给用户。

如下示例分别为 PostgreSQL 数据库、Oracle 数据库和 OceanBase 数据库对于 TPCDS Q3 的计划展示。

  1. obclient>SELECT /*TPC-DS Q3*/ *
  2. FROM (SELECT dt.d_year,
  3. item.i_brand_id brand_id,
  4. item.i_brand brand,
  5. Sum(ss_net_profit) sum_agg
  6. FROM date_dim dt,
  7. store_sales,
  8. item
  9. WHERE dt.d_date_sk = store_sales.ss_sold_date_sk
  10. AND store_sales.ss_item_sk = item.i_item_sk
  11. AND item.i_manufact_id = 914
  12. AND dt.d_moy = 11
  13. GROUP BY dt.d_year,
  14. item.i_brand,
  15. item.i_brand_id
  16. ORDER BY dt.d_year,
  17. sum_agg DESC,
  18. brand_id)
  19. WHERE rownum <= 100;
  • PostgreSQL 数据库执行计划展示如下:

    1. Limit (cost=13986.86..13987.20 rows=27 width=91)
    2. -> Sort (cost=13986.86..13986.93 rows=27 width=65)
    3. Sort Key: dt.d_year, (sum(store_sales.ss_net_profit)), item.i_brand_id
    4. -> HashAggregate (cost=13985.95..13986.22 rows=27 width=65)
    5. -> Merge Join (cost=13884.21..13983.91 rows=204 width=65)
    6. Merge Cond: (dt.d_date_sk = store_sales.ss_sold_date_sk)
    7. -> Index Scan using date_dim_pkey on date_dim dt (cost=0.00..3494.62 rows=6080 width=8)
    8. Filter: (d_moy = 11)
    9. -> Sort (cost=12170.87..12177.27 rows=2560 width=65)
    10. Sort Key: store_sales.ss_sold_date_sk
    11. -> Nested Loop (cost=6.02..12025.94 rows=2560 width=65)
    12. -> Seq Scan on item (cost=0.00..1455.00 rows=16 width=59)
    13. Filter: (i_manufact_id = 914)
    14. -> Bitmap Heap Scan on store_sales (cost=6.02..658.94 rows=174 width=14)
    15. Recheck Cond: (ss_item_sk = item.i_item_sk)
    16. -> Bitmap Index Scan on store_sales_pkey (cost=0.00..5.97 rows=174 width=0)
    17. Index Cond: (ss_item_sk = item.i_item_sk)
  • Oracle 数据库执行计划展示如下:

    1. Plan hash value: 2331821367
    2. --------------------------------------------------------------------------------------------------
    3. | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
    4. --------------------------------------------------------------------------------------------------
    5. | 0 | SELECT STATEMENT | | 100 | 9100 | 3688 (1)| 00:00:01 |
    6. |* 1 | COUNT STOPKEY | | | | | |
    7. | 2 | VIEW | | 2736 | 243K| 3688 (1)| 00:00:01 |
    8. |* 3 | SORT ORDER BY STOPKEY | | 2736 | 256K| 3688 (1)| 00:00:01 |
    9. | 4 | HASH GROUP BY | | 2736 | 256K| 3688 (1)| 00:00:01 |
    10. |* 5 | HASH JOIN | | 2736 | 256K| 3686 (1)| 00:00:01 |
    11. |* 6 | TABLE ACCESS FULL | DATE_DIM | 6087 | 79131 | 376 (1)| 00:00:01 |
    12. | 7 | NESTED LOOPS | | 2865 | 232K| 3310 (1)| 00:00:01 |
    13. | 8 | NESTED LOOPS | | 2865 | 232K| 3310 (1)| 00:00:01 |
    14. |* 9 | TABLE ACCESS FULL | ITEM | 18 | 1188 | 375 (0)| 00:00:01 |
    15. |* 10 | INDEX RANGE SCAN | SYS_C0010069 | 159 | | 2 (0)| 00:00:01 |
    16. | 11 | TABLE ACCESS BY INDEX ROWID| STORE_SALES | 159 | 2703 | 163 (0)| 00:00:01 |
    17. --------------------------------------------------------------------------------------------------
  • OceanBase 数据库执行计划展示如下:

    1. |ID|OPERATOR |NAME |EST. ROWS|COST |
    2. -------------------------------------------------------
    3. |0 |LIMIT | |100 |81141|
    4. |1 | TOP-N SORT | |100 |81127|
    5. |2 | HASH GROUP BY | |2924 |68551|
    6. |3 | HASH JOIN | |2924 |65004|
    7. |4 | SUBPLAN SCAN |VIEW1 |2953 |19070|
    8. |5 | HASH GROUP BY | |2953 |18662|
    9. |6 | NESTED-LOOP JOIN| |2953 |15080|
    10. |7 | TABLE SCAN |ITEM |19 |11841|
    11. |8 | TABLE SCAN |STORE_SALES|161 |73 |
    12. |9 | TABLE SCAN |DT |6088 |29401|
    13. =======================================================

由示例可见,OceanBase 数据库的计划展示与 Oracle 数据库类似。OceanBase 数据库执行计划中的各列的含义如下:

列名

含义

ID

执行树按照前序遍历的方式得到的编号(从 0 开始)。

OPERATOR

操作算子的名称。

NAME

对应表操作的表名(索引名)。

EST. ROWS

估算该操作算子的输出行数。

COST

该操作算子的执行代价(微秒)。

说明

在表操作中,NAME 字段会显示该操作涉及的表的名称(别名),如果是使用索引访问,还会在名称后的括号中展示该索引的名称, 例如 t1(t1_c2) 表示使用了 t1_c2 这个索引。如果扫描的顺序是逆序,还会在后面使用 RESERVE 关键字标识,例如 t1(t1_c2,RESERVE)

OceanBase 数据库 EXPLAIN 命令输出的第一部分是执行计划的树形结构展示。其中每一个操作在树中的层次通过其在 operator 中的缩进予以展示。树的层次关系用缩进来表示,层次最深的优先执行,层次相同的以特定算子的执行顺序为标准来执行。

上述 TPCDS Q3 示例的计划展示树如下:

explainOceanBase 数据库 EXPLAIN 命令输出的第二部分是各操作算子的详细信息,包括输出表达式、过滤条件、分区信息以及各算子的独有信息(包括排序键、连接键、下压条件等)。示例如下:

  1. Outputs & filters:
  2. -------------------------------------
  3. 0 - output([t1.c1], [t1.c2], [t2.c1], [t2.c2]), filter(nil), sort_keys([t1.c1, ASC], [t1.c2, ASC]), prefix_pos(1)
  4. 1 - output([t1.c1], [t1.c2], [t2.c1], [t2.c2]), filter(nil),
  5. equal_conds([t1.c1 = t2.c2]), other_conds(nil)
  6. 2 - output([t2.c1], [t2.c2]), filter(nil), sort_keys([t2.c2, ASC])
  7. 3 - output([t2.c2], [t2.c1]), filter(nil),
  8. access([t2.c2], [t2.c1]), partitions(p0)
  9. 4 - output([t1.c1], [t1.c2]), filter(nil),
  10. access([t1.c1], [t1.c2]), partitions(p0)