继上一期月报,MySQL5.7新特性之一介绍了一些新特性及兼容性问题后,本期继续进行学习。

1. 系统变量

5.7以后System and status 变量需要从performance_schema中进行获取,information_schema仍然保留了GLOBAL_STATUS,GLOBAL_VARIABLES两个表做兼容。

[兼容性]
如果希望沿用information_schema中进行查询的习惯,5.7提供了show_compatibility_56参数,设置为ON可以兼容5.7之前的用法,否则就会报错:

  1. ERROR 3167 (HY000): The 'INFORMATION_SCHEMA.GLOBAL_STATUS' feature is disabled; see the documentation for 'show_compatibility_56'

5.7.6之后,在performance_schema新增了如下的表:

  1. performance_schema.global_variables
  2. performance_schema.session_variables
  3. performance_schema.variables_by_thread
  4. performance_schema.global_status
  5. performance_schema.session_status
  6. performance_schema.status_by_thread
  7. performance_schema.status_by_account
  8. performance_schema.status_by_host
  9. performance_schema.status_by_user

5.7.9之前,需要有SELECT_ACL权限才能进行show查询,但5.7.9之后,默认这些表是不需要任何权限就可以访问了。

2. sys schema

新增了sys数据库,主要是performance_schema收集的信息,帮助DBA和开发人员方便诊断问题。 sys下的一共包括三种对象:1. view,2. procedure 3 function 这些对象都是基于performance_schema下的表,进行了可读性的聚合,没有真正存储数据,只存储了定义。

[兼容性]
mysql_install_db可以选择–skip-sys-schema跳过安装过程, 但默认mysql_upgrade会帮你创建sys下面的对象。不存在兼容性的问题

3. 异常栈

5.7开始支持异常诊断栈信息,通过GET STACKED DIAGNOSTICS可以获取栈内的信息。 具体的使用方法参考:https://dev.mysql.com/doc/refman/5.7/en/diagnostics-area.html

4. Triggers

支持在一个table对象上建多个trigger。

5. Generated Columns

5.7.6开始,支持生成列,这个列可以是虚拟的列,也可以是实体存储数据的列。 比如:

  1. CREATE TABLE triangle (
  2. sidea DOUBLE,
  3. sideb DOUBLE,
  4. sidec DOUBLE AS (SQRT(sidea * sidea + sideb * sideb))
  5. );

VIRTUAL: 表示这个字段是虚拟列,并不进行存储,查询的时候,通过计算得到
STORED: 需要存储空间,并且可以被索引的列

6. exchange partition不验证

这个是在oracle分区表上支持的功能,dba在做大表维护的时候,非常有用。

  1. 语法: ALTER TABLE ... EXCHANGE PARTITION WITHOUT VALIDATION

如果不验证,那么只有元数据信息的更改,就可以完成exchange,否则,就需要读取每一行数据进行验证,维护时间将根据这个表大小有关系。

7. dump线程增强

5.7.2之前,master dump线程需要持有LOCK_log锁去读取binlog然后发送到备库,而这时会阻塞client端去写入binlog。5.7.2之后,dump线程只需要持有LOCK_binlog_end_pos这个锁去读取binlog的当前的位置,来决定是否发送到备库去,这样就可以做到不阻塞任何binlog的写入。

8. 多源复制

多源复制可以从多个master复制到一个slave端,在数据库集群进行扩容和缩容的时候,非常有用。我们会在后面的系列单独来介绍。

9. 在线更改replication master

可以不用stop slave,然后在线更改replication master信息。 但这里并不是不需要slave停掉, 而是change master涉及到几个动作:

  1. 如果只是更改当前relay的信息,那么只需要sql线程是不工作的就可以了,IO thread可以继续
  2. 如果只是更改主库的信息,那么只需要IO线程不工作就可以了。 sql thread可以继续
  3. 如果需要重新启动主库和备库的恢复信息,比如master_auto_positioin=1,那么就需要IO和sql线程都停掉。

10. Group Replication

并行复制支持按照主库组提交的形式在备库进行回放。下一个系列进行单独来介绍

下面单独介绍一下MySQL 5.7对临时表进行的改动。

1. 背景

MySQL包括两类临时表,一类是通过create temporary table创建的临时表,一类是在query过程中using temporary而创建的临时表。 5.7之前,using temporary创建的临时表,默认只能使用myisam引擎,而在5.7之后,可以选择InnoDB引擎来创建。

临时表的引擎选择使用下面的这两个参数来决定:

  1. mysql> show global variables like '%tmp%';
  2. +----------------------------------+---------------------------------------+
  3. | Variable_name | Value |
  4. +----------------------------------+---------------------------------------+
  5. | default_tmp_storage_engine | InnoDB |
  6. | internal_tmp_disk_storage_engine | InnoDB |

2. 临时表空间

5.7之后,使用了独立的临时表空间来存储临时表数据,但不能是压缩表。临时表空间在实例启动的时候进行创建,shutdown的时候进行删除。

例如如下的配置:

  1. mysql> show global variables like '%innodb_temp%';
  2. +----------------------------+-----------------------+
  3. | Variable_name | Value |
  4. +----------------------------+-----------------------+
  5. | innodb_temp_data_file_path | ibtmp1:12M:autoextend |
  6. +----------------------------+-----------------------+

create temporary table和using temporary table将共用这个临时表空间。

3. 临时表优化

临时表会伴随着大量的数据写入和读取,尤其是internal_tmp_table。所以,InnoDB专门对临时表进行了优化。
InnoDB使用如下两个标示临时表:

  1. dict_tf2_temporary 表示普通临时表
  2. dict_tf2_intrinsic 表示内部临时表

这两个标示,会在IBD文件的segment header占用两个bit位。intrinsic一定是temproary,也就是temproary上进行的优化 完全适用于intrinsic表上。

下面来看下具体的优化:

3.1. redo

临时表在连接断开或者数据库实例关闭的时候,会进行删除,所以,临时表的数据不需要redo来保护,即recovery的过程中 不恢复临时表,只有临时表的metadata使用了redo保护,保护元数据的完整性,以便异常启动后进行清理工作。

临时表的元数据,5.7之后,使用了一个独立的表进行保存,这样就不要使用redo保护,元数据也只保存在内存中。 但这有一个前提,必须使用共享的临时表空间,如果使用file-per-table,仍然需要持久化元数据,以便异常恢复清理。

3.2 undo

temporary table仍然需要语句级的回滚,所以,需要为数据生成undo。但intrinsic table不需要回滚,所以,intrinsic table 减少了undo的生成,性能更高。

3.3 lock

因为临时表只有本线程可以看见,所以减少了InnoDB的加锁过程。

可以看下insert的时候,进行的分支判断:

  1. row_insert_for_mysql(
  2. const byte* mysql_rec,
  3. row_prebuilt_t* prebuilt)
  4. {
  5. /* For intrinsic tables there a lot of restrictions that can be
  6. relaxed including locking of table, transaction handling, etc.
  7. Use direct cursor interface for inserting to intrinsic tables. */
  8. if (dict_table_is_intrinsic(prebuilt->table)) {
  9. return(row_insert_for_mysql_using_cursor(mysql_rec, prebuilt));
  10. } else {
  11. return(row_insert_for_mysql_using_ins_graph(
  12. mysql_rec, prebuilt));
  13. }
  14. }

row_insert_for_mysql_using_cursor直接跳过了加锁的lock_table过程。

然后,如果是intrinsic table,就直接插入,减少了undo的生成。
如果不是,需要加lock,并生成undo信息。

  1. if (dict_table_is_intrinsic(index->table)) {
  2. index->rec_cache.rec_size = rec_size;
  3. *rec = page_cur_tuple_direct_insert(
  4. page_cursor, entry, index, n_ext, mtr);
  5. } else {
  6. /* Check locks and write to the undo log,
  7. if specified */
  8. err = btr_cur_ins_lock_and_undo(flags, cursor, entry,
  9. thr, mtr, &inherit);

插入的时候,如果是临时表。就关闭redo的生成。如下面的代码所示:

  1. if (dict_table_is_temporary(index->table)) {
  2. /* Disable REDO logging as the lifetime of temp-tables is
  3. limited to server or connection lifetime and so REDO
  4. information is not needed on restart for recovery.
  5. Disable locking as temp-tables are local to a connection. */
  6. ut_ad(flags & BTR_NO_LOCKING_FLAG);
  7. ut_ad(!dict_table_is_intrinsic(index->table)
  8. || (flags & BTR_NO_UNDO_LOG_FLAG));
  9. mtr.set_log_mode(MTR_LOG_NO_REDO);
  10. }

未完待续,下一个系列,我们将介绍一下undo的新特性,包括online truncated undo。