管理数据同步任务

本文介绍了如何使用 dmctl 组件来进行数据同步任务的管理和维护。对于用 DM-Ansible 部署的 DM 集群,dmctl 二进制文件路径为 dm-ansible/dmctl

dmctl 支持交互模式用于人工操作,同时也支持命令模式用于脚本。

dmctl 交互模式

本部分描述了在交互模式下一些 dmctl 命令的基本用法。

dmctl 使用帮助

  1. ./dmctl --help
  1. Usage of dmctl:
  2. -V prints version and exit
  3. -config string
  4. path to config file
  5. # 按照 DM 提供的加密方法加密数据库密码,用于 DM 的配置文件
  6. -encrypt string
  7. encrypt plaintext to ciphertext
  8. # DM-master 访问地址,dmctl 与 DM-master 交互以完成任务管理操作
  9. -master-addr string
  10. master API server addr
  11. -rpc-timeout string
  12. rpc timeout, default is 10m (default "10m")

加密数据库密码

在 DM 相关配置文件中,要求必须使用经 dmctl 加密后的密码,否则会报错。对于同一个原始密码,每次加密后密码不同。

  1. ./dmctl -encrypt 123456
  1. VjX8cEeTX+qcvZ3bPaO4h0C80pe/1aU=

任务管理概览

进入交互模式,与 DM-master 进行交互:

  1. ./dmctl -master-addr 172.16.30.14:8261
  1. Welcome to dmctl
  2. Release Version: v1.0.1
  3. Git Commit Hash: e63c6cdebea0edcf2ef8c91d84cff4aaa5fc2df7
  4. Git Branch: release-1.0
  5. UTC Build Time: 2019-09-10 06:15:05
  6. Go Version: go version go1.12 linux/amd64
  7. » help
  8. DM control
  9. Usage:
  10. dmctl [command]
  11. Available Commands:
  12. break-ddl-lock forcefully break DM-worker's DDL lock
  13. check-task check the config file of the task
  14. help help about any command
  15. migrate-relay migrate DM-worker's relay unit
  16. pause-relay pause DM-worker's relay unit
  17. pause-task pause a specified running task
  18. purge-relay purge relay log files of the DM-worker according to the specified filename
  19. query-error query task error
  20. query-status query task status
  21. refresh-worker-tasks refresh worker -> tasks mapper
  22. resume-relay resume DM-worker's relay unit
  23. resume-task resume a specified paused task
  24. show-ddl-locks show un-resolved DDL locks
  25. sql-inject inject (limited) SQLs into binlog replication unit as binlog events
  26. sql-replace replace SQLs matched by a specific binlog position (binlog-pos) or a SQL pattern (sql-pattern); each SQL must end with a semicolon
  27. sql-skip skip the binlog event matched by a specific binlog position (binlog-pos) or a SQL pattern (sql-pattern)
  28. start-task start a task as defined in the config file
  29. stop-task stop a specified task
  30. switch-relay-master switch the master server of the DM-worker's relay unit
  31. unlock-ddl-lock forcefully unlock DDL lock
  32. update-master-config update the config of the DM-master
  33. update-relay update the relay unit config of the DM-worker
  34. update-task update a task's config for routes, filters, or black-white-list
  35. Flags:
  36. -h, --help help for dmctl
  37. -w, --worker strings DM-worker ID
  38. # 使用 `dmctl [command] --help` 来获取某个命令的更多信息

管理数据同步任务

本部分描述了如何使用不同的任务管理命令来执行相应操作。

创建数据同步任务

start-task 命令用于创建数据同步任务。 当数据同步任务启动时,DM 将自动对相应权限和配置进行前置检查

  1. help start-task
  1. start a task as defined in the config file
  2. Usage:
  3. dmctl start-task [-w worker ...] <config-file> [flags]
  4. Flags:
  5. -h, --help help for start-task
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. start-task [ -w "172.16.30.15:8262"] ./task.yaml

参数解释

  • -w
    • 可选
    • 指定在特定的一组 DM-workers 上执行 task.yaml
    • 如果设置,则只启动指定任务在该组 DM-workers 上的子任务
  • config-file
    • 必选
    • 指定 task.yaml 的文件路径

返回结果示例

  1. start-task task.yaml
  1. {
  2. "result": true,
  3. "msg": "",
  4. "workers": [
  5. {
  6. "result": true,
  7. "worker": "172.16.30.15:8262",
  8. "msg": ""
  9. },
  10. {
  11. "result": true,
  12. "worker": "172.16.30.16:8262",
  13. "msg": ""
  14. }
  15. ]
  16. }

查询数据同步任务状态

query-status 命令用于查询数据同步任务状态。有关查询结果及子任务状态,详见查询状态

  1. help query-status
  1. query task status
  2. Usage:
  3. dmctl query-status [-w worker ...] [task-name] [flags]
  4. Flags:
  5. -h, --help help for query-status
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. query-status

参数解释

  • -w
    • 可选
    • 查询在指定的一组 DM-workers 上运行的数据同步任务的子任务
  • task-name
    • 可选
    • 指定任务名称
    • 如果未设置,则返回全部数据同步任务的查询结果

返回结果示例

有关查询结果中各参数的意义,详见查询状态结果

查询运行错误

query-error 可用于查询数据同步任务与 relay 处理单元的错误信息。相比于 query-statusquery-error 一般不用于获取除错误信息之外的其他信息。

query-error 常用于获取 sql-skip/sql-replace 所需的 binlog position 信息,有关 query-error 的参数与结果解释,请参考 “跳过或替代执行异常的 SQL 语句”文档中的 query-error

暂停数据同步任务

pause-task 命令用于暂停数据同步任务。

注意:

有关 pause-taskstop-task 的区别如下:

  • 使用 pause-task 仅暂停同步任务的执行,但仍然会在内存中保留任务的状态信息等,且可通过 query-status 进行查询;使用 stop-task 会停止同步任务的执行,并移除内存中与该任务相关的信息,且不可再通过 query-status 进行查询,但不会移除已经写入到下游数据库中的数据以及其中的 checkpoint 等 dm_meta 信息。
  • 使用 pause-task 暂停同步任务期间,由于任务本身仍然存在,因此不能再启动同名的新任务,且会阻止对该任务所需 relay log 的清理;使用 stop-task 停止任务后,由于任务不再存在,因此可以再启动同名的新任务,且不会阻止对 relay log 的清理。
  • pause-task 一般用于临时暂停同步任务以排查问题等;stop-task 一般用于永久删除同步任务或通过与 start-task 配合以更新配置信息。
  1. help pause-task
  1. pause a specified running task
  2. Usage:
  3. dmctl pause-task [-w worker ...] <task-name> [flags]
  4. Flags:
  5. -h, --help help for pause-task
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. pause-task [-w "127.0.0.1:8262"] task-name

参数解释

  • -w
    • 可选
    • 指定在特定的一组 DM-workers 上暂停数据同步任务的子任务
    • 如果设置,则只暂停该任务在指定 DM-workers 上的子任务
  • task-name
    • 必选
    • 指定任务名称

返回结果示例

  1. pause-task test
  1. {
  2. "op": "Pause",
  3. "result": true,
  4. "msg": "",
  5. "workers": [
  6. {
  7. "meta": {
  8. "result": true,
  9. "worker": "172.16.30.15:8262",
  10. "msg": ""
  11. },
  12. "op": "Pause",
  13. "logID": "2"
  14. },
  15. {
  16. "meta": {
  17. "result": true,
  18. "worker": "172.16.30.16:8262",
  19. "msg": ""
  20. },
  21. "op": "Pause",
  22. "logID": "2"
  23. }
  24. ]
  25. }

恢复数据同步任务

resume-task 命令用于恢复处于 Paused 状态的数据同步任务,通常用于在人为处理完造成同步任务暂停的故障后手动恢复同步任务。

  1. help resume-task
  1. resume a specified paused task
  2. Usage:
  3. dmctl resume-task [-w worker ...] <task-name> [flags]
  4. Flags:
  5. -h, --help help for resume-task
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. resume-task [-w "127.0.0.1:8262"] task-name

参数解释

  • -w
    • 可选
    • 指定在特定的一组 DM-workers 上恢复数据同步任务的子任务
    • 如果设置,则只恢复该任务在指定 DM-workers 上的子任务
  • task-name
    • 必选
    • 指定任务名称

返回结果示例

  1. resume-task test
  1. {
  2. "op": "Resume",
  3. "result": true,
  4. "msg": "",
  5. "workers": [
  6. {
  7. "meta": {
  8. "result": true,
  9. "worker": "172.16.30.15:8262",
  10. "msg": ""
  11. },
  12. "op": "Resume",
  13. "logID": "3"
  14. },
  15. {
  16. "meta": {
  17. "result": true,
  18. "worker": "172.16.30.16:8262",
  19. "msg": ""
  20. },
  21. "op": "Resume",
  22. "logID": "3"
  23. }
  24. ]
  25. }

停止数据同步任务

stop-task 命令用于停止数据同步任务。有关 stop-taskpause-task 的区别,请参考暂停数据同步任务中的相关说明。

  1. help stop-task
  1. stop a specified task
  2. Usage:
  3. dmctl stop-task [-w worker ...] <task-name> [flags]
  4. Flags:
  5. -h, --help help for stop-task
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. stop-task [-w "127.0.0.1:8262"] task-name

参数解释

  • -w
    • 可选
    • 指定在特定的一组 DM-workers 上停止数据同步任务的子任务
    • 如果设置,则只停止该任务在指定 DM-workers 上的子任务
  • task-name
    • 必选
    • 指定任务名称

返回结果示例

  1. stop-task test
  1. {
  2. "op": "Stop",
  3. "result": true,
  4. "msg": "",
  5. "workers": [
  6. {
  7. "meta": {
  8. "result": true,
  9. "worker": "172.16.30.15:8262",
  10. "msg": ""
  11. },
  12. "op": "Stop",
  13. "logID": "4"
  14. },
  15. {
  16. "meta": {
  17. "result": true,
  18. "worker": "172.16.30.16:8262",
  19. "msg": ""
  20. },
  21. "op": "Stop",
  22. "logID": "4"
  23. }
  24. ]
  25. }

更新数据同步任务

update-task 命令用于更新数据同步任务。

支持的更新项包括:

  • Table routing 规则
  • Black & white table lists 规则
  • Binlog event filter 规则

其余项均不支持更新。

注意:

如果能确保同步任务所需的 relay log 在任务停止期间不会被清理,则推荐使用不支持更新项的更新步骤来以统一的方式更新任务配置信息。

支持更新项的更新步骤

  1. 使用 query-status <task-name> 查询对应数据同步任务的状态。

    • stage 不为 Paused,则先使用 pause-task <task-name> 暂停任务。
  2. task.yaml 文件中更新需要修改的自定义配置或者错误配置。

  3. 使用 update-task task.yaml 更新任务配置。

  4. 使用 resume-task <task-name> 恢复任务。

不支持更新项的更新步骤

  1. 使用 query-status <task-name> 查询对应数据同步任务的状态。

    • 若任务存在,则通过 stop-task <task-name> 停止任务。
  2. task.yaml 文件中更新需要修改的自定义配置或者错误配置。

  3. 使用 start-task <task-name> 重启恢复任务。

  1. help update-task
  1. update a task's config for routes, filters, or black-white-list
  2. Usage:
  3. dmctl update-task [-w worker ...] <config-file> [flags]
  4. Flags:
  5. -h, --help help for update-task
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. update-task [-w "127.0.0.1:8262"] ./task.yaml

参数解释

  • -w
    • 可选
    • 指定在特定的一组 DM-workers 上更新数据同步任务的子任务
    • 如果设置,则只更新指定 DM-workers 上的子任务配置
  • config-file
    • 必选
    • 指定 task.yaml 的文件路径

返回结果示例

  1. update-task task_all_black.yaml
  1. {
  2. "result": true,
  3. "msg": "",
  4. "workers": [
  5. {
  6. "result": true,
  7. "worker": "172.16.30.15:8262",
  8. "msg": ""
  9. },
  10. {
  11. "result": true,
  12. "worker": "172.16.30.16:8262",
  13. "msg": ""
  14. }
  15. ]
  16. }

管理 DDL lock

目前与 DDL lock 相关的命令主要包括 show-ddl-locksunlock-ddl-lockbreak-ddl-lock 等。有关它们的功能、用法以及适用场景等,请参考手动处理 sharding DDL lock

其他任务与集群管理命令

除上述常用的任务管理命令外,DM 还提供了其他一些命令用于管理数据同步任务或 DM 集群本身。

检查任务配置文件

check-task 命令用于检查指定的数据同步任务配置文件(task.yaml)是否合法以及上下游数据库的配置、权限、表结构等是否满足同步需要。具体可参考上游 MySQL 实例配置前置检查

在使用 start-task 启动同步任务时,DM 也会执行 check-task 所做的全部检查。

  1. help check-task
  1. check the config file of the task
  2. Usage:
  3. dmctl check-task <config-file> [flags]
  4. Flags:
  5. -h, --help help for check-task
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. check-task task.yaml

参数解释

  • config-file
    • 必选
    • 指定 task.yaml 的文件路径

返回结果示例

  1. check-task task-test.yaml
  1. {
  2. "result": true,
  3. "msg": "check pass!!!"
  4. }

暂停 relay 处理单元

relay 处理单元在 DM-worker 进程启动后即开始自动运行。通过使用 pause-relay 命令,我们可以暂停 relay 处理单元的运行。

当需要切换 DM-worker 通过虚拟 IP 连接的上游 MySQL 时,我们需要使用 pause-relay 对 DM 执行变更。具体变更步骤请参考虚拟 IP 环境下的上游主从切换

  1. help pause-relay
  1. pause DM-worker's relay unit
  2. Usage:
  3. dmctl pause-relay <-w worker ...> [flags]
  4. Flags:
  5. -h, --help help for pause-relay
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. pause-relay -w "127.0.0.1:8262"

参数解释

  • -w
    • 必选
    • 指定需要暂停 relay 处理单元的 DM-worker

返回结果示例

  1. pause-relay -w "172.16.30.15:8262"
  1. {
  2. "op": "InvalidRelayOp",
  3. "result": true,
  4. "msg": "",
  5. "workers": [
  6. {
  7. "op": "PauseRelay",
  8. "result": true,
  9. "worker": "172.16.30.15:8262",
  10. "msg": ""
  11. }
  12. ]
  13. }

恢复 relay 处理单元

resume-relay 用于恢复处于 Paused 状态的 relay 处理单元。

当需要切换 DM-worker 通过虚拟 IP 连接的上游 MySQL 时,我们需要使用 resume-relay 对 DM 执行变更。具体变更步骤请参考虚拟 IP 环境下的上游主从切换

  1. help resume-relay
  1. resume DM-worker's relay unit
  2. Usage:
  3. dmctl resume-relay <-w worker ...> [flags]
  4. Flags:
  5. -h, --help help for resume-relay
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. resume-relay -w "127.0.0.1:8262"

参数解释

  • -w
    • 必选
    • 指定需要恢复 relay 处理单元的 DM-worker

返回结果示例

  1. resume-relay -w "172.16.30.15:8262"
  1. {
  2. "op": "InvalidRelayOp",
  3. "result": true,
  4. "msg": "",
  5. "workers": [
  6. {
  7. "op": "ResumeRelay",
  8. "result": true,
  9. "worker": "172.16.30.15:8262",
  10. "msg": ""
  11. }
  12. ]
  13. }

切换 relay log 到新的子目录

relay 处理单元通过使用不同的子目录来存储来自上游不同 MySQL 实例的 binlog 数据。通过使用 switch-relay-master 命令,我们可以变更 relay 处理单元以开始使用一个新的子目录。

当需要切换 DM-worker 通过虚拟 IP 连接的上游 MySQL 时,我们需要使用 switch-relay-master 对 DM 执行变更。具体变更步骤请参考虚拟 IP 环境下的上游主从切换

  1. help switch-relay-master
  1. switch the master server of the DM-worker's relay unit
  2. Usage:
  3. dmctl switch-relay-master <-w worker ...> [flags]
  4. Flags:
  5. -h, --help help for switch-relay-master
  6. Global Flags:
  7. -w, --worker strings DM-worker ID

命令用法示例

  1. switch-relay-master -w "127.0.0.1:8262"

参数解释

  • -w
    • 必选
    • 指定需要切换 relay 处理单元使用子目录的 DM-worker

返回结果示例

  1. switch-relay-master -w "172.16.30.15:8262"
  1. {
  2. "result": true,
  3. "msg": "",
  4. "workers": [
  5. {
  6. "result": true,
  7. "worker": "172.16.30.15:8262",
  8. "msg": ""
  9. }
  10. ]
  11. }

手动清理 relay log

DM 支持自动清理 relay log,但同时 DM 也支持使用 purge-relay 命令手动清理 relay log

  1. help purge-relay
  1. purge relay log files of the DM-worker according to the specified filename
  2. Usage:
  3. dmctl purge-relay <-w worker> [--filename] [--sub-dir] [flags]
  4. Flags:
  5. -f, --filename string name of the terminal file before which to purge relay log files. Sample format: "mysql-bin.000006"
  6. -h, --help help for purge-relay
  7. -s, --sub-dir string specify relay sub directory for --filename. If not specified, the latest one will be used. Sample format: "2ae76434-f79f-11e8-bde2-0242ac130008.000001"
  8. Global Flags:
  9. -w, --worker strings DM-worker ID

命令用法示例

  1. purge-relay -w "127.0.0.1:8262" --filename "mysql-bin.000003"

参数解释

  • -w
    • 必选
    • 指定需要执行 relay log 清理操作的 DM-worker
  • --filename
    • 必选
    • 指定标识 relay log 将要停止清理的文件名。如指定为 mysql-bin.000100,则只尝试清理到 mysql-bin.000099
  • --sub-dir
    • 可选
    • 指定 --filename 对应的 relay log 子目录,如果不指定则会使用当前最新的子目录

返回结果示例

  1. purge-relay -w "127.0.0.1:8262" --filename "mysql-bin.000003"
  1. [warn] no --sub-dir specified for --filename; the latest one will be used
  2. {
  3. "result": true,
  4. "msg": "",
  5. "workers": [
  6. {
  7. "result": true,
  8. "worker": "127.0.0.1:8262",
  9. "msg": ""
  10. }
  11. ]
  12. }

预设跳过 DDL 操作

sql-skip 命令用于预设一个跳过操作。当 binlog event 的 position 或 SQL 语句与指定的 binlog-possql-pattern 匹配时,执行该跳过操作。相关参数与结果解释,请参考sql-skip

预设替换 DDL 操作

sql-replace 命令用于预设一个替换执行操作。当 binlog event 的 position 或 SQL 语句与指定的 binlog-possql-pattern 匹配时,执行该替换执行操作。相关参数与结果解释,请参考sql-replace

强制刷新 task => DM-workers 映射关系

refresh-worker-tasks 命令用于强制刷新 DM-master 内存中维护的 task => DM-workers 映射关系。

注意:

一般不需要使用此命令。仅当已确定 task => DM-workers 映射关系存在,但执行其它命令时仍提示必须刷新它时,你才需要使用此命令。

dmctl 命令模式

命令模式跟交互模式的区别是,执行命令时只需要在 dmctl 命令后紧接着执行任务操作,任务操作同交互模式的参数一致。

注意:

  • 一条 dmctl 命令只能跟一个任务操作
  • 任务操作只能放在 dmctl 命令的最后
  1. ./dmctl -master-addr 172.16.30.14:8261 start-task task.yaml
  2. ./dmctl -master-addr 172.16.30.14:8261 stop-task task
  3. ./dmctl -master-addr 172.16.30.14:8261 query-status
  1. Available Commands:
  2. break-ddl-lock break-ddl-lock <-w worker ...> <task-name> [--remove-id] [--exec] [--skip]
  3. check-task check-task <config-file>
  4. migrate-relay migrate-relay <worker> <binlogName> <binlogPos>
  5. pause-relay pause-relay <-w worker ...>
  6. pause-task pause-task [-w worker ...] <task-name>
  7. purge-relay purge-relay <-w worker> [--filename] [--sub-dir]
  8. query-error query-error [-w worker ...] [task-name]
  9. query-status query-status [-w worker ...] [task-name]
  10. refresh-worker-tasks refresh-worker-tasks
  11. resume-relay resume-relay <-w worker ...>
  12. resume-task resume-task [-w worker ...] <task-name>
  13. show-ddl-locks show-ddl-locks [-w worker ...] [task-name]
  14. sql-inject sql-inject <-w worker> <task-name> <sql1;sql2;>
  15. sql-replace sql-replace <-w worker> [-b binlog-pos] [-s sql-pattern] [--sharding] <task-name> <sql1;sql2;>
  16. sql-skip sql-skip <-w worker> [-b binlog-pos] [-s sql-pattern] [--sharding] <task-name>
  17. start-task start-task [-w worker ...] <config-file>
  18. stop-task stop-task [-w worker ...] <task-name>
  19. switch-relay-master switch-relay-master <-w worker ...>
  20. unlock-ddl-lock unlock-ddl-lock [-w worker ...] <lock-ID>
  21. update-master-config update-master-config <config-file>
  22. update-relay update-relay [-w worker ...] <config-file>
  23. update-task update-task [-w worker ...] <config-file>

废弃或不推荐使用的命令

以下命令已经被废弃或仅用于 debug,在接下来的版本中可能会被移除或修改其语义,强烈不推荐使用

  • migrate-relay
  • sql-inject
  • update-master-config
  • update-relay