全量迁移

功能介绍

全量迁移gs_mysync是一个用Python3编写的将MySQL迁移至openGauss的复制工具,支持初始全量数据的复制功能。gs_mysync通过一次初始化配置,使用只读模式,将MySQL的数据全量拉取到openGauss。支持在同一快照下,表间数据并行迁移。

全量迁移支持的功能:支持表及表数据、视图、触发器、自定义函数、存储过程的全量迁移

特性优势

基于sysbench测试模型,2路鲲鹏920 CPU、openEuler操作系统下,MySQL数据库10张表(无主键)单表数据量在500万以上时,gs_mysync使用20并发迁移数据至openGauss,整体全量迁移性能可达300M/s以上。

环境准备

ARM+openEuler 20.03 或 X86+CentOS 5.7

操作步骤

全量迁移gs_mysync依赖MySQL一键式迁移工具gs_rep_portal,可实现全量迁移的安装、启动、停止、卸载整个过程。

  • 下载gs_rep_portal

    1. wget https://opengauss.obs.cn-south-1.myhuaweicloud.com/tools/portal/PortalControl-5.0.0.tar.gz

    解压,并进入portal对应目录

    1. tar -zxvf PortalControl-5.0.0.tar.gz
    2. cd portal
  • 修改gs_rep_portal配置文件

    配置文件位于config目录内,全量迁移相关的配置文件主要包含如下两个,相关参数含义简要说明如下:

    • toolspath.properties
    1. # 全量迁移python虚拟环境的路径,可自定义修改
    2. chameleon.venv.path=/ops/portal/tools/chameleon/
    3. # 全量迁移用户相关路径
    4. chameleon.path=~/.pg_chameleon/
    5. # 全量迁移在线whl包的下载路径
    6. chameleon.pkg.url=https://opengauss.obs.cn-south-1.myhuaweicloud.com/5.0.0/chameleon/chameleon-5.0.0-py3-none-any.whl
    7. # 全量迁移安装包的路径,可自定义修改
    8. chameleon.pkg.path=/ops/portal/pkg/chameleon/
    9. # 全量迁移安装包的名称
    10. chameleon.pkg.name=chameleon-5.0.0-py3-none-any.whl
    • migrationConfig.properties
    1. # 用于指定全量迁移是否迁移对象,包括函数、存储过程、触发器、视图,默认为yes;若设置为no,表示不迁移对象
    2. snapshot.object=yes
    3. # mysql用户名
    4. mysql.user.name=root
    5. # mysql密码
    6. mysql.user.password=***
    7. # mysql数据库ip
    8. mysql.database.host=127.0.0.1
    9. # mysql数据库端口
    10. mysql.database.port=3306
    11. # mysql数据库名称
    12. mysql.database.name=test123
    13. # openGauss用户名
    14. opengauss.user.name=test
    15. # openGauss密码
    16. opengauss.user.password=***
    17. # openGauss数据库ip
    18. opengauss.database.host=127.0.0.1
    19. # openGauss数据库端口
    20. opengauss.database.port=5432
    21. # openGauss数据库名称
    22. opengauss.database.name=test1234
    23. # openGauss数据库的schema名称
    24. opengauss.database.schema=test123
    25. # 全量迁移的安装方式,默认为offline,表示离线安装,需通过参数chameleon.pkg.path指定离线安装包的路径;若设置为online,对应在线安装,在线下载的安装包将存放在参数chameleon.pkg.path指定的路径
    26. default.install.mysql.full.migration.tools.way=offline
  • 安装

    1. sh gs_mysync.sh install workspace.id

    其中workspace.id表示迁移任务id,取值为数字和小写字母的组合,不同的id区分不同的迁移任务,不同迁移任务可并行启动。若未设置workspace.id,则使用其默认值1。若使用已存在的workspace.id,并修改其中的配置,请在portal/workspace/${workspace.id}/config/路径下修改对应的配置文件。

  • 启动

    1. sh gs_mysync.sh start workspace.id
  • 停止

    1. sh gs_mysync.sh stop workspace.id
  • 卸载

    1. sh gs_mysync.sh uninstall workspace.id

上述安装、启动、停止、卸载命令均不会在后台运行,若需在后台运行,请在命令后添加&符号。