使用 BR 恢复持久卷上的备份数据

本文描述了如何将存储在持久卷上的备份数据恢复到 Kubernetes 环境中的 TiDB 集群。底层通过使用 BR 来进行集群恢复。

本文描述的持久卷指任何 Kubernetes 支持的持久卷类型。以下示例以 NFS 存储卷为例,介绍如何将存储在持久卷上指定路径的集群备份数据恢复到 TiDB 集群。

本文使用的恢复方式基于 TiDB Operator 新版(v1.1.8 及以上)的 CustomResourceDefinition (CRD) 实现。

环境准备

注意:

如果使用 TiDB Operator >= v1.1.10 && TiDB >= v4.0.8, BR 会自动调整 tikv_gc_life_time 参数,不需要在 Restore CR 中配置 spec.to 字段,并且可以省略以下创建 restore-demo2-tidb-secret secret 的步骤和数据库账户权限步骤。

  1. 下载文件 backup-rbac.yaml,并执行以下命令在 test2 这个 namespace 中创建恢复所需的 RBAC 相关资源:

    1. kubectl apply -f backup-rbac.yaml -n test2
  2. 创建 restore-demo2-tidb-secret secret,该 secret 存放用来访问 TiDB 服务的账号的密码:

    1. kubectl create secret generic restore-demo2-tidb-secret --from-literal=user=root --from-literal=password=<password> --namespace=test2
  3. 确认可以从 Kubernetes 集群中访问用于存储备份数据的 NFS 服务器。

数据库账户权限

  • mysql.tidb 表的 SELECTUPDATE 权限:恢复前后,Restore CR 需要一个拥有该权限的数据库账户,用于调整 GC 时间

恢复过程

  1. 创建 restore custom resource (CR),将指定的备份数据恢复至 TiDB 集群:

    1. kubectl apply -f restore.yaml

    restore.yaml 文件内容如下:

    1. ---
    2. apiVersion: pingcap.com/v1alpha1
    3. kind: Restore
    4. metadata:
    5. name: demo2-restore-nfs
    6. namespace: test2
    7. spec:
    8. # backupType: full
    9. br:
    10. cluster: demo2
    11. clusterNamespace: test2
    12. # logLevel: info
    13. # statusAddr: ${status-addr}
    14. # concurrency: 4
    15. # rateLimit: 0
    16. # checksum: true
    17. # # Only needed for TiDB Operator < v1.1.10 or TiDB < v4.0.8
    18. # to:
    19. # host: ${tidb_host}
    20. # port: ${tidb_port}
    21. # user: ${tidb_user}
    22. # secretName: restore-demo2-tidb-secret
    23. local:
    24. prefix: backup-nfs
    25. volume:
    26. name: nfs
    27. nfs:
    28. server: ${nfs_server_if}
    29. path: /nfs
    30. volumeMount:
    31. name: nfs
    32. mountPath: /nfs
  2. 创建好 Restore CR 后,通过以下命令查看恢复的状态:

    1. kubectl get rt -n test2 -owide

以上示例将存储在 NFS 上指定路径 local://${.spec.local.volumeMount.mountPath}/${.spec.local.prefix}/ 文件夹下的备份数据恢复到 namespace test2 中的 TiDB 集群 demo2。持久卷存储相关配置参考 Local 存储字段介绍

以上示例中,.spec.br 中的一些参数项均可省略,如 logLevelstatusAddrconcurrencyrateLimitchecksumtimeAgosendCredToTikv。更多 .spec.br 字段的详细解释参考 BR 字段介绍

更多 Restore CR 字段的详细解释参考 Restore CR 字段介绍

故障诊断

在使用过程中如果遇到问题,可以参考故障诊断