分库(sharding)版配置文件说明

分库(sharding)版配置文件包括用户配置文件(users.json)、变量处理配置文件(variables.json)、分库版本的分片规则配置文件(sharding.json)和分库版本的启动配置文件(shard.conf),具体说明如下:

1.users.json

  1. {
  2. "users": [{
  3. "user": "XXXX",
  4. "client_pwd": "XXXXXX",
  5. "server_pwd": "XXXXXX"
  6. }, {
  7. "user": "XXXX",
  8. "client_pwd": "XXXXXX",
  9. "server_pwd": "XXXXXX"
  10. }]
  11. }

users.json用来配置用户登陆信息,采用键值对的结构,其中键是固定的,值是用户在MySQL创建的登陆用户名和密码。

其中user的值是用户名;client_pwd的值是前端登录Cetus的密码;server_pwd的值是Cetus登录后端的密码。

例如:

  1. {
  2. "users": [{
  3. "user": "root",
  4. "client_pwd": "123",
  5. "server_pwd": "123456"
  6. }, {
  7. "user": "test",
  8. "client_pwd": "456",
  9. "server_pwd": "123456"
  10. }]
  11. }

我们配置了2个用户名root和test。其中root用户前端登录Cetus的密码是123,Cetus登录后端的密码是123456;test用户前端登录Cetus的密码是456,Cetus登录后端的密码是123456。

2.variables.json

Cetus支持部分会话级系统变量的设置,可以通过在variables.json配置允许发送的值和静默处理的值,如下:

  1. {
  2. "variables": [
  3. {
  4. "name": "XXXXX",
  5. "type": "XXXX",
  6. "allowed_values": ["XXX"]
  7. },
  8. {
  9. "name": "XXXXX",
  10. "type": "XXXX",
  11. "allowed_values": ["XXX"],
  12. "silent_values": ["XX"]
  13. }
  14. ]
  15. }

variables.json同样采用键值对的结构,其中键是固定的,值是用用户自定义的。

其中name的值是需要设置的会话级系统变量的名称;type的值是变量的类型,可以为int, string或string-csv逗号分隔的字符串值;allowed_values的值是指定允许设定的变量值,可以使用通配符表示此变量设任意值都允许;silent_values的值是指定静默处理的值,可以使用通配符,表示此变量设任意值都静默处理。特别值得一提,配置文件中的所有项,都需要用双引号包裹起来,否则不生效。

注意:配置过allowed_values才能走到静默处理流程

例如:

  1. {
  2. "variables": [
  3. {
  4. "name": "sql_mode",
  5. "type": "string-csv",
  6. "allowed_values":
  7. ["STRICT_TRANS_TABLES",
  8. "NO_AUTO_CREATE_USER",
  9. "NO_ENGINE_SUBSTITUTION"
  10. ]
  11. },
  12. {
  13. "name": "profiling",
  14. "type": "int",
  15. "allowed_values": ["0", "1"],
  16. "silent_values": ["*"]
  17. }
  18. ]
  19. }

我们配置了sql_mode变量和profiling变量。其中sql_mode变量的类型是string-csv(逗号分隔的字符串值),指定了允许设定的变量有STRICT_TRANS_TABLES、NO_AUTO_CREATE_USER和NO_ENGINE_SUBSTITUTION;profiling变量的类型是int(整型),此变量允许值是0和1,指定静默处理的值为所有,即静默处理0和1。

3.sharding.json

  1. {
  2. "vdb": [
  3. {
  4. "id": X,
  5. "type": "XXX",
  6. "method": "XXXX",
  7. "num": X,
  8. "partitions": {"XXXX1": [X,X], "XXXX2": [X,X], "XXXX3": [X,X], "XXXX4": [X,X]}
  9. },
  10. {
  11. "id": X,
  12. "type": "XXX",
  13. "method": "XXXXX",
  14. "num": X,
  15. "partitions": {"XXXX1": XXXXXX, "XXXX2": XXXXXX, "XXXX3": XXXXXX,"XXXX4": XXXXXX}
  16. }
  17. ],
  18. "table": [
  19. {"vdb": X, "db": "XXXX", "table": "XXX", "pkey": "XX"},
  20. {"vdb": X, "db": "XXXX", "table": "XXX", "pkey": "XX"},
  21. {"vdb": X, "db": "XXXX", "table": "XXX", "pkey": "XX"},
  22. {"vdb": X, "db": "XXXX", "table": "XXX", "pkey": "XX"}
  23. ]
  24. "single_tables": [
  25. {"table": "XXX", "db": "XXXX", "group": "XXXX1"},
  26. {"table": "XXX", "db": "XXXX", "group": "data2"}
  27. ]
  28. }

sharding.json是分库版本的分库规则配置文件,同样采用键值对的结构,其中键是固定的,值是由用户自定义。

其中vdb逻辑db,包含属性有id、type、method、num和partitions,id的值是逻辑db的id,type的值是分片键的类型(int,char,date或者datetime),method的值是分片方式,num的值是hash分片的底数(range分片的num为0),partitions是分组名和分片范围的键值对,其中键和值都是用户自定义的;table是分片表,包含属性有vdb、db、table和pkey,vdb的值是逻辑db的id,db的值是物理db名,table的是分片表名,pkey的值是分片键;single_tables是单点全局表,包含属性有table、db和group,table的值是表名,db的值是物理db名,group的值是单点全局表的默认分组,可由用户自定义设置。

例如:

  1. {
  2. "vdb": [
  3. {
  4. "id": 1,
  5. "type": "char",
  6. "method": "hash",
  7. "num": 8,
  8. "partitions": {"data1": [0,1], "data2": [2,3], "data3": [4,5], "data4": [6,7]}
  9. },
  10. {
  11. "id": 2,
  12. "type": "int",
  13. "method": "range",
  14. "num": 0,
  15. "partitions": {"data1": 124999, "data2": 249999, "data3": 374999,"data4": 499999}
  16. },
  17. {
  18. "id": 3,
  19. "type": "datetime",
  20. "method": "range",
  21. "num": 0,
  22. "partitions": {"data1": "2019-03-05 09:53:06", "data2": "2020-03-05 09:53:06", "data3": "2021-03-05 09:53:06","data4": "2022-03-05 09:53:06"}
  23. }
  24. ],
  25. "table": [
  26. {"vdb": 1, "db": "employees_hash", "table": "dept_emp", "pkey": "emp_no"},
  27. {"vdb": 1, "db": "employees_hash", "table": "employees", "pkey": "emp_no"},
  28. {"vdb": 2, "db": "employees_range", "table": "dept_emp", "pkey": "emp_no"},
  29. {"vdb": 2, "db": "employees_range", "table": "employees", "pkey": "emp_no"},
  30. {"vdb": 3, "db": "purchase_range", "table": "purchase", "pkey": "t_time"}
  31. ]
  32. "single_tables": [
  33. {"table": "regioncode", "db": "employees_hash", "group": "data1"},
  34. {"table": "countries", "db": "employees_range", "group": "data1"}
  35. ]
  36. }

我们配置了三种vdb分片规则,第一种规则的id为1,分片键类型是char,分片方法是hash,hash分片的底数为8,一共分了4组,分组名为data1的分片范围为0和1,分组名为data2的分片范围为2和3,分组名为data3的分片范围为4和5,分组名为data4的分片范围为6和7;第二种规则的id为2,分片键类型是int,分片方法是range,range无底数num设为0,一共分了4组,分组名为data1的分片范围为0-124999,分组名为data2的分片范围为125000-249999,分组名为data3的分片范围为250000-374999,分组名为data4的分片范围为37500-499999;第三种分片规则的id为3,分片键类型是datetime,分片方法是range,同样分了4个分组,与第二种分片规则类似,就不再赘述了。

分片表table涉及三个物理db,为employees_hash、employees_range和purchase_range,其中employees_hash采用第一种分片规则,表dept_emp的分片键为emp_no,表employees的分片键为emp_no,employees_range采用第二种分片规则,表dept_emp的分片键为emp_no,表employees的分片键为emp_no;purchase_range采用第三种分片规则,表purchase的分片键为t_time。

单点全局表single_tables有两个,分别为employees_hash的regioncode表和employees_range的countries表,设置默认分给第一组。

注意:分片规则中的库名和表名,是大小写不敏感的。

4.shard.conf

  1. [cetus]
  2. # Loaded Plugins
  3. plugins=XXXX,XXXX
  4. # Defines the number of worker processes.
  5. worker-processes=XXX
  6. # Set the network interface for distinguishing cetus instances
  7. ifname=XXX
  8. # Set the worker id for the cetus instance(取值范围1~63)
  9. worker-id=XX
  10. # Proxy Configuration
  11. proxy-address=XXX.XXX.XXX.XXX:XXXX
  12. proxy-backend-addresses=XXX.XXX.XXX.XXX:XXXX@XXXX1,XXX.XXX.XXX.XXX:XXXX@XXXX2,XXX.XXX.XXX.XXX:XXXX@XXXX3,XXX.XXX.XXX.XXX:XXXX@XXXX4
  13. proxy-read-only-backend-addresses=XXX.XXX.XXX.XXX:XXXX@XXXX1,XXX.XXX.XXX.XXX:XXXX@XXXX2,XXX.XXX.XXX.XXX:XXXX@XXXX3,XXX.XXX.XXX.XXX:XXXX@XXXX4
  14. # Admin Configuration
  15. admin-address=XXX.XXX.XXX.XXX:XXXX
  16. admin-username=XXXX
  17. admin-password=XXXX
  18. # Backend Configuration
  19. default-db=XXX
  20. default-username=XXXX
  21. # Log Configuration
  22. log-file=XXXX
  23. log-level=XXXX

shard.conf是分库版本的启动配置文件,在启动Cetus时需要加载,配置文件同样采用key=value的形式,其中key是固定的,可参考Cetus 启动配置选项说明,value是用户自定义的。其中proxy-read-only-backend-addresses只读后端(从库)的配置可根据业务需求选配。

例如:

  1. [cetus]
  2. # Loaded Plugins
  3. plugins=shard,admin
  4. # Defines the number of worker processes.
  5. worker-processes=4
  6. # Set the network interface for distinguishing cetus instances
  7. ifname=eth0
  8. # Set the worker id for the cetus instance
  9. worker-id=1
  10. # Proxy Configuration
  11. proxy-address=127.0.0.1:1234
  12. proxy-backend-addresses=127.0.0.1:3361@data1,127.0.0.1:3362@data2,127.0.0.1:3363@data3,127.0.0.1:3364@data4
  13. proxy-read-only-backend-addresses=127.0.0.1:3371@data1,127.0.0.1:3372@data2,127.0.0.1:3373@data3,127.0.0.1:3374@data4
  14. # Admin Configuration
  15. admin-address=127.0.0.1:5678
  16. admin-username=admin
  17. admin-password=admin
  18. # Backend Configuration
  19. default-db=test
  20. default-username=test
  21. # Log Configuration
  22. log-file=cetus.log
  23. log-level=debug

我们配置了分库版本的启动选项,其中plugins的值是加载插件的名称,分库(sharding)版本需加载的插件为shard和admin;

worker-processes为4,代表工作进程数量为4,建议设置数量小于等于cpu数目;

设置ifname为eth0,cetus可以通过eth0找到机器的mac地址,从而可以用来区分不同机器的cetus实例;

设置worker-id=1,主要为guid使用,当ifname设置无效时,worker-id也会起到ifname的作用,需要注意的是不同实例应该设置不一样。

proxy-address的值是Proxy监听的IP和端口,我们设置为127.0.0.1:1234;proxy-backend-addresses的值是读写后端(主库)的IP和端口,需要同时指定group(@group),本例分为4个group,分别data1的127.0.0.1:3361、data2的127.0.0.1:3362、data3的127.0.0.1:3363、data4的127.0.0.1:3364;proxy-read-only-backend-addresses的值是只读后端(从库)的IP和端口,需要同时指定group(@group),本例分为4个group,分别data1的127.0.0.1:3371、data2的127.0.0.1:3372、data3的127.0.0.1:3373、data4的127.0.0.1:3374;

admin-address的值是管理模块的IP和端口,我们设置为127.0.0.1:5678;admin-username的值是管理模块的用户名,我们设置为admin;admin-password的值是管理模块的密码明文,我们设置为admin;

default-db的值是默认数据库,当连接未指定db时,使用的默认数据库名称,我们设置为test;default-username的值是默认登陆用户名,在Proxy启动时自动创建连接使用的用户名,我们设置为test;

log-file的值是日志文件路径,我们设置为当前安装路径下的cetus.log;log-level的值是日志记录级别,可选 info | message | warning | error | critical(default),我们设置为debug;这些是必备启动选项,其他可选性能配置详见Cetus 启动配置选项说明

注:

以上配置文件中.json文件名称不可变,.conf文件可自定义名称,并利用命令行加载

启动配置文件shard.conf 常用参数:

1)default-pool-size=<num>,设置刚启动的连接数量(by a worker process),最小只能设置为10,如果设置小于10,则实际该值为10

2)max-pool-size=<num>,设置最大连接数量(by a worker process)

3)max-resp-size=<num>,设置最大响应大小,一旦超过此大小,则会报错给客户端

4)enable-client-compress=[true|false],支持客户端压缩

5)enable-tcp-stream=[true|false],启动tcp stream,无需等响应收完就发送给客户端

6)master-preferred=[true|false],除非注释强制访问从库,否则一律访问主库

7)reduce-connections=[true|false],自动减少过多的后端连接数量

8)max-alive-time=<num>,设置后端连接最大存活时间

9)enable-fast-stream=[true|false],启动fast stream,快速处理只读响应,默认为false

10) partition-mode=[true|false],如果设置true,cetus为分表模式;如果为false,则分片模式

11) enable-sql-special-processed=[true|false],如果遇到Cetus解析器不支持的SQL(通常报错:near "xx":syntax error),可以通过设置该参数为true,跳过解析器解析,并通过注释的形式,告诉Cetus 该SQL的路由方法。例如,通过上述配置,该SQL可以正常支持:/#group=data1/update test1 a join test2 b on a.id=b.id set a.name='test';