可以通过执行 DDL 语句 CREATE TABLE 来创建一个表。

使用 CREATE TABLE 语句建表

  • 下面示例使用 CREATE TABLE 语句创建订单表 ware 和 cust 表。
  1. create table ware(w_id int
  2. , w_ytd decimal(12,2)
  3. , w_tax decimal(4,4)
  4. , w_name varchar(10)
  5. , w_street_1 varchar(20)
  6. , w_street_2 varchar(20)
  7. , w_city varchar(20)
  8. , w_state char(2)
  9. , w_zip char(9)
  10. , unique(w_name, w_city)
  11. , primary key(w_id)
  12. );
  13. Query OK, 0 rows affected (0.09 sec)
  14. create table cust (c_w_id int NOT NULL
  15. , c_d_id int NOT null
  16. , c_id int NOT null
  17. , c_discount decimal(4, 4)
  18. , c_credit char(2)
  19. , c_last varchar(16)
  20. , c_first varchar(16)
  21. , c_middle char(2)
  22. , c_balance decimal(12, 2)
  23. , c_ytd_payment decimal(12, 2)
  24. , c_payment_cnt int
  25. , c_credit_lim decimal(12, 2)
  26. , c_street_1 varchar(20)
  27. , c_street_2 varchar(20)
  28. , c_city varchar(20)
  29. , c_state char(2)
  30. , c_zip char(9)
  31. , c_phone char(16)
  32. , c_since date
  33. , c_delivery_cnt int
  34. , c_data varchar(500)
  35. , index icust(c_last, c_d_id, c_w_id, c_first, c_id)
  36. , FOREIGN KEY (c_w_id) REFERENCES ware(w_id)
  37. , primary key (c_w_id, c_d_id, c_id)
  38. );
  39. Query OK, 0 rows affected (0.10 sec)

注意:

由于 ALTER TABLE 语法不支持后期增加主键,所以需要在建表的时候设置主键。

使用 CREATE TABLE 复制表数据

在 MySQL 租户里,可以使用 CREATE TABLE AS SELECT 复制表的数据,但是结构并不完全一致,会丢失约束、索引、默认值、分区等信息。使用 CREATE TABLE LIKE 可以复制表结构,但是不包括数据。

  • 示例:MySQL租户的 CREATE TABLE 复制表结构和数据的区别
  1. obclient> create table t1(
  2. id bigint not null primary KEY
  3. , name varchar(50) not NULL
  4. , gmt_create timestamp not null default current_timestamp
  5. ) partition by hash(id) partitions 8;
  6. Query OK, 0 rows affected (0.10 sec)
  7. obclient> insert into t1(id,name) values(1,'A'),(2,'B'),(3,'C');
  8. Query OK, 3 rows affected (0.03 sec)
  9. Records: 3 Duplicates: 0 Warnings: 0
  10. obclient> create table t1_like like t1;
  11. Query OK, 0 rows affected (0.11 sec)
  12. obclient> create table t1_copy as select * from t1;
  13. Query OK, 3 rows affected (0.12 sec)
  14. obclient> show create table t1_like\G
  15. *************************** 1. row ***************************
  16. Table: t1_like
  17. Create Table: CREATE TABLE `t1_like` (
  18. `id` bigint(20) NOT NULL,
  19. `name` varchar(50) NOT NULL,
  20. `gmt_create` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
  21. PRIMARY KEY (`id`)
  22. ) DEFAULT CHARSET = utf8mb4 ROW_FORMAT = DYNAMIC COMPRESSION = 'zstd_1.0' REPLICA_NUM = 3 BLOCK_SIZE = 16384 USE_BLOOM_FILTER = FALSE TABLET_SIZE = 134217728 PCTFREE = 10
  23. partition by hash(id) partitions 8
  24. 1 row in set (0.00 sec)
  25. obclient> show create table t1_copy\G
  26. *************************** 1. row ***************************
  27. Table: t1_copy
  28. Create Table: CREATE TABLE `t1_copy` (
  29. `id` bigint(20) DEFAULT NULL,
  30. `name` varchar(50) DEFAULT NULL,
  31. `gmt_create` timestamp NULL DEFAULT NULL
  32. ) DEFAULT CHARSET = utf8mb4 ROW_FORMAT = DYNAMIC COMPRESSION = 'zstd_1.0' REPLICA_NUM = 3 BLOCK_SIZE = 16384 USE_BLOOM_FILTER = FALSE TABLET_SIZE = 134217728 PCTFREE = 10
  33. 1 row in set (0.00 sec)
  34. obclient> show create table t1\G
  35. *************************** 1. row ***************************
  36. Table: t1
  37. Create Table: CREATE TABLE `t1` (
  38. `id` bigint(20) NOT NULL,
  39. `name` varchar(50) NOT NULL,
  40. `gmt_create` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
  41. PRIMARY KEY (`id`)
  42. ) DEFAULT CHARSET = utf8mb4 ROW_FORMAT = DYNAMIC COMPRESSION = 'zstd_1.0' REPLICA_NUM = 3 BLOCK_SIZE = 16384 USE_BLOOM_FILTER = FALSE TABLET_SIZE = 134217728 PCTFREE = 10
  43. partition by hash(id) partitions 8
  44. 1 row in set (0.00 sec)

关于表和分区

在 OceanBase 中,数据存储在表中,而数据表示的最小粒度是分区。普通的非分区表,就只有一个分区;而分区表,通常有多个分区,分区名默认以p开头,按数字顺序从0开始编号。所以分区是表的子集。

通常分区对用户的应用是透明的,应用只需要使用 SQL 读写表即可。只有某些场景下,为了提升分区表的查询性能,应用也可以使用 SQL 直接访问某个具体的分区,SQL 语法格式是:

  1. SELECT ... FROM parted_table PARTITION (pN) WHERE query_condition ;
  • 示例:通过 SQL 直接访问分区表的分区
  1. obclient> select o_id,o_c_id,o_carrier_id,o_ol_cnt,o_all_local,o_entry_d from ordr partition (p1) where o_w_id=1 and o_d_id=2 and o_id=2100;
  2. +------+--------+--------------+----------+-------------+------------+
  3. | o_id | o_c_id | o_carrier_id | o_ol_cnt | o_all_local | o_entry_d |
  4. +------+--------+--------------+----------+-------------+------------+
  5. | 2100 | 8 | 8 | 11 | 1 | 2020-02-15 |
  6. +------+--------+--------------+----------+-------------+------------+
  7. 1 row in set (0.01 sec)
  8. obclient> select ol_o_id, ol_number,ol_delivery_d,ol_amount,ol_i_id,ol_supply_w_id,ol_quantity from ordl partition (p1) where ol_w_id=1 and ol_d_id=2 and ol_o_id=2100;
  9. +---------+-----------+---------------+-----------+---------+----------------+-------------+
  10. | ol_o_id | ol_number | ol_delivery_d | ol_amount | ol_i_id | ol_supply_w_id | ol_quantity |
  11. +---------+-----------+---------------+-----------+---------+----------------+-------------+
  12. | 2100 | 1 | 2020-02-15 | 0.00 | 87133 | 1 | 5 |
  13. | 2100 | 2 | 2020-02-15 | 0.00 | 47413 | 1 | 5 |
  14. | 2100 | 3 | 2020-02-15 | 0.00 | 9115 | 1 | 5 |
  15. | 2100 | 4 | 2020-02-15 | 0.00 | 42985 | 1 | 5 |
  16. | 2100 | 5 | 2020-02-15 | 0.00 | 43621 | 1 | 5 |
  17. | 2100 | 6 | 2020-02-15 | 0.00 | 5787 | 1 | 5 |
  18. | 2100 | 7 | 2020-02-15 | 0.00 | 62576 | 1 | 5 |
  19. | 2100 | 8 | 2020-02-15 | 0.00 | 91592 | 1 | 5 |
  20. | 2100 | 9 | 2020-02-15 | 0.00 | 34452 | 1 | 5 |
  21. | 2100 | 10 | 2020-02-15 | 0.00 | 13792 | 1 | 5 |
  22. | 2100 | 11 | 2020-02-15 | 0.00 | 94326 | 1 | 5 |
  23. +---------+-----------+---------------+-----------+---------+----------------+-------------+
  24. 11 rows in set (0.01 sec)

注意:

如果是组合分区,可以访问更细粒度的分区,详细描述请参考“分区路由”章节。

在 OceanBase 里,节点间的数据迁移的最小粒度是分区,每个分区在集群里有三个副本,内容保持同步,角色上有区分。三副本会有一个主副本(Leader 副本)和两个备副本(Follower 副本),只有主副本可以提供写服务,默认也只有主副本可以提供读服务。主副本上的事务提交时会将事务日志同步到两个备副本,三副本使用 Paxos 协议表决事务是否提交成功。有时候为了不影响主副本,可以让备副本承担部分读请求,这就是应用常用的读写分离的解决方案,这种读备称为弱一致性读。使用这种方案,应用读需要承担读延时的风险,这个延时最大允许值会通过参数(max_stale_time_for_weak_consistency)控制。

  • 示例:使用 SQL Hint 实现读写分离。

弱一致读的 Hint 语法是 /*+ read_consistency(weak) */ 。通常的读默认是强一致性读,就不用 Hint 了。

  1. obclient> select /*+ read_consistency(weak) */ o_id,o_c_id,o_carrier_id,o_ol_cnt,o_all_local,o_entry_d from ordr where o_w_id=1 and o_d_id=2 and o_id=2100;
  2. +------+--------+--------------+----------+-------------+------------+
  3. | o_id | o_c_id | o_carrier_id | o_ol_cnt | o_all_local | o_entry_d |
  4. +------+--------+--------------+----------+-------------+------------+
  5. | 2100 | 8 | 8 | 11 | 1 | 2020-02-15 |
  6. +------+--------+--------------+----------+-------------+------------+
  7. 1 row in set (0.00 sec)
  8. obclient>

复制表

复制表是分布式数据库 OceanBase 的高级优化手段。

通常 OceanBase 集群是三副本架构,默认每个表的每个分区在 OceanBase 中会有三个副本数据,角色上分为一个主副本(Leader 副本)和两个备副本(Follower副本),默认提供读写服务的是主副本。

复制表可以指定在租户的每台机器上都有一个备副本,并且主副本跟所有备份的数据使用全同步策略保持强同步。这样做的目的是为了让业务有些 SQL 关联查询时能在同一节点内部执行,以获取更好的性能。

复制表的语法是在 CREATE TABLE 语句后增加 DUPLICATE_SCOPE 选项。

  • 示例:创建复制表。
  1. create table item (i_id int
  2. , i_name varchar(24)
  3. , i_price decimal(5,2)
  4. , i_data varchar(50)
  5. , i_im_id int
  6. , primary key(i_id)) COMPRESS FOR QUERY pctfree=0 BLOCK_SIZE=16384
  7. duplicate_scope='cluster' locality='F,R{all_server}@doc_1, F,R{all_server}@doc_2,F,R{all_server}@doc_3' primary_zone='doc_1';