Cassandra 数据存储

本章节以在 CentOS 7.2 中的实际例子来说明如何通过 Cassandra 来存储相关的信息。

安装与验证 Cassandra 服务器

读者可以参考 Cassandra 官方文档Docker 来下载安装 Cassandra,本文章使用 Cassandra 3.11.3 版本。

配置 EMQ X 服务器

通过 RPM 方式安装的 EMQ X,Cassandra 相关的配置文件位于 /etc/emqx/plugins/emqx_backend_cassa.conf,如果只是测试 Cassandra 持久化的功能,大部分配置不需要做更改,填入用户名、密码、keyspace 即可:

  1. backend.ecql.pool1.nodes = 127.0.0.1:9042
  2. backend.ecql.pool1.size = 8
  3. backend.ecql.pool1.auto_reconnect = 1
  4. backend.ecql.pool1.username = cassandra
  5. backend.ecql.pool1.password = cassandra
  6. backend.ecql.pool1.keyspace = mqtt
  7. backend.ecql.pool1.logger = info

保持剩下部分的配置文件不变,然后需要启动该插件。启动插件的方式有 命令行控制台两种方式,读者可以任选其一。

keyspace 初始化

在 Cassandra 上创建名为 mqtt 的 keyspace:

  1. cqlsh> CREATE KEYSPACE IF NOT EXISTS mqtt WITH REPLICATION = {'class': 'SimpleStrategy','replication_factor':1};
  2. cqlsh> describe keyspaces
  3. system_traces mqtt system
  4. cqlsh> use mqtt;

通过命令行启动

  1. emqx_ctl plugins load emqx_backend_cassa

通过管理控制台启动

EMQ X 管理控制台 插件 页面中,找到 emqx_backend_cassa 插件,点击 启动

客户端在线状态存储

客户端上下线时,插件将更新在线状态、上下线时间、节点客户端列表至 Cassandra 数据库。

数据表

创建 mqtt.client 设备在线状态表:

  1. CREATE TABLE mqtt.client (
  2. client_id text,
  3. node text,
  4. state int,
  5. connected timestamp,
  6. disconnected timestamp,
  7. PRIMARY KEY(client_id)
  8. );

配置项

打开配置文件,配置 Backend 规则:

  1. ## hook: client.connected、client.disconnected
  2. ## action/function: on_client_connected、on_client_disconnected
  3. ## 客户端上下线
  4. backend.cassa.hook.client.connected.1 = {"action": {"function": "on_client_connected"}, "pool": "pool1"}
  5. ## 客户端下线
  6. backend.cassa.hook.client.disconnected.1 = {"action": {"function": "on_client_disconnected"}, "pool": "pool1"}

使用示例

浏览器打开 http://127.0.0.1:18083 EMQ X 管理控制台,在 工具 -> Websocket 中新建一个客户端连接,指定 clientid 为 sub_client,点击连接,连接成功后手动断开:

image-20181116105333637

查看 mqtt.client 表,此时将写入 / 更新一条客户端上下线记录:

  1. cqlsh:mqtt> select * from mqtt.client ;
  2. client_id | connected | disconnected | node | state
  3. ------------+--------------------------+--------------+----------------+-------
  4. sub_client | 2018-11-20 01:49:20+0000 | null | emqx@127.0.0.1 | 1
  5. (1 rows)

客户端代理订阅

客户端上线时,存储模块直接从数据库读取预设待订阅列表,代理加载订阅主题。在客户端需要通过预定主题通信(接收消息)场景下,应用能从数据层面设定 / 改变代理订阅列表。

数据表

创建 mqtt.sub 设备订阅表:

  1. CREATE TABLE mqtt.sub (
  2. client_id text,
  3. topic text,
  4. qos int,
  5. PRIMARY KEY(client_id, topic)
  6. );

配置项

打开配置文件,配置 Backend 规则:

  1. ## hook: client.connected
  2. ## action/function: on_subscribe_lookup
  3. backend.cassa.hook.client.connected.2 = {"action": {"function": "on_subscribe_lookup"}, "pool": "pool1"}

使用示例

sub_client 设备上线时,需要为其订阅 sub_client/upstreamsub_client/downlink 两个 QoS 1 的主题:

  • mqtt.sub 表中初始化插入代理订阅主题信息:
  1. insert into mqtt.sub(client_id, topic, qos) values('sub_client', 'sub_client/upstream', 1);
  2. insert into mqtt.sub(client_id, topic, qos) values('sub_client', 'sub_client/downlink', 1);
  • EMQ X 管理控制台 WebSocket 页面,以 clientid sub_client 新建一个客户端连接,切换至订阅页面,可见当前客户端自动订阅了 sub_client/upstreamsub_client/downlink 两个 QoS 1 的主题:image-20181116110036523

  • 切换回管理控制台 WebSocket 页面,向 sub_client/downlink 主题发布消息,可在消息订阅列表收到发布的消息。

持久化发布消息

数据表

创建 mqtt.msg MQTT 消息持久化表:

  1. CREATE TABLE mqtt.msg (
  2. topic text,
  3. msgid text,
  4. sender text, -- 发布的 clientid
  5. qos int,
  6. retain int,
  7. payload text,
  8. arrived timestamp, -- 发布时间
  9. PRIMARY KEY(topic, msgid)
  10. ) WITH CLUSTERING ORDER BY (msgid DESC);

配置项

打开配置文件,配置 Backend 规则,支持使用 topic 参数进行消息过滤,此处使用 # 通配符存储任意主题消息:

  1. ## hook: message.publish
  2. ## action/function: on_message_publish
  3. backend.cassa.hook.message.publish.1 = {"topic": "#", "action": {"function": "on_message_publish"}, "pool": "pool1"}

使用示例

在 EMQ X 管理控制台 WebSocket 页面中,使用 clientdi sub_client 建立连接,向主题 upstream_topic 发布多条消息,EMQ X 将消息列表持久化至 mqtt.msg 表中:

  1. cqlsh:mqtt> select * from mqtt.msg;
  2. topic | msgid | arrived | payload | qos | retain | sender
  3. ----------------+----------------------+--------------------------+---------------------+-----+--------+------------
  4. upstream_topic | 2VI0ceNQJ1UPaUHki88I | 2018-11-20 01:54:40+0000 | { "cmd": "reboot" } | 1 | null | sub_client
  5. (1 rows)

暂只支持 QoS 1 2 的消息持久化。

Retain 消息持久化

表结构

创建 mqtt.retain Retain 消息表:

  1. CREATE TABLE mqtt.retain (
  2. topic text,
  3. msgid text,
  4. PRIMARY KEY(topic)
  5. );

配置项

打开配置文件,配置 Backend 规则:

  1. ## 同时开启以下规则,启用 retain 持久化三个生命周期
  2. ## 发布非空 retain 消息时 (存储)
  3. backend.cassa.hook.message.publish.2 = {"topic": "#", "action": {"function": "on_message_retain"}, "pool": "pool1"}
  4. ## 设备订阅主题时查询 retain 消息
  5. backend.cassa.hook.session.subscribed.2 = {"topic": "#", "action": {"function": "on_retain_lookup"}, "pool": "pool1"}
  6. ## 发布空 retain 消息时 (清除)
  7. backend.cassa.hook.message.publish.3 = {"topic": "#", "action": {"function": "on_retain_delete"}, "pool": "pool1"}

使用示例

在 EMQ X 管理控制台 WebSocket 页面中建立连接后,发布消息勾选保留

image-20181119111926675

发布(消息不为空)

非空的 retain 消息发布时,EMQ X 将以 topic 为唯一键,持久化该条消息至 mqtt.retain 表中,相同主题下发从不同的 retain 消息,只有最后一条消息会被持久化:

  1. cqlsh:mqtt> select * from mqtt.retain;
  2. topic | msgid
  3. ----------------+----------------------
  4. upstream_topic | 2VI0fSdsg79YegwFTMDz

订阅

客户端订阅 retain 主题后,EMQ X 将查询 mqtt.retain 表,执行投递 retain 消息操作。

发布(消息为空)

MQTT 协议中,发布空的 retain 消息将清空 retain 记录,此时 retain 记录将从 mqtt.retain 表中删除。

消息确认持久化

开启消息确认 (ACK) 持久化后,客户端订阅 QoS 1、QoS 2 级别的主题时,EMQ X 将在数据库以 clientid + topic 为唯一键初始化 ACK 记录。

数据表

创建 mqtt.acked 客户端消息确认表:

  1. CREATE TABLE mqtt.acked (
  2. client_id text,
  3. topic text,
  4. msgid text,
  5. PRIMARY KEY(client_id, topic)
  6. );

配置项

打开配置文件,配置 Backend 规则,可使用 topic 通配符 过滤要应用的消息:

  1. ## 订阅时初始化 ACK 记录
  2. backend.cassa.hook.session.subscribed.1 = {"topic": "#", "action": {"function": "on_message_fetch"}, "pool": "pool1"}
  3. ## 消息抵达时更新抵达状态
  4. backend.cassa.hook.message.acked.1 = {"topic": "#", "action": {"function": "on_message_acked"}, "pool": "pool1"}
  5. ## 取消订阅时删除记录行
  6. backend.cassa.hook.session.unsubscribed.1= {"topic": "#", "action": {"cql": ["delete from acked where client_id = ${clientid} and topic = ${topic}"]}, "pool": "pool1"}

使用示例

在 EMQ X 管理控制台 WebSocket 页面中建立连接后,订阅 QoS > 0 的主题:

image-20181119140251843

此时 mqtt.acked 表将插入初始化数据行:

  1. cqlsh:mqtt> select * from mqtt.acked;
  2. client_id | topic | msgid
  3. ------------+----------------+----------------------
  4. sub_client | upstream_topic | 2VI0o9gul3jAXzYE9q4f
  5. (1 rows)

代理订阅中满足 QoS > 0 的 topic 也会初始化记录,客户端取消订阅后相关记录将被删除。

高级选项

  1. backend.mongo.time_range = 5s
  2. backend.mongo.max_returned_count = 500

总结

读者在理解了 Cassandra 中所存储的数据结构之后,可以结合 Cassandra 拓展相关应用。