扩展

Kuiper 允许用户自定义扩展,以支持更多的功能。用户可编写插件进行扩展;也可以通过配置的方式,扩展 SQL 中的函数,用于调用外部已有的 REST 或 RPC 服务。

使用插件扩展较为复杂,需要用户编写代码并自行编译,具有一定的开发成本。其使用的场景包括:

  • 需要扩展源或是 sink
  • 对性能要求较高

使用外部函数扩展,仅需要进行配置,但其需要通过网络进行调用,有一定性能损耗。使用的场景包括:

  • 调用已有的服务,如 REST 或 grpc 提供的 AI 服务
  • 需要灵活部署的服务

插件扩展

Kuiper 允许用户自定义不同类型的扩展。

  • 源扩展用于扩展不同的流源,例如使用来自其他消息服务器的数据。Kuiper 对 MQTT 消息服务器的内置源提供支持。
  • Sink/Action 扩展用于将发布/推送数据扩展到不同的目标,例如数据库,其他消息系统,Web 界面或文件系统。Kuiper 中提供内置动作支持,请参阅 MQTT & 日志文件.。
  • 函数扩展允许用户扩展 SQL 中使用的不同函数。 Kuiper支持内置函数,请参见 函数

请阅读以下内容,了解如何实现不同的扩展。

命名

建议插件名使用 camel case 形式。插件命名有一些限制:

  1. 插件输出变量必须为插件名的首字母大写形式。 例如,插件名为 file ,则其输出变量名必须为 File
  2. .so 文件的名字必须与输出变量名或者插件名相同。例如, MySource.somySink.so

状态存储

Kuiper 扩展通过 context 参数暴露了一个基于键值对的状态存储接口,可用于所有类型的扩展,包括 Source,Sink 和 Function 扩展.

状态为键值对,其中键为 string 类型而值为任意数据。键的作用域仅为当前扩展的实例。

用户可通过 context 对象访问状态存储。状态相关方法包括 putState, getState, incrCounter, getCounter and deleteState。

以下代码为函数扩展访问状态的实例。该函数将计算传入的单词数,并将累积数目保存在状态中。

  1. func (f *accumulateWordCountFunc) Exec(args []interface{}, ctx api.FunctionContext) (interface{}, bool) {
  2. logger := ctx.GetLogger()
  3. err := ctx.IncrCounter("allwordcount", len(strings.Split(args[0], args[1])))
  4. if err != nil {
  5. return err, false
  6. }
  7. if c, err := ctx.GetCounter("allwordcount"); err != nil {
  8. return err, false
  9. } else {
  10. return c, true
  11. }
  12. }

运行时依赖

有些插件可能需要访问文件系统中的依赖文件。依赖文件建放置于 /etc// 目录。打包插件时,依赖文件应放置于 etc 目录。安装后,这些文件会自动移动到推荐的位置。

在插件源代码中,开发者可通过 context 获取 Kuiper 根目录,以访问文件系统中的依赖:

  1. ctx.GetRootPath()

外部函数扩展

提供一种配置的方式,使得 Kuiper 可以使用 SQL 以函数的方式直接调用外部服务,包括各种 rpc 服务, http 服务等。该方式将可大提高 Kuiper 扩展的易用性。外部函数将作为插件系统的补充,仅在性能要求较高的情况下才建议使用插件。

以 getFeature 函数为例,假设有 AI 服务基于 grpc 提供getFeature 服务。则可在Kuiper配置之后,使用 SELECT getFeature(self) from demo 的方式,无需定制插件而调用该 AI 服务。

详细配置方法,请参考外部函数