使用一种自定义格式

用户在CREATE EXTERNAL TABLE的FORMAT子句中指定一种自定义数据格式。

  1. FORMAT 'CUSTOM' (formatter=format_function, key1=val1,...keyn=valn)

这里’CUSTOM’关键词表示数据是一种自定义格式,而formatter指定用来格式化该数据的函数,其后跟着给formatter函数的用逗号分隔的参数。

Greenplum数据库为格式化固定宽度的数据提供了函数,但是用户必须编写用于可变宽度数据的formatter函数。步骤如下。

  1. 编写并且编译输入和输出函数为一个共享库。
  2. 用CREATE FUNCTION在Greenplum数据库中指定该共享库函数。
  3. 使用CREATE EXTERNAL TABLE的FORMAT子句的formatter参数来调用该函数。

Parent topic: 装载和写入非HDFS自定义数据