功能介绍

提供可以在 Pipeline 中使用 SQL select 语句的功能。

参数说明

名称 中文名称 描述 类型 是否必须? 默认值
clause 运算语句 运算语句 String

脚本示例

脚本代码

  1. import pandas as pd
  2. import numpy as np
  3. schema = "age int, name string"
  4. data = np.array([
  5. [14, "Tony"],
  6. [35, "Tommy"],
  7. [72, "Tongli"],
  8. ])
  9. df = pd.DataFrame.from_records(data)
  10. source = BatchOperator.fromDataframe(df, "age int, name string")
  11. select = Select().setClause("CASE WHEN age < 18 THEN 0 WHEN age >= 18 AND age < 60 THEN 1 ELSE 2 END AS class, name")
  12. select.transform(source).print()