Vector 缺失值填充预测组件

功能介绍

使用 Vecotor 缺失值填充模型对流Vector数据进行数据填充。

参数说明

名称 中文名称 描述 类型 是否必须? 默认值
outputCol 输出结果列 输出结果列列名,可选,默认null String null

脚本示例

运行脚本

  1. data = np.array([["1:3,2:4,4:7", 1],\
  2. ["1:3,2:NaN", 3],\
  3. ["2:4,4:5", 4]])
  4. df = pd.DataFrame({"vec" : data[:,0], "id" : data[:,1]})
  5. dataStream = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="stream")
  6. data = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="batch")
  7. vecFill = VectorImputerTrainBatchOp().setSelectedCol("vec")
  8. model = data.link(vecFill)
  9. VectorImputerPredictStreamOp(model).setOutputCol("vec1").linkFrom(dataStream).print()
  10. StreamOperator.execute()

运行结果

vec id vec1
1:3,2:4,4:7 1 1:3.0 2:4.0 4:7.0
1:3,2:NaN 3 1:3.0 2:4.0
2:4,4:5 4 2:4.0 4:5.0