功能介绍

本组件用One VS Rest策略进行多分类。

参数说明

名称 中文名称 描述 类型 是否必须? 默认值
numClass 类别数 多分类的类别数,必选 Integer
predictionCol 预测结果列名 预测结果列名 String
predictionDetailCol 预测详细信息列名 预测详细信息列名 String
reservedCols 算法保留列名 算法保留列 String[] null

脚本示例

脚本代码

  1. URL = "http://alink-dataset.cn-hangzhou.oss.aliyun-inc.com/csv/iris.csv";
  2. SCHEMA_STR = "sepal_length double, sepal_width double, petal_length double, petal_width double, category string";
  3. data = CsvSourceBatchOp().setFilePath(URL).setSchemaStr(SCHEMA_STR)
  4. lr = LogisticRegression() \
  5. .setFeatureCols(["sepal_length", "sepal_width", "petal_length", "petal_width"]) \
  6. .setLabelCol("category") \
  7. .setMaxIter(100)
  8. oneVsRest = OneVsRest().setClassifier(lr).setNumClass(3)
  9. model = oneVsRest.fit(data)
  10. model.setPredictionCol("pred_result").setPredictionDetailCol("pred_detail")
  11. model.transform(data).print()