功能介绍

  • 随机采样是对数据进行随机抽样,每个样本都以相同的概率被抽到。

参数说明

名称 中文名称 描述 类型 是否必须? 默认值
ratio 采样比例 采样率,范围为[0, 1] Double
withReplacement 是否放回 是否有放回的采样,默认不放回 Boolean false

脚本示例

脚本

  1. data = data = np.array([
  2. ["0,0,0"],
  3. ["0.1,0.1,0.1"],
  4. ["0.2,0.2,0.2"],
  5. ["9,9,9"],
  6. ["9.1,9.1,9.1"],
  7. ["9.2,9.2,9.2"]
  8. ])
  9. df = pd.DataFrame({"Y": data[:, 0]})
  10. # batch source
  11. inOp = dataframeToOperator(df, schemaStr='Y string', op_type='batch')
  12. sampleOp = SampleBatchOp()\
  13. .setRatio(0.3)\
  14. .setWithReplacement(False)
  15. inOp.link(sampleOp).print()

结果

Y
0,0,0
0.2,0.2,0.2