功能介绍

  • 随机采样是对数据进行按个数随机抽样,每个样本都以相同的概率被抽到。

参数说明

名称 中文名称 描述 类型 是否必须? 默认值
size 采样个数 采样个数 Integer
withReplacement 是否放回 是否有放回的采样,默认不放回 Boolean false

脚本示例

脚本

  1. data = data = np.array([
  2. ["0,0,0"],
  3. ["0.1,0.1,0.1"],
  4. ["0.2,0.2,0.2"],
  5. ["9,9,9"],
  6. ["9.1,9.1,9.1"],
  7. ["9.2,9.2,9.2"]
  8. ])
  9. df = pd.DataFrame({"Y": data[:, 0]})
  10. # batch source
  11. inOp = dataframeToOperator(df, schemaStr='Y string', op_type='batch')
  12. sampleOp = SampleBatchOp()\
  13. .setSize(2)\
  14. .setWithReplacement(False)
  15. inOp.link(sampleOp).print()

结果

Y
0,0,0
0.2,0.2,0.2