shuffle

paddle.fluid.io. shuffle ( reader, buffer_size ) [源代码]

该接口创建一个数据读取器,其功能是将原始数据读取器的数据打乱,然后返回无序的数据。

从原始数据读取器取出buf_size个数据到缓冲区,将缓冲区数据打乱,然后将无序的数据依次返回。当缓冲区数据全部输出后,再次执行上述步骤。

参数:

  • reader (callable) – 原始数据读取器。

  • buf_size (int) – 缓冲区保存数据的个数。

返回: 返回无序数据的数据读取器

返回类型: callable

  1. import paddle.fluid as fluid
  2. def reader():
  3. for i in range(5):
  4. yield i
  5. shuffled_reader = fluid.io.shuffle(reader, 3)
  6. for e in shuffled_reader():
  7. print(e)
  8. # 输出结果是0~4的无序排列