prroi_pool

paddle.fluid.layers.prroi_pool(input, rois, output_channels, spatial_scale, pooled_height, pooled_width, name=None)[源代码]

PRROIPool运算

精确区域池化方法(Precise region of interest pooling,也称为PRROIPooling)是对输入的 “感兴趣区域”(RoI)执行插值处理,将离散的特征图数据映射到一个连续空间,使用二重积分再求均值的方式实现Pooling。

通过积分方式计算ROI特征,反向传播时基于连续输入值计算梯度,使得反向传播连续可导的PRROIPooling。 有关更多详细信息,请参阅 https://arxiv.org/abs/1807.11590

参数

  • input (Variable) - (Tensor),PRROIPoolOp的输入。 输入张量的格式是NCHW。 其中N是批大小batch_size,C是输入通道的数量,H是输入特征图的高度,W是特征图宽度
  • rois (Variable) - 要进行池化的RoI(感兴趣区域)。应为一个形状为(num_rois, 4)的二维LoDTensor,其lod level为1。给出[[x1, y1, x2, y2], …],(x1, y1)为左上角坐标,(x2, y2)为右下角坐标。
  • output_channels (integer) - (int),输出特征图的通道数。 对于共C个种类的对象分类任务,output_channels应该是(C + 1),该情况仅适用于分类任务。
  • spatial_scale (float) - (float,default 1.0),乘法空间比例因子,用于将ROI坐标从其输入比例转换为池化使用的比例。默认值:1.0
  • pooled_height (integer) - (int,默认值1),池化输出的高度。默认值:1
  • pooled_width (integer) - (int,默认值1),池化输出的宽度。默认值:1
  • name (str,default None) - 此层的名称。

返回

(Tensor),PRROIPoolOp的输出是形为 (num_rois,output_channels,pooled_h,pooled_w) 的4-D Tensor。

返回类型

变量(Variable)

代码示例

  1. import paddle.fluid as fluid
  2. x = fluid.layers.data(name='x', shape=[490, 28, 28], dtype='float32')
  3. rois = fluid.layers.data(name='rois', shape=[4], lod_level=1, dtype='float32')
  4. pool_out = fluid.layers.prroi_pool(x, rois, 10, 1.0, 7, 7)