Conv2D

class paddle.fluid.dygraph.Conv2D ( num_channels, num_filters, filter_size, stride\=1, padding\=0, dilation\=1, groups\=None, param_attr\=None, bias_attr\=None, use_cudnn\=True, act\=None, dtype\=’float32’ ) [源代码]

该接口用于构建 Conv2D 类的一个可调用对象,具体用法参照 代码示例 。其将在神经网络中构建一个二维卷积层(Convolution2D Layer),其根据输入、滤波器参数(num_filters、filter_size)、步长(stride)、填充(padding)、膨胀系数(dilation)、组数(groups)参数来计算得到输出特征图。输入和输出是 NCHW 格式,N是批数据大小,C是特征图个数,H是特征图高度,W是特征图宽度。滤波器的维度是 [M, C, H, W] ,M是输出特征图个数,C是输入特征图个数,H是滤波器高度,W是滤波器宽度。如果组数大于1,C等于输入特征图个数除以组数的结果。如果提供了偏移属性和激活函数类型,卷积的结果会和偏移相加,激活函数会作用在最终结果上。详情请参考: 卷积

对每个输入 X ,有等式:

Conv2D - 图1

其中:

  • Conv2D - 图2

    :输入特征图, NCHW 格式的 Tensor

  • Conv2D - 图3

    :滤波器,维度为 [M, C, H, W] 的 Tensor

  • Conv2D - 图4

    :卷积操作

  • Conv2D - 图5

    :偏移值,2-D Tensor ,维度为 [M,1]

  • Conv2D - 图6

    :激活函数

  • OutOut :输出值, OutX 的维度可能不同

输出维度计算示例

  • 输入:

    输入维度: (N,Cin,Hin,Win)(N,Cin,Hin,Win)

    滤波器维度: (Cout,Cin,Hf,Wf)(Cout,Cin,Hf,Wf)

  • 输出:

    输出维度: (N,Cout,Hout,Wout)(N,Cout,Hout,Wout)

  • 其中

Hout\=(Hin+2∗paddings[0]−(dilations[0]∗(Hf−1)+1))strides[0]+1Wout\=(Win+2∗paddings[1]−(dilations[1]∗(Wf−1)+1))strides[1]+1Hout\=(Hin+2∗paddings[0]−(dilations[0]∗(Hf−1)+1))strides[0]+1Wout\=(Win+2∗paddings[1]−(dilations[1]∗(Wf−1)+1))strides[1]+1

参数:

  • num_channels (int) - 输入图像的通道数。

  • num_filters (int) - 滤波器的个数,和输出特征图个数相同。

  • filter_size (int|tuple) - 滤波器大小。如果 filter_size 是一个元组,则必须包含两个整型数,分别表示滤波器高度和宽度。否则,表示滤波器高度和宽度均为 filter_size

  • stride (int|tuple, 可选) - 步长大小。如果 stride 为元组,则必须包含两个整型数,分别表示垂直和水平滑动步长。否则,表示垂直和水平滑动步长均为 stride 。默认值:1。

  • padding (int|tuple, 可选) - 填充大小。如果 padding 为元组,则必须包含两个整型数,分别表示竖直和水平边界填充大小。否则,表示竖直和水平边界填充大小均为 padding 。默认值:0。

  • dilation (int|tuple, 可选) - 膨胀系数大小。如果 dialation 为元组,则必须包含两个整型数,分别表示垂直和水平膨胀系数。否则,表示垂直和水平膨胀系数均为 dialation 。默认值:1。

  • groups (int, 可选) - 二维卷积层的组数。根据Alex Krizhevsky的深度卷积神经网络(CNN)论文中的分组卷积:当group=2,滤波器的前一半仅和输入特征图的前一半连接。滤波器的后一半仅和输入特征图的后一半连接。默认值:1。

  • param_attr (ParamAttr, 可选) - 指定权重参数属性的对象。默认值为None,表示使用默认的权重参数属性。具体用法请参见 ParamAttr

  • bias_attr (ParamAttr|bool, 可选) - 指定偏置参数属性的对象。默认值为None,表示使用默认的偏置参数属性。具体用法请参见 ParamAttr

  • use_cudnn (bool, 可选) - 是否用cudnn核,只有已安装cudnn库时才有效。默认值:True。

  • act (str, 可选) - 应用于输出上的激活函数,如tanh、softmax、sigmoid,relu等,支持列表请参考 激活函数 ,默认值:None。

  • dtype (str, 可选) - 数据类型,可以为”float32”或”float64”。默认值:”float32”。

返回:无

抛出异常:

  • ValueError - 如果 use_cudnn 不是bool值

代码示例

  1. from paddle.fluid.dygraph.base import to_variable
  2. import paddle.fluid as fluid
  3. from paddle.fluid.dygraph import Conv2D
  4. import numpy as np
  5. data = np.random.uniform(-1, 1, [10, 3, 32, 32]).astype('float32')
  6. with fluid.dygraph.guard():
  7. conv2d = Conv2D(3, 2, 3)
  8. data = to_variable(data)
  9. conv = conv2d(data)

属性

weight

本层的可学习参数,类型为 Parameter

bias

本层的可学习偏置,类型为 Parameter