MaxPool

MaxPool - 22

版本

  • 名称: MaxPool (GitHub)

  • : main

  • 起始版本: 22

  • 函数: False

  • 支持级别: SupportType.COMMON

  • 形状推断: True

此版本的运算符自 版本 22 起可用。

摘要

MaxPool 接收输入张量 X,并根据内核大小、步长大小和填充长度对张量应用最大池化。最大池化包括根据内核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中以进行进一步处理。输出空间形状的计算方式因是否使用显式填充(使用 pads)或自动填充(使用 auto_pad)而异。使用显式填充时 (https://pytorch.ac.cn/docs/stable/generated/torch.nn.MaxPool2d.html?highlight=maxpool#torch.nn.MaxPool2d)

output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)

output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)

如果启用了 ceil_mode。pad_shape[i] 是沿轴 i 的填充总和。忽略从右侧填充区域开始的滑动窗口。

auto_pad 是一个已弃用的属性。如果您目前正在使用它们,当启用 ceil_mode 时,输出空间形状将如下所示

VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])

或当 ceil_mode 被禁用时 (https://tensorflowcn.cn/api_docs/python/tf/keras/layers/AveragePooling2D)

VALID: output_spatial_shape[i] = floor((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i]) + 1
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = floor((input_spatial_shape[i] - 1) / strides_spatial_shape[i]) + 1

如果 SAME_UPPERSAME_LOWER,则填充形状将如下所示

pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]

每个池化窗口的输出是排除填充的元素最大数量。

属性

  • auto_pad - 字符串 (默认为 'NOTSET')

    auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示对输入进行填充,以便对于每个轴 ioutput_shape[i] = ceil(input_shape[i] / strides[i])。填充在两边均匀或几乎均匀地分布(取决于它是偶数还是奇数)。如果填充是奇数,则对于 SAME_UPPER,额外的填充添加到末尾,对于 SAME_LOWER,则添加到开头。

  • ceil_mode - INT (默认值为 '0')

    是否使用 ceil 或 floor (默认) 计算输出形状。

  • dilations - 整数 :

    滤波器每个空间轴上的扩张值。如果未指定,则每个空间轴上的扩张默认为 1。

  • kernel_shape - 整数数组 (必需)

    沿每个轴的核大小。

  • pads - 整数 :

    沿着每个空间轴的开始和结束填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开始和结束部分的像素数。pads 格式应如下 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是在轴 i 的开始处添加的像素数,xi_end 是在轴 i 的结束处添加的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则沿每个空间轴的开始和结束填充默认为 0。

  • storage_order - 整数 (默认为 '0')

    张量的存储顺序。0 表示行主序,1 表示列主序。此属性仅用于将 N 元组索引值转换为单个整数值以生成第二个输出。

  • strides - 整数 :

    沿每个空间轴的步长。如果不存在,步长默认为沿每个空间轴的 1。

输入

  • X (异构) - T

    来自前一个操作符的输入数据张量;图像情况下的维度是 (N x C x H x W),其中 N 是批量大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批量大小。可选地,如果维度表示生效,则操作期望输入数据张量具有 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示。

输出

介于 1 到 2 个输出之间。

  • Y (异构) - T

    通过对输入张量进行平均或最大池化得到的输出数据张量。维度将根据不同的内核、步长和填充大小而变化。使用维度的向下取整值

  • 索引 (可选,异构) - I

    通过对输入张量进行最大池化得到的索引张量。索引的维度与输出张量相同。索引中的值是池化过程中选择的值的索引。索引被计算为展平的一维张量,索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。

类型约束

  • T 在 ( tensor(bfloat16), tensor(double), tensor(float), tensor(float16), tensor(int8), tensor(uint8) )

    限制输入和输出类型为浮点和 8 位张量。

  • I 在 ( tensor(int64) )

    将索引张量限制为 int64

MaxPool - 12

版本

  • 名称: MaxPool (GitHub)

  • : main

  • 起始版本: 12

  • 函数: False

  • 支持级别: SupportType.COMMON

  • 形状推断: True

此版本的运算符自 版本 12 起可用。

摘要

MaxPool 接收输入张量 X,并根据内核大小、步长大小和填充长度对张量应用最大池化。最大池化包括根据内核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中以进行进一步处理。输出空间形状的计算方式因是否使用显式填充(使用 pads)或自动填充(使用 auto_pad)而异。使用显式填充时 (https://pytorch.ac.cn/docs/stable/generated/torch.nn.MaxPool2d.html?highlight=maxpool#torch.nn.MaxPool2d)

output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)

output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)

如果启用了 ceil_mode。pad_shape[i] 是沿轴 i 的填充总和。

auto_pad 是一个已弃用的属性。如果您目前正在使用它们,当启用 ceil_mode 时,输出空间形状将如下所示

VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])

或当 ceil_mode 被禁用时 (https://tensorflowcn.cn/api_docs/python/tf/keras/layers/AveragePooling2D)

VALID: output_spatial_shape[i] = floor((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i]) + 1
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = floor((input_spatial_shape[i] - 1) / strides_spatial_shape[i]) + 1

如果 SAME_UPPERSAME_LOWER,则填充形状将如下所示

pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]

每个池化窗口的输出是排除填充的元素最大数量。

属性

  • auto_pad - 字符串 (默认为 'NOTSET')

    auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示对输入进行填充,以便对于每个轴 ioutput_shape[i] = ceil(input_shape[i] / strides[i])。填充在两边均匀或几乎均匀地分布(取决于它是偶数还是奇数)。如果填充是奇数,则对于 SAME_UPPER,额外的填充添加到末尾,对于 SAME_LOWER,则添加到开头。

  • ceil_mode - INT (默认值为 '0')

    是否使用 ceil 或 floor (默认) 计算输出形状。

  • dilations - 整数 :

    滤波器每个空间轴上的扩张值。如果未指定,则每个空间轴上的扩张默认为 1。

  • kernel_shape - 整数数组 (必需)

    沿每个轴的核大小。

  • pads - 整数 :

    沿着每个空间轴的开始和结束填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开始和结束部分的像素数。pads 格式应如下 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是在轴 i 的开始处添加的像素数,xi_end 是在轴 i 的结束处添加的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则沿每个空间轴的开始和结束填充默认为 0。

  • storage_order - 整数 (默认为 '0')

    张量的存储顺序。0 表示行主序,1 表示列主序。此属性仅用于将 N 元组索引值转换为单个整数值以生成第二个输出。

  • strides - 整数 :

    沿每个空间轴的步长。如果不存在,步长默认为沿每个空间轴的 1。

输入

  • X (异构) - T

    来自前一个操作符的输入数据张量;图像情况下的维度是 (N x C x H x W),其中 N 是批量大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批量大小。可选地,如果维度表示生效,则操作期望输入数据张量具有 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示。

输出

介于 1 到 2 个输出之间。

  • Y (异构) - T

    通过对输入张量进行平均或最大池化得到的输出数据张量。维度将根据不同的内核、步长和填充大小而变化。使用维度的向下取整值

  • 索引 (可选,异构) - I

    通过对输入张量进行最大池化得到的索引张量。索引的维度与输出张量相同。索引中的值是池化过程中选择的值的索引。索引被计算为展平的一维张量,索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。

类型约束

  • T 在 ( tensor(double), tensor(float), tensor(float16), tensor(int8), tensor(uint8) )

    限制输入和输出类型为浮点和 8 位张量。

  • I 在 ( tensor(int64) )

    将索引张量限制为 int64

MaxPool - 11

版本

  • 名称: MaxPool (GitHub)

  • : main

  • 起始版本: 11

  • 函数: False

  • 支持级别: SupportType.COMMON

  • 形状推断: True

此版本的运算符自 版本 11 起可用。

摘要

MaxPool 接收输入张量 X,并根据内核大小、步长大小和填充长度对张量应用最大池化。最大池化包括根据内核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中以进行进一步处理。输出空间形状将如下所示

output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)

output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)

如果启用了 ceil_mode

* pad_shape[i] is sum of pads along axis i

auto_pad 是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示

VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])

如果 SAME_UPPERSAME_LOWER,则填充形状将如下所示

pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]

每个池化窗口的输出是排除填充的元素最大数量。

属性

  • auto_pad - 字符串 (默认为 'NOTSET')

    auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示对输入进行填充,以便输出空间大小与输入匹配。如果是奇数,则对于 SAME_UPPER,额外的填充添加到末尾,对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。

  • ceil_mode - INT (默认值为 '0')

    是否使用 ceil 或 floor (默认) 计算输出形状。

  • dilations - 整数 :

    滤波器每个空间轴上的扩张值。如果未指定,则每个空间轴上的扩张默认为 1。

  • kernel_shape - 整数数组 (必需)

    沿每个轴的核大小。

  • pads - 整数 :

    沿着每个空间轴的开始和结束填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开始和结束部分的像素数。pads 格式应如下 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是在轴 i 的开始处添加的像素数,xi_end 是在轴 i 的结束处添加的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则沿每个空间轴的开始和结束填充默认为 0。

  • storage_order - 整数 (默认为 '0')

    张量的存储顺序。0 表示行主序,1 表示列主序。

  • strides - 整数 :

    沿每个空间轴的步长。如果不存在,步长默认为沿每个空间轴的 1。

输入

  • X (异构) - T

    来自前一个操作符的输入数据张量;图像情况下的维度是 (N x C x H x W),其中 N 是批量大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批量大小。可选地,如果维度表示生效,则操作期望输入数据张量具有 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示。

输出

介于 1 到 2 个输出之间。

  • Y (异构) - T

    通过对输入张量进行平均或最大池化得到的输出数据张量。维度将根据不同的内核、步长和填充大小而变化。使用维度的向下取整值

  • 索引 (可选,异构) - I

    通过对输入张量进行最大池化得到的索引张量。索引的维度与输出张量相同。索引中的值是池化过程中选择的值的索引。索引被计算为展平的一维张量,索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。

类型约束

  • T 在 ( tensor(double), tensor(float), tensor(float16) )

    将输入和输出类型限制为浮点张量。

  • I 在 ( tensor(int64) )

    将索引张量限制为 int64

MaxPool - 10

版本

  • 名称: MaxPool (GitHub)

  • : main

  • since_version: 10

  • 函数: False

  • 支持级别: SupportType.COMMON

  • 形状推断: True

此版本的操作符已在 版本 10 中提供。

摘要

MaxPool 接收输入张量 X,并根据内核大小、步长大小和填充长度对张量应用最大池化。最大池化包括根据内核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中以进行进一步处理。输出空间形状将如下所示

output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)

output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)

如果启用了 ceil_mode

* pad_shape[i] is sum of pads along axis i

auto_pad 是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示

VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])

如果 SAME_UPPERSAME_LOWER,则填充形状将如下所示

pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]

每个池化窗口的输出是排除填充的元素最大数量。

属性

  • auto_pad - 字符串 (默认为 'NOTSET')

    auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示对输入进行填充,以便输出空间大小与输入匹配。如果是奇数,则对于 SAME_UPPER,额外的填充添加到末尾,对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。

  • ceil_mode - INT (默认值为 '0')

    是否使用 ceil 或 floor (默认) 计算输出形状。

  • dilations - 整数 :

    滤波器每个空间轴上的扩张值。

  • kernel_shape - 整数数组 (必需)

    沿每个轴的核大小。

  • pads - 整数 :

    沿着每个空间轴的开始和结束填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开始和结束部分的像素数。pads 格式应如下 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是在轴 i 的开始处添加的像素数,xi_end 是在轴 i 的结束处添加的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则沿每个空间轴的开始和结束填充默认为 0。

  • storage_order - 整数 (默认为 '0')

    张量的存储顺序。0 表示行主序,1 表示列主序。

  • strides - 整数 :

    沿每个空间轴的步幅。

输入

  • X (异构) - T

    来自前一个操作符的输入数据张量;图像情况下的维度是 (N x C x H x W),其中 N 是批量大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批量大小。可选地,如果维度表示生效,则操作期望输入数据张量具有 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示。

输出

介于 1 到 2 个输出之间。

  • Y (异构) - T

    通过对输入张量进行平均或最大池化得到的输出数据张量。维度将根据不同的内核、步长和填充大小而变化。使用维度的向下取整值

  • 索引 (可选,异构) - I

    通过对输入张量进行最大池化得到的索引张量。索引的维度与输出张量相同。索引中的值是池化过程中选择的值的索引。索引被计算为展平的一维张量,索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。

类型约束

  • T 在 ( tensor(double), tensor(float), tensor(float16) )

    将输入和输出类型限制为浮点张量。

  • I 在 ( tensor(int64) )

    将索引张量限制为 int64

MaxPool - 8

版本

  • 名称: MaxPool (GitHub)

  • : main

  • 起始版本8

  • 函数: False

  • 支持级别: SupportType.COMMON

  • 形状推断: True

此运算符版本自版本 8 起可用。

摘要

MaxPool 接收输入张量 X,并根据内核大小、步长大小和填充长度对张量应用最大池化。最大池化包括根据内核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中以进行进一步处理。输出空间形状将如下所示

output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - kernel_spatial_shape[i]) / strides_spatial_shape[i] + 1)

* pad_shape[i] is sum of pads along axis i

auto_pad 是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示

VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - kernel_spatial_shape[i] + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])

如果 SAME_UPPERSAME_LOWER,则填充形状将如下所示

pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + kernel_spatial_shape[i] - input_spatial_shape[i]

每个池化窗口的输出是排除填充的元素最大数量。

属性

  • auto_pad - 字符串 (默认为 'NOTSET')

    auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示对输入进行填充,以便输出空间大小与输入匹配。如果是奇数,则对于 SAME_UPPER,额外的填充添加到末尾,对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。

  • kernel_shape - 整数数组 (必需)

    沿每个轴的核大小。

  • pads - 整数 :

    沿着每个空间轴的开始和结束填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开始和结束部分的像素数。pads 格式应如下 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是在轴 i 的开始处添加的像素数,xi_end 是在轴 i 的结束处添加的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则沿每个空间轴的开始和结束填充默认为 0。

  • storage_order - 整数 (默认为 '0')

    张量的存储顺序。0 表示行主序,1 表示列主序。

  • strides - 整数 :

    沿每个空间轴的步幅。

输入

  • X (异构) - T

    来自前一个操作符的输入数据张量;图像情况下的维度是 (N x C x H x W),其中 N 是批量大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批量大小。可选地,如果维度表示生效,则操作期望输入数据张量具有 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示。

输出

介于 1 到 2 个输出之间。

  • Y (异构) - T

    通过对输入张量进行平均或最大池化得到的输出数据张量。维度将根据不同的内核、步长和填充大小而变化。使用维度的向下取整值

  • 索引 (可选,异构) - I

    通过对输入张量进行最大池化得到的索引张量。索引的维度与输出张量相同。索引中的值是池化过程中选择的值的索引。索引被计算为展平的一维张量,索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。

类型约束

  • T 在 ( tensor(double), tensor(float), tensor(float16) )

    将输入和输出类型限制为浮点张量。

  • I 在 ( tensor(int64) )

    将索引张量限制为 int64

MaxPool - 1

版本

  • 名称: MaxPool (GitHub)

  • : main

  • 起始版本: 1

  • 函数: False

  • 支持级别: SupportType.COMMON

  • 形状推断: True

此版本的运算符自 版本 1 起可用。

摘要

MaxPool 接收输入张量 X,并根据内核大小、步长大小和填充长度对张量应用最大池化。最大池化包括根据内核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中以进行进一步处理。输出空间形状将如下所示

output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - kernel_spatial_shape[i]) / strides_spatial_shape[i] + 1)

* pad_shape[i] is sum of pads along axis i

auto_pad 是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示

VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - kernel_spatial_shape[i] + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])

如果 SAME_UPPERSAME_LOWER,则填充形状将如下所示

pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + kernel_spatial_shape[i] - input_spatial_shape[i]

每个池化窗口的输出是排除填充的元素最大数量。

属性

  • auto_pad - 字符串 (默认为 'NOTSET')

    auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示对输入进行填充,以便输出空间大小与输入匹配。如果是奇数,则对于 SAME_UPPER,额外的填充添加到末尾,对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。

  • kernel_shape - 整数数组 (必需)

    沿每个轴的核大小。

  • pads - 整数 :

    沿着每个空间轴的开始和结束填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开始和结束部分的像素数。pads 格式应如下 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是在轴 i 的开始处添加的像素数,xi_end 是在轴 i 的结束处添加的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则沿每个空间轴的开始和结束填充默认为 0。

  • strides - 整数 :

    沿每个空间轴的步幅。

输入

  • X (异构) - T

    来自前一个操作符的输入数据张量;图像情况下的维度是 (N x C x H x W),其中 N 是批量大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批量大小。可选地,如果维度表示生效,则操作期望输入数据张量具有 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示。

输出

  • Y (异构) - T

    通过对输入张量进行平均或最大池化得到的输出数据张量。维度将根据不同的内核、步长和填充大小而变化。使用维度的向下取整值

类型约束

  • T 在 ( tensor(double), tensor(float), tensor(float16) )

    将输入和输出类型限制为浮点张量。