门控卷积 | Gated Convolution

Created On2024年9月14日

byskylook

理解门控卷积（Gated Convolution）

门控卷积是一种先进的卷积操作，它引入了门控机制，以增强模型捕捉数据中复杂依赖关系的能力。这种技术最早由 Dauphin 等人在他们的论文《Language Modeling with Gated Convolutional Networks》中提出，在语言建模任务中相较于传统方法显示出显著的改进。

标准卷积将滤波器应用于输入张量以生成输出张量，而门控卷积通过引入门控机制修改了这一过程。输出被计算为卷积输出和门控信号的组合。

标准卷积：

Y = X * W + b

门控卷积：

Y = (X * W) \odot \sigma(X * V + c)

其中：

门控卷积已成功应用于多个领域，特别是在自然语言处理（NLP）和计算机视觉中。在NLP中，它们被用于语言建模和文本生成等任务，而在计算机视觉中，则被用于图像修复等生成任务。

Updated2024年9月14日