深度学习与图像复原
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第2章 基于卷积神经网络的图像复原方法基础

2.1 卷积层

在计算机视觉领域,输入图像的尺寸通常较大。手写字体识别模型LeNet是最早的卷积神经网络(Convolutional Neural Network, CNN)之一。相较于仅使用全连接层搭建的网络结构,LeNet通过巧妙的设计,利用卷积、池化等操作进行特征提取。其中,卷积层具有局部连接和权重共享的特点,避免了较高的计算成本,并在完成分类识别任务方面表现出色。使用PyTorch实现LeNet的示例代码如算法2-1所示,该算法展示了如何定义LeNet的结构、准备数据加载器、编译(在PyTorch中称为配置优化器)及训练模型。

卷积层是卷积神经网络最重要的组成部分,其主要作用是自动学习和提取图像特征。卷积层包括一组滤波器(又称卷积核),通过对给定输入做卷积来生成输出特征图。