机器学习入门之机器学习-4：DeepLN之CNN解析-职坐标

机器学习入门之机器学习-4：DeepLN之CNN解析

小标 2019-02-13 来源：阅读 1545 评论 0

摘要：本文主要向大家介绍了机器学习入门之机器学习-4：DeepLN之CNN解析，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之机器学习-4：DeepLN之CNN解析，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

开篇废话：

很感谢谭哥的开篇废话这四个字，让我把一些废话说出来了，是时候还给谭哥了。因为废话太多会让人感觉，没有能力净废话。

今天我开始从头学习CNN，上一篇MachineLN之深度学习入门坑太多了，需要慢慢的填起来。那么我的问题是：

（1）为什么要提出cnn？

（2）cnn的结构是怎么样子的？

（3）cnn中各层的含义是什么？

看到这里你的答案是什么？那么下面是我的答案，欢迎批评指正。

（1）为什么要提出cnn？

嫌字太多直接看图，或者简单总结为cnn参数少好学习。

卷积神经网络是在神经网络的理论基础上形成的深度学习网络，它是一种特殊的多层神经网络。而传统的神经网络是一个全连接的网络结构（后面会提到），它上一层的每一个神经元与下一层的每一个神经元均有连接。这种结构有以下缺点：1、在处理声音和图像数据的时候，由于声音和图像的输入维度较高，包含数百个以上的变量，例如，输入图像的像素是100×100，假设隐含层要学习100维的特征 (即隐含层有 100 个神经元)，那么全连接网络就要学100×100×100个参数，即100万个权重参数，这样的网络结构在使用BP算法训练的时候，不但训练速度慢，而且需要的训练样本的数量也越多，若训练样本数量不足，会产生过拟合现象，学习得到的模型没有实用性。2、传统神经网络的结构对输入数据的特点的考虑不足，以图像识别为例，将同一幅图像做很小的位移，传统神经网络对其会很敏感，会当成是不同的图像，无法根据训练过程对该类数据特征进行优化处理。3、传统神经网络因为与输入数据是全连接的，无法识别训练数据中的局部区域特征，可是卷积神经网络可以单独学习识别该局部区域特征。

==>看一下图（借用大神的图）吧：主要看第一个（10的12次幂）和第四个（10k）图的参数数量相差10的8次幂倍，已经到了亿级别了。（local conv意思是每个卷积核是不同的，也就是后面提到的它不是权值共享）

image

（2）cnn的结构是怎么样子的？

下面是最经典的cnn结构，如果你关注cnn发展过程，是这样子的：LeNet5->AlexNet->VGG->Inception_v1(v2,v3)->resnet->Inception_v4->xception->resnet_v2->Inception_resnet等等，还有一些移动端的小模型（mobilenet、shuffleNet）。

image

1. 学过数字图像处理的应该学过卷积，像sobel算子等一些边缘检测，像一些均值滤波、中值滤波等等，只是这个卷积核我们称为fliters；但是和卷积神经网络中是不一样的，cnn中的卷积核往往是很多个，并且卷积中的卷积核值是通过学习得到的。卷积的流程：以一个很简单的图示展示卷积的流程：（下面只是一个简单的演示，真实情况下一般都是m个输入n个输出，对应[m,n,kernel_size,kernel_size]）

image

2. 池化流程，在一个给定的区域内，譬如22的区域取最大值（最大池化）、平均值（平均池化），（还有随机池化等）然后设置步长一般为2（就是下一步33的区域走到哪里），这样遍历完后，图像大小则会变为原来的二分之一。下面是最大池化和平均池化。

image

（3）cnn中各层的含义是什么？

卷积层的作用：

1. 权值共享，减少训练参数；一个卷积核与输入map的不同区域做卷积时，它的参数是固定不变的。在CNN里，这叫做权值更享，那么为什么说减少训练参数呢？没有对比不能说少了或者多了，在上面的为什么提出cnn中已经解释了。

2. 不同的卷积核可以提取不同的特征；

池化层的作用：

减少参数。通过对卷积后的特征图降维，有效减少后续层需要的参数，但是下面的才是内涵所在：

1. 使构建更深层次的网络变得可行；

2. 使得filters获得更多的全局和contextual（上下文）信息；

3. 使训练可行，也可以说使得训练变得更高效，主要是针对深层次的网络结构来说；