机器学习入门之机器学习随笔--通过MNIST了解机器学习
小标 2019-01-22 来源 : 阅读 833 评论 0

摘要:本文主要向大家介绍了机器学习入门之机器学习随笔--通过MNIST了解机器学习,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之机器学习随笔--通过MNIST了解机器学习,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

本文的主要目的是通过MNIST这个入门级的小项目来了解机器学习的大致工作过程,心中有一个框架就可以了,至于一些细节和理论的东西将会在后面进一步讨论。就好比你在进行绘画创作的时候先勾勒轮廓后添加细节一样。另外先跑出几个小程序也会对机器学习产生更多的兴趣,不至于在漫漫的数学海洋中漂啊漂啊,然后淹死了。

首先简单介绍一下MNIST(Mixed National Institute of Standards and Technology database),其起源于NIST(美国国家标准与技术研究所)收集修改后的两个手写体数据集,包含60000条训练数据集和10000条测试数据,由于其数据整理规范,标定准确被很多教材用于教学,所以大家都习惯将手写体识别直接称呼为MNIST。MNIST的数据很好找,大家可以下载//yann.lecun.com/exdb/mnist/这个链接里的数据,这是卷积神经网络之父,机器学习界的大神严恩·乐纯(我喜欢翻译成闫立春,听起来亲切啊)提供的数据,里面的数字图片已经被处理成长度为784(数字图片之前被保存为28*28的大小,如下图)的向量了。

我是用的Tensorflow搭建的神经网络,感觉不错,初学的时候不到半天就吭哧吭哧的搭完了,这里插一篇Tensorflow的入门文章,如果大家没有接触过Tensorflow的话可以看看。

     







接下来利用MNIST来阐述一下我对机器学习的理解,就拿最简单的神经网络来说,其组成有输入节点,输出节点和隐藏层。输入节点和输出节点顾名思义,隐藏节点就是夹在输入层与输出层之间的神经层。









上图是最基本的一种神经元结构,叫做感知器,信息从左边输入经过处理从右边输出,当然单个神经元由于过于简单,无法处理复杂的数据,说以我们要搭建更加复杂的神经网络。








上吐就是一个有六个输入神经元,两层隐藏层以及一个输出的神经网络,在搭建神经网络的过程中,输入神经元个数由需要处理的数据大小决定,例如在处理手写体数据时输入神经元个数就是784,隐藏层数量不限,但理论上来讲隐藏层数量越多,机器学习的效果越好,相应的训练时间也会越长。输出层的个数则与训练数据的目的有关,例如本文中进行手写体识别,共有0到9十个数字,因此输出层神经元个数就为10。而机器学习的过程就是训练神经元之间的参数,使得输出层的输出结果越来越接近真实结果。








在搭建好神经网络之后就可以利用准备好的训练数据对神经网络进行训练了。机器学习虽然叫机器学习,但是机器其实并不了解自己学到的是什么,上图神经网络的作用也只是把数字图片的像素点作为输入,然后去尽量拟合一个复杂的函数使其输出结果接近真实结果而已。所以目前的机器学习不是学习,人工智能也不是智能。


本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道!

本文由 @小标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程