机器学习入门之未明学院：机器学习vs深度学习，如何规划学习与就业路径-职坐标

机器学习入门之未明学院：机器学习vs深度学习，如何规划学习与就业路径

小标 2019-01-07 来源：阅读 694 评论 0

摘要：本文主要向大家介绍了机器学习入门之未明学院：机器学习vs深度学习，如何规划学习与就业路径，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之未明学院：机器学习vs深度学习，如何规划学习与就业路径，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

自2016年以来，业界掀起一股人工智能的热潮。

2017年初，AlphaGo化身网络棋手Master击败聂卫平、柯洁、朴廷桓、井山裕太在内的数十位中日韩围棋高手，在30秒一手的快棋对决中，无一落败，拿下全胜，在棋界和科技界引发剧震。这使人们认识到AI(Artifical Intelligence)的威力和未来，于是人工智能忽然之间离我们近在咫尺。

提到人工智能，我们总是听到两个名词，机器学习和深度学习。想要入门人工智能的同学，可能对这两个名词尚未十分了解。今天，我们就来探讨下机器学习与深度学习的区别。

什么是人工智能

人工智能（Artificial Intelligence），英文缩写为AI。它是研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的与人脑相似的方式做出反应的智能机器。该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

人工智能从诞生以来，理论和技术日益成熟，应用领域也不断扩大。

目前人工智能应用已非常普遍，从智能手机上的语音识别、房间清扫机器人再到提醒你会议召开的虚拟助手，AI已是信息、学习、推理、计划和交流的重要提供者。可以设想，未来人工智能带来的科技产品，将会是人类智慧的“容器”。

什么是机器学习

机器学习是AI的一个子领域，它通过算法将AI概念应用于计算系统。计算机识别数据模式并根据数据模式采取行动，随着时间的推移学习提高其准确性而无需明确的编程。

机器学习的背后是预测编码，聚类和视觉热图等分析方法。我们打开某宝、某东时的购物推荐就是机器学习的一个应用。

机器学习有如下几种常用算法：

1. 支持向量机算法

2. 决策树算法

3. 神经网络

机器学习算法通常分为以下四大类：

1. 监督学习（Supervised Learning）

能够从有标签的数据中学到或建立一个模式（learning model），并依此模式猜测新的实例。

举个监督式学习的例子，我有一套电子邮件数据，我给每一封邮件都打上垃圾邮件或非垃圾邮件的标签，那么，这套数据便是数据种子集，程序可以利用这套数据种子集进行训练，从而得到一个判断垃圾邮件的模型。

2. 无监督学习（Unsupervised Learning ）

数据是无标签的，机器学习算法需要先将数据分类，然后对数据结构进行描述，使复杂的数据看起来简单，以便进行后续分析工作。

再以邮件为例，我有一套电子邮件数据，但是我并没有人为地给它打标签，而是直接进行聚类，程序会自动的分出垃圾邮件和非垃圾邮件。

3. 半监督学习（Semi-supervised Learning）

有监督学习和无监督学习的中间带就是半监督学习（semi-supervised learning）。对于半监督学习，其训练数据的一部分是有标签的，另一部分没有标签，而没标签数据的数量常常远远大于有标签数据数量。

4. 强化学习（Reinforcement Learning）

强化学习是机器学习的一个重要分支，是多学科多领域交叉的一个产物，它的本质是解决decision making 问题，即自动进行决策，并且可以做连续决策。Alpha Go用的就是强化学习，这类很重要，在机器人中也用的很多。

什么是深度学习

深度学习，又叫人工神经网络（神经网络是受人类大脑的启发而来的，是神经元之间的相互连接关系），它是实现机器学习的一种技术，和其它所有机器学习一样都是基于算法。

然而它并非如机器学习一样根据任务选择算法，而是模仿人类大脑结构与运算过程——识别非结构化输入的数据，输出精确的行为和决策。

近期，深度学习摧枯拉朽般地实现了各种任务，使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车，预防性医疗保健，甚至是更好的电影推荐，都近在眼前，或者即将实现。

现在我们可以理顺人工智能、机器学习和深度学习三者的关系了。简而言之，机器学习是人工智能的一部分（子集），深度学习是机器学习的一部分（子集）。

深度学习 ⊂ 机器学习 ⊂ AI

这就是三者的关系。虽然“深度学习”已经在很多任务上超越了传统机器学习，在近几年也有了长足的发展，但是其本身仍然存在一些问题。

一是非常依赖于大量的标记数据。有的场景下，数据的标记成本非常的高，甚至有的场景下注定没法拥有大量的标记数据，比如风控中的黑样本。所以很多场景，特别是结构化数据的建模仍然是传统机器学习的天下。

二是暂时没有完善的理论做支撑。深度学习不像机器学习（统计学习），它暂时没有完善的数学理论做支撑，目前，既没有完整的关于深度学习有效性的理论，也没有任何一本能超越机器学习实战经验的指南或者书，导致深度学习的发展如同摸着石头过河。

机器学习VS深度学习

1. 数据依赖方面

深度学习和传统机器学习最重要的区别在于数据量增长下的表现差异。

当数据量很少的时候，深度学习算法不会有好的表现，这是因为深度学习算法需要大量数据来完美地实现。相反，传统机器学习在这个情况下是占优势的。下图概括了这个事实。

2. 硬件依赖方面

深度学习算法高度依赖高端机器，而传统的机器学习算法可以在低端机器中运行。

这是因为深度学习算法对图形处理器（GPU）的依赖是它在工作中的重要部分。深度学习算法内在需要做大量的矩阵乘法运算，这些运算可以通过图形处理器实现高效优化，图形处理器就是因此而生的。

3. 解决问题方面

传统机器学习算法求解问题时，它通常会建议把问题细分成不同的部分，独立地解决他们，然后进行合并从而获得最终结果。

深度学习中目标定位里有两大类方法，一大类类似为yolo(Joseph Redmon和Ali Farhadi等人于2015年提出的基于单个神经网络的目标检测系统)，称呼为one stage，主张端对端解决问题，速度很快。另一类称呼为two stage，不是端对端解决问题，比前者稍慢，但是准确度更高。

4. 执行时间方面

通常神经网络算法都会训练很久，因为神经网络算法中有很多参数，所以训练它们通常比其他算法要耗时。即使是深度学习算法Imagenet数据集训练，也比较消耗计算资源。

而机器学习相对而言则只需要很短的时间来训练，大概在几秒到几小时不等。

5. 可解释性方面

最后，我们也把可解释性作为一个因素来对比一下机器学习和深度学习。

举个例子，假设我们使用深度学习来给文章自动打分。它打分的表现十分的好并且非常接近人类水平，但是有个问题，它不能告诉我们为什么它要给出这样的分数。

实际在数学上，你可以找到一个深度神经网络哪些结点被激活了，但我们不知道这些神经元被模型怎么利用，而且也不知道这些层在一起做了点什么事情。所以我们不能根据结果进行合理的解释。

在另一方面，机器学习算法例如决策树，通过清晰的规则告诉我们为什么它选择了什么，所以它是特别容易解释结果背后的原因。因此，像决策树和线性/逻辑回归一样的算法由于可解释性而广泛应用于工业界。

其实在许多领域，机器学习和深度学习并非相斥而是互补的关系。

学习规划和建议

把握技术的发展趋势

按时间先后排序：科学快于技术快于资本快于媒体快于政策

人工智能（AI）就也符合以上发展趋势。

▲科学

AI的一些科学理论基础，实际上已经出现了几十年，甚至一百年，几百年。只是那个时候这些数学家并不知道他能有什么实际的用处而已。

▲技术

之后由这些理论基础，发展出了AI技术，比如近几年的发展。但为什么恰是这几年，AI技术有了很进一步的发展？因为这些技术的产生和时机以及环境息息相关。

▲资本

当技术稍有成果之后，资本开始蠢蠢欲动，大量进入市场。

▲媒体

当市场取得成功之后，媒体介入，之后则是大量的宣传，报道。

▲政策

之后在经过了大量的验证之后，政府在政策上开始对相关技术的企业进行政策扶持。甚至将此方向作为以后大力发展的方向。

机器学习已经在市场上无孔不入了，而深度学习还处于初级阶段，商业化程度有限。

定位好学习的境界

作为一个AI算法工程师（机器学习和深度学习），主要有四种境界。

▲科学家境界

很少很少一部分人能达到的境界，主要是那些从事AI研究的科学家，他们能原创出很多的算法和理论，解决一些难题。

▲工程师境界

有很强的理论背景和工程实现能力，能独立复现最新的论文，深刻理解论文的实现原理，并能在上面做一些小创新。

▲应用者境界

是大部分算法工程师所在的境界，主要就是明白原理，知道如何实现，核心在于知道如何把它应用在一个实际的业务场景之中。

▲知其然境界

知道机器学习和深度学习大概是个什么东西，不会过分的去神话它，知道它们的优势，更知道它们的局限。

不同的境界对应不同的要求，简单概括是：

工程能力决定你的下界，理论能力与业务理解决定你的天花板。

定位好职业的岗位

目前来说，与机器学习和深度学习相关的主要有以下一些岗位：

>>>>ETL工程师：

主要是做数仓相关的工作，可以粗浅理解为数据处理的一线员工。

>>>>BI分析师：

智能商务决策分析师，利用大数据工具做一些商业数据分析和数据的可视化。

>>>>数据分析师：

通过大数据工作做一些数据的分析和可视化，业务更广泛。

>>>>数据挖掘工程师：

对大数据进行建模工作，完成某些特定的业务场景。

>>>>AI平台工程师：

主要对机器学习，深度学习的平台和组件进行开发工作，也包括模型优化工作（如使用CUDA对模型进行改写）。

机器学习目前已应用到可视化、市场营销、医疗诊断、信息检索等多个领域。

与此同时，深度学习每天都给我们每个人制造惊喜，并且在不久的将来也会持续着这个趋势。这是因为深度学习已经被证明是能实现最先进表现的最佳技术之一。

机器学习和深度学习的研究会持续进行。

但与前些年局限于学术上的研究有所区别，深度学习和机器学习领域上的研究会在工业界和学术界同时爆发，而且随着可用资金的增加，它会更可能成为整个人类发展的主题！

本文由职坐标整理并发布，希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道！

大数据和人工智能前景对人工智能的前景人工智能大会

本文由 @小标发布于职坐标。未经许可，禁止转载。

喜欢 | 0

不喜欢 | 0

看完这篇文章有何感觉？已经有0人表态，0%的人喜欢快给朋友分享吧~

后参与评论

加入IT交流圈

JAVA工程师交流群 +加入

大数据架构师交流群 +加入

人工智能Python交流群 +加入

WEB/H5前端交流群 +加入

人工智能 直通车

索取资料
答疑解惑
技术交流
职业测评
面试技巧
高薪秘笈

海同师资推荐更多>>

黄骈联系TA

认证System Analyst，System Architect

程光淼联系TA

精通C、C++等语言、智能芯片开发

热门就业培训班更多>>

【零基础】人工智能+Python全栈开发课程

机器学习30天热搜词更多>>

机器学习发展机器学习 python 机器学习人工智能机器学习实战源代码机器学习入门书籍机器学习实战下载机器学习算法python 谷歌机器学习算法机器学习吴恩达机器学习算法代码机器学习常用算法机器学习入门视频机器学习入门视频教程 python机器学习实战机器学习经典算法机器学习实战项目机器学习实战目录机器学习基础教程机器学习实战关于什么 coursera