机器学习入门之5分钟入门机器学习
小标 2019-01-11 来源 : 阅读 593 评论 0

摘要:本文主要向大家介绍了机器学习入门之5分钟入门机器学习,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之5分钟入门机器学习,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。



今年科技创投界的“爆款”是什么?当然是人工智能。


作为支撑人工智能的底层技术之一,机器学习是许多从事人工智能研发和应用的创业公司真正在做的事情。今天小编就给大家带来一篇超详细的机器学习入门指南。


    

提纲

  


         

 (一) 机器学习是什么

(二) 机器学习能干什么

(三) 机器学习基本概念

(四) 机器学习理论简介

(五) 机器学习的局限性

(六) 思考题
(七) 面试求职

              


  


   

什么是机器学习?

   


探究和开发一系列算法来如何使计算机不需要通过外部明显的指示,而可以自己通过数据来学习,建模,并且利用建好的模型和新的输入来进行预测的学科。 



   

机器学习能干什么呢?

   


人脸识别 


手写数字识别 


垃圾邮件过滤 


以上技术都使用到了机器学习




   

我们学习机器学习能干什么呢?

   


互联网公司都需要大量的机器学习工程师,很多的创业公司都已经开始搞机器学习和大数据了,这是一个非常有想象空间的领域。 当然大疆创新、face++、第四范式、地平线这些非互联网公司也做的很不错。

根据处理的数据类型不同 有文本处理(NLP,这个需 求最大)、语音识别(如百度语音搜索、讯飞语音)、 视频识别(如无人车)以及其他的数据挖掘,如金融征信、量化交易、智能硬件中的数据挖掘等。以熟知的互联网公司举例,今日头条做个性化推荐、滴滴打车做智能调度算法。



   

机器学习与人工智能有什么关联?

   


人工智能是一种应用领域,机器学习是实现人工智能的 一种手段,但是不限于此。 PR(模式识别)、DM(数据挖掘)属于 AI 的具体应用。


      

重头戏 | 理论框架

 


      



   

监督学习( Supervised Learning)

   


从标记的训练数据来推断一个功能的机器学习任务 


根据输出变量的类型,监督学习分为以下两类学习问 题: 


回归:定量输出称为回归,或者说是连续变量预测


分类:定性输出称为分类,或者说是离散变量预测 



在我们的面试过程当中,面试官常常喜欢问 :回归和分类是什么区别?



 


 

无监督学习( Unsupervised Learning) 

 


 


用于处理未被标记的样本集,模型能够自主学习到知识。
常用:GMM、聚类、降维、深度学习的逐层训练等 


K-means是无监督的聚类方法,KNN是有监督的分类方法,所以不要弄混喔! 




   

强化学习(Reinforcement Learning) 

   

强化学习就是智能系统从环境到行为映射的学习,以 使奖励信号(强化信号)函数值最大。

基本组件:


环境 


agent(交互对象)


动作


反馈(回报,奖赏)


应用:机器人等 


   

经典算法

   



   

机器学习不是万能的 | 局限性

   


在手机上的一些照相app中,有这样一种功能,通过面 部拍照可以识别出人的年龄,但是经过亲测发现,在面 部光线充沛和光线偏暗两种情况下,程序判断出的人的 年龄差别很多,差十年都是很正常的,这是为什么呢? 


机器学习本质上还是一种统计方法,它只讲求统计意义未必考虑的是事情的本质。 

对于机器学习模型来说,准确率和召回率都不可能是 100%,极端case难以避免。

 

还记得”大明湖畔”的GAN么?通过GAN合成一些噪声一 样毫无意义的图片,就能轻易骗过你高大上的机器学习模型 。


对于金融交易、自动驾驶等事关大笔资金安全、人身安 全的场景中,不要盲目迷信AI。不要把你的安全全部交给模型。


正确的做法是:规则(经验)+模型融合。 


学会批判热点 


为了否定和质疑别人的机器学习模型,有哪些思考的角度? 


“Facebook聊天机器人开始自创语言了?程序的bug! ”在通过照片识别同性恋这样的任务中,斯坦福的人通过 平均人脸的模型发现 “同性恋男性更少留胡子” 那么 会不会出现这样的情况 一个人模型判定为“非同性恋” 的家伙剃掉胡子以后再用模型判断,就变成了同性恋,从机器学习的角度,完全会有这样的情况发生。



   

机器学习工程师面试题有哪些?

   


大数据基础: 大小表的map-reduce


NLP基本知识: edit distance
数据结构与coding: 



手写快排、二分查找(C++/python写)、leetcode 






深度学习理论: 

       lstm原理 CNN做文本分类的网络结构 

传统机器学习理论: 

       boosting的原理, 手推SVM,

       手写造轮子:kmeans的 hadoop实现 


 


   

怎样成为机器学习工程师?

   


辅助技能(linux python 数学) 


机器学习概念和实战 


深度学习理论和实战 tensorflow 等工具 


具体业余领域的训练(NLP、视 觉、SLAM等) 


最好还懂基础编程语言(C++/java) 


最好有大数据的基础(hadoop spark) 



  我该学什么 ?


基本的语言能力: linux Python C++或者JAVA


算法和数据结构功底


机器学习理论和一定的实战经验


hadoop 或 spark(加分) 


实习或者竞赛经验(加分) 



  怎么学?


step1: 拜师 剃发明志 


step2: 扎马步 




step3: 学武功 








 step4: 结合具体应用场景


(如NLP 计算机视觉) 进行实践、做项目、参加竞赛或者实习 



step5:找工作 面试


step6:修炼圆满 走进FLAG/BAT


本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道!


本文由 @小标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程