小标
2019-06-26
来源 :
阅读 1375
评论 0
摘要:本文主要向大家介绍了机器学习入门之机器学习第一章理解,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。
本文主要向大家介绍了机器学习入门之机器学习第一章理解,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

大数据
1.大数据都是研究什么东西?
大数据主要是有2个东西,一个东西是分布式存储,一个是并行计算。
2.分布式计算,最终还是通过算法来解决的。其中有自己独创的算法,有的是在数学或者数据挖掘中或者是机器学习中的算法,来改进成并行化算法,来达到并行计算。(这是我目前接触到的算法)。
3.数据挖掘和机器学习是什么关系呢?
为什么这么问呢?原因是数据挖掘中的算法,机器学习中好像都有,机器学习中的算法,统计学中都有。
数据挖掘:数据挖掘是从海量数据中发掘知识,这就必然涉及对海量数据的管理和分析吗。
大体上来说,数据库领域的研究为数据库提供数据管理技术,而机器学习和统计学的研究为数据挖掘提供数据分析技术。统计学习主要是通过机器学习对数据挖掘发挥影响,而机器学习领域和数据库则是数据挖掘的两大支撑。
统计学和机器学习
1.什么是机器学习?
是关于在计算机上从给定的数据产生模型的算法,即学习算法,然后基于这个模型,来对新的情况来产生相应的预测。根据数据的离散型分为回归(连续的),分类(离散的)和标注问题(是分类问题的一个推广,是更复杂的结构预测)。
2.统计学习包括监督学习,非监督学习,半监督学习,及强化学习。
监督学习:会通过采用一组输入和期望的输出来进行学习。当我们想利用这些方法中的任何一种来提取信息时,我们可以传入一组输入,然后期望应用程序能够根据其此前学到的知识来产生一个输出。
非监督学习:无监督学习不是利用带有正确答案的样本数据来进行训练。他们的目的是要在一组数据中找寻某种结构,而这些数据本身并不是我们要找的答案。
3.统计学习常用概念理解?
示例:或者称作样本,对应着数据中的一条记录(多条记录构成数据集)。
每条记录对应着有多个属性(或者称为特征),各个属性张成的空间称为属性空间(或者称为样本空间或输入空间)。根据属性空间组成的n维空间,每条记录都能在这个上面找到其中属于他们自己的点。因此我们也把一个示例称为一个特征向量。
训练:从数据中学得模型的过程称为学习,或训练,这个过程通过执行某个学习算法来完成的。每个样本称为一个训练样本,训练样本组成的集合称为训练集。
假设:学得模型对应了关于数据的某种潜在的规律,因此亦称为假设;这种规律自身,则称为真相或真实,学习的过程就是为了找出或逼近真相。
样例:要获得关于预测的模型,我们还须获得训练样本的结果信息,我们把示例结果的信息称为标记;拥有了标记信息的示例,则称为样例。
泛化:学得模型适用于新样本的能力,称为泛化能力(泛化能力有强弱之分)。
归纳:是从特殊到一般的泛化过程。
演绎:即是从一般到特殊的过程,比如基于一组公理和推理规则则推导出与之向洽的定理,这是演绎。
假设空间:我们把学习过程看做是一个在所有假设组成的空间中进行搜索的过程,搜索的目标是找到与训练集匹配的假设,即能够将训练集中的瓜判断正确的假设。假设的表示一旦确定,假设空间及其规模大小就确定了。
归纳偏好:假设有3个训练集一致的假设,但与它们对应的模型在面临新样本的时候,却会产生不同的输出。机器学习算法在学习过程中对某种类型假设的偏好,称为归纳偏好,或简称为偏好。任何一个有效的机器学习算法必有其归纳偏好。归纳偏好可看做学习算法自身在一个可能很庞大的假设空间中对假设进行自行选择的启发式或价值观。那么有没有一般性的原则来引导算法确立的正确偏好呢?奥卡姆剃刀。
机器学习的发展历程:
1980年代左右:从样例中学习的一大主流是符号主义学习,其代表包括决策树和基于逻辑的学习。典型的决策树学习以信息论为基础,以信息熵的最小化为目标,直接模拟了人类对概念进行判定的树形流程。基于逻辑的学习的著名代表是归纳逻辑程序设计。
1990年代中期之前学习的另一主流技术是基于神经网路的连接主义学习。
1990年代中期之后,统计学习,代表性技术是支持向量机。
20世纪以后,连接主义学习又卷土重来,掀起了以深度学习为名的热潮,所谓的深度学习。
本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道!
喜欢 | 0
不喜欢 | 0
您输入的评论内容中包含违禁敏感词
我知道了

请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号