机器学习入门之TensorFlow工具快速入门教程2机器学习简介-职坐标

机器学习入门之TensorFlow工具快速入门教程2机器学习简介

小标 2019-01-07 来源：阅读 1312 评论 0

摘要：本文主要向大家介绍了机器学习入门之TensorFlow工具快速入门教程2机器学习简介，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之TensorFlow工具快速入门教程2机器学习简介，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

机器学习介绍

机器学习是一个系统，可以通过自我改进从实例中学习，而不需要程序员明确编码。机器学习将数据与统计工具相结合以预测输出。机器学习与数据挖掘和贝叶斯预测建模密切相关。机器接收数据作为输入，使用算法来制定答案。

典型的机器学习任务是提供推荐。对于拥有Netflix帐户的用户，所有电影或系列推荐都基于用户的历史数据。科技公司正在使用无监督学习来改善个性化推荐的用户体验。

机器学习还用于各种任务，如欺诈检测，预测维护，投资组合优化，自动化任务等。

机器学习与传统编程

在传统的编程中，程序员在与正在开发软件的行业专家协商时编写所有规则。每条规则都基于逻辑，机器将按逻辑语句执行输出。当系统变得复杂时，需要编写更多规则，很难维护。

图片.png

机器学习输入和输出提炼规则。每当有新数据时，算法根据新数据和经验进行调整，以提高效率。

图片.png

机器学习如何运作？

机器学习的方式与人类相似，从经验中学习。机器学习的核心目标是学习和推理。首先，机器通过发现模式来学习。这一发现归功于数据。数据科学家的一个关键部分是仔细选择要为机器提供哪些数据。用于解决问题的属性列表称为特征向量。您可以将特征向量视为用于解决问题的数据子集。

机器使用一些奇特的算法来简化现实并将此发现转换为模型。因此，学习阶段用于描述数据并将其概括为模型。

图片.png

例如，机器试图了解个人工资与去高档餐馆的可能性之间的关系。事实证明，工资与去高端餐厅之间为正比：这就是模型。

推理

构建模型时，可以测试它在以前从未见过的数据上的能力。将新数据转换为特征向量，遍历模型并进行预测。无需更新规则或再次训练模型。您可以使用先前训练过的模型来推断新数据。

图片.png

机器学习程序的生命周期：

定义问题；收集数据；可视化数据；训练算法；测试算法；收集反馈；优化算法；循环4-7次直到结果令人满意；使用模型进行预测

机器学习算法

图片.png

机器学习分类：监督和非监督及半监督。

监督学习

有两种监督学习：

分类任务

要预测客户性别。您将开始从数据库收集有关身高，体重，工作，工资，采购篮等的数据。您知道每个客户的性别，它只能是男性或女性。分类器的目的是根据信息（即您收集的特征）分配男性或女性（即标签）的概率。当模型学习如何识别男性或女性时，您可以使用新数据进行预测。例如，您刚收到来自未知客户的新信息，并且您想知道它是男性还是女性。如果分类器预测男性= 70％，则意味着算法确定该客户是男性的70％，而30％是女性。

标签可以是两个或更多个类。上面的例子只有两个类，但是如果分类器需要预测对象，它有几十个类（例如，玻璃，桌子，鞋等，每个对象代表一个类）

回归任务

当输出是连续值可以用回归。例如，金融分析师可能需要根据股票，先前股票表现，宏观经济指数等特征来预测股票价值。系统将接受训练，以估算出可能出现最低误差的股票价格。

算法

描述

类型

线性回归找到将每个特征与输出相关联的方法回归

逻辑回归线性回归的扩展。输出变量只有两个（例如，仅黑色或白色）分类

决策树高度可解释的分类或回归模型，将数据特征值拆分为决策节点处的分支（例如颜色，每种可能的颜色成为新分支），直到做出最终决策输出回归分类

朴素贝叶斯用可影响事件的每个特征的独立概率更新事件的先验知识。回归分类

支持向量机 SVM(Support Vector Machine)算法找到最佳划分类的超平面。它最适合与非线性求解器一起使用。回归(非常见)分类

随机森林基于决策树之上，可以大大提高准确性。随机森林生成很多次简单的决策树，并使用“多数投票”方法来决定返回哪个标签。对于分类任务，最终预测将是投票最多的;而对于回归任务，所有树的平均预测是最终预测。回归分类

AdaBoost 分类或回归技术，使用多种模型做出决策，但根据其预测结果的准确性对其进行权衡。回归分类

梯度增强树先进的分类/回归技术。它专注于先前树所犯的错误并尝试纠正它。回归分类

非监督学习

算法探索输入数据而不给出明确的输出（例如，探索客户人口统计数据以识别模式）

当您不知道如何对数据进行分类时，您可以使用它，并且您希望算法找到模式并为您分类数据

算法

描述

类型

如何选择机器学习算法

有很多机器学习算法。算法的选择基于目标

图片.png

在下面的例子中，任务是预测三个品种中的花的类型。预测基于花瓣的长度和宽度。图片描绘了十种不同算法的结果。左上角的图片是数据集。数据分为三类：红色，浅蓝色和深蓝色。有一些分组。例如，从第二张图像开始，左上角的所有内容都属于红色类别，中间部分则是不确定性和淡蓝色的混合，而底部则对应于深色类别。其他图像显示了不同的算法以及它们如何尝试对数据进行分类。

机器学习的挑战与局限

机器学习的主要挑战是缺乏数据或数据集的密度。建议每组至少观察20次，以帮助机器学习。这种约束导致评估和预测不良。

机器学习的应用

增强：

帮助人们完成日常任务，无论是个人还是商业，都无需完全控制输出。机器学习以不同的方式使用，例如虚拟助手，数据分析，软件解决方案。主要用户是减少由于人为偏见造成的错误。

自动化：

机器学习可在任何领域完全自主工作，无需任何人为干预。例如，机器人在制造工厂中执行基本工艺步骤。

金融业

机器学习在金融业中越来越受欢迎。银行主要使用ML来查找数据中的模式，同时也防止欺诈。

政府组织

政府利用ML来管理公共安全和公用事业。以中国为例，面对大规模的人脸。政府使用人工智能来防止中国式过马路。

医疗行业