机器学习入门之Python大数据与机器学习之NumPy初体验
小标 2018-09-29 来源 : 阅读 986 评论 0

摘要:本文主要向大家介绍了机器学习入门之Python大数据与机器学习之NumPy初体验,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之Python大数据与机器学习之NumPy初体验,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。


本文是Python大数据与机器学习系列文章中的第6篇,将介绍学习Python大数据与机器学习所必须的NumPy库。

通过本文系列文章您将能够学到的知识如下:



应用Python进行大数据与机器学习


应用Spark进行大数据分析


实现机器学习算法


学习使用NumPy库处理数值数据


学习使用Pandas库进行数据分析


学习使用Matplotlib库进行Python绘图


学习使用Seaborn库进行统计绘图


使用Plotly库进行动态可视化


使用SciKit-learn处理机器学习任务


K-Means聚类


逻辑回归


线性回归


随机森林与决策树


自然语言处理与垃圾邮件过滤


神经网络


支持向量机



另外小编也会拥抱变化,根据评论中的需求情况增加其它有意义的内容。例如增加一些相关面试题等等。
什么是NumPy
NumPy是非常重要的Python数值计算扩展库,基本整个Python大数据生态都依赖它,并且由于绑定了C语言库,因此速度非常快。可以说我们要学好Python大数据,必须要学的就是NumPy库了。
安装NumPy
如果你根据之前的文章安装了anaconda,那么你已经默认安装了NumPy库了。如想单独安装请继续往下看。
使用conda安装的命令:
conda install numpy
使用pip安装的命令:
pip install numpy
NumPy array
本系列文章主要用到的是numpy的array(数组);
numpy array有两种基本形式:vector(向量)和matrics(矩阵)
vector是一维的,而matrics是二维的。
打开Jupyter,输入如下内容:

import numpy as np
my_list = [1,2,3]
arr = np.array(my_list)
arr

运行得到如下结果:

以上就是vector的一般形式
继续输入如下内容:

my_mat = [[1,2,3],[4,5,6],[7,8,9]]
np.array(my_mat)

运行得到如下结果:

以上就是二维matrics矩阵。
numpy有自己的range函数
np.arange(0,10)
运行结果如下:

还可以指定步长np.arange(0,10,2)
运行结果如下:

生成所有元素为0的向量np.zeros(3)
运行结果如下:

生成所有元素为0的矩阵np.zeros((5,5))
运行结果如下:

同样生成所有元素为1的向量和矩阵分表为np.ones(4),np.ones((2,3))
运行结果如下:

np.linspace(0,5,20)
第一个参数是起始点,第二个参数是结束点,第三个参数是从起点到终点距离分成多少份。
运行结果如下:

np.eye(4)生成4*4的主对角线为1的矩阵
运行结果如下:

np.random.rand(5)生成随机向量
运行结果如下:

np.random.rand(5,5)生成5*5的随机向量
运行结果如下:

np.random.randn(2)生成标准正态分布曲线。
运行结果如下:

np.random.randn(4,4)二维的标准正态分布曲线
运行结果如下:

提示:
在Jupyter输入框中按tab键可以提示联想菜单,按shift+tab可以提示函数用法
按tab键

按shift+tab键

np.random.randint(1,100)生成1个1到100之间的随机整数,不包含100
运行结果如下:

np.random.randint(1,100,10)生成10个1到100之间的随机整数,不包含100
运行结果如下:

array类型支持的一些函数:
reshape函数可以修改array的维数。例如:

arr = np.arange(25)
arr.reshape(5,5)

运行结果如下:

max函数:最大值
min函数:最小值
argmax函数:返回最大值的索引
argmin函数:返回最小值的索引
ranarr = np.random.randint(1,100,10)
ranarr.max()
ranarr.min()
ranarr.argmax()
ranarr.argmin()
运行结果如下:

shape函数,返回array的大小
dtype,返回数据类型

调用简化:

from numpy.random import randint

我们就可以直接使用randint了

randint(2,10)

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道!

本文由 @小标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程