机器学习入门之机器学习sklearn中的train_test_split()函数-职坐标

海同科技，欢迎您！

就业

培训

资料

IT知识库

人工智能

站

热门城市全国站>

其他省市

快速购买

400-636-0069

热门课程

IT学院

职坐标首页 IT知识库人工智能机器学习

选择在海同培训： 30 天 1401 名，今日申请 72 人 IT培训咨询 >>

机器学习入门之机器学习sklearn中的train_test_split()函数

小标 2019-06-26 来源：阅读 5245 评论 0

摘要：本文主要向大家介绍了机器学习入门之机器学习sklearn中的train_test_split()函数，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之机器学习sklearn中的train_test_split()函数，通过具体的内容向大家展现，希望对大家学习机器学习入门有所帮助。

机器学习入门之机器学习sklearn中的train_test_split()函数

使用train_test_split函数可以将原始数据集按照一定比例划分训练集和测试集对模型进行训练

一、举例

import numpy as np #科学计算库

from sklearn.model_selection import train_test_split #train_test_split函数

x = np.arange(15).reshape(-1, 3) #生成5行3列的一个矩阵

>>x

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14]])

y = np.arange(5) #5个数的向量

>>y

array([0, 1, 2, 3, 4])

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=1)

>>x_train

array([[ 3,  4,  5],
       [12, 13, 14],
       [ 0,  1,  2],
       [ 9, 10, 11]])

>>x_test

array([[6, 7, 8]])

>>y_train

array([1, 4, 0, 3])

>>y_test

array([2])

二说明

x，y是原始的数据集。x_train,y_train 是原始数据集划分出来作为训练模型的，fit模型的时候用。x_test,y_test 这部分的数据不参与模型的训练，而是用于评价训练出来的模型好坏，score评分的时候用。
test_size=0.2 测试集的划分比例
random_state=1 随机种子，如果随机种子一样，则随机生成的数据集是相同的

三使用KNN

from sklearn.neighbors import KNeighborsClassifier
knn_clf = KNeighborsClassifier()
knn_clf.fit(x_train, y_train) #用fit训练模型，x_train, y_train是第一步划分的数据集。

knn_clf.score(x_test, y_test) #score测试模型，x_test, y_test是第一步划分得到的

本文由职坐标整理并发布，希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道！

机器学习周志华 pdf 机器学习和深度学习机器学习如何入门

本文由 @小标发布于职坐标。未经许可，禁止转载。

喜欢 | 0

不喜欢 | 0

看完这篇文章有何感觉？已经有0人表态，0%的人喜欢快给朋友分享吧~

评论（0）

后参与评论

加入IT交流圈

JAVA工程师交流群 +加入

大数据架构师交流群 +加入

人工智能Python交流群 +加入

WEB/H5前端交流群 +加入

职坐标公众号

人工智能 直通车

索取资料
答疑解惑
技术交流
职业测评
面试技巧
高薪秘笈

海同师资推荐更多>>

认证System Analyst，System Architect

程光淼

程光淼联系TA

精通C、C++等语言、智能芯片开发

热门就业培训班更多>>

【零基础】人工智能+Python全栈开发课程

【零基础】人工智能+Python全栈开发课程

人工智能+Python技术风口浪潮

【零基础】JavaEE高级开发工程师课程

【零基础】JavaEE高级开发工程师课程

0基础入学Java课程

【零基础】大数据与分布式架构师课程

【零基础】大数据与分布式架构师课程

培训大数据分布式架构

机器学习30天热搜词更多>>

机器学习发展机器学习 python 机器学习人工智能机器学习实战源代码机器学习入门书籍机器学习实战下载机器学习算法python 谷歌机器学习算法机器学习吴恩达机器学习算法代码机器学习常用算法机器学习入门视频机器学习入门视频教程 python机器学习实战机器学习经典算法机器学习实战项目机器学习实战目录机器学习基础教程机器学习实战关于什么 coursera

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场匹配合适岗位

验证码手机号，获得海同独家IT培训资料

选择就业方向：: 人工智能物联网; 大数据开发/分析; 人工智能Python; Java全栈开发; WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了，明天再试试吧！

提交

我们会在第一时间安排职业规划师联系您！

您也可以联系我们的职业规划师咨询：

小职老师的微信号：z_zhizuobiao

小职老师的微信号：z_zhizuobiao

友情链接

职业技能培训职业教育培训 IT教育培训机构 IT教育北京IT培训广州IT培训深圳IT培训杭州IT培训南京IT培训 IT培训公开课 IT视频教程 IT就业培训班软件工程师培训 IT课程视频职坐标商城 IT培训课程软件开发书籍 IT技术资料 IT教育新闻海同名师海同学员软件开发项目 IT热门话题职坐标介绍 IT知识大数据编程语言 WEB前端移动端开发品牌设计数据库软件测试系统运维常用软件人工智能 AI智能技术物联网智能家居机器人大数据技术大数据应用大数据采集大数据分析云计算 C语言 VC编程 JAVA语言 PHP编程 Python编程

版权所有职坐标-一站式IT培训就业服务领导者沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com，All Rights Reserved.
沪公网安备 31011502005948号

关于我们 │ 法律声明 │ 联系我们

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程