机器学习入门之机器学习:线性模型-多分类任务拆分之纠错输出码ECOC浅析
小标 2018-11-28 来源 : 阅读 1856 评论 0

摘要:本文主要向大家介绍了机器学习入门之机器学习:线性模型-多分类任务拆分之纠错输出码ECOC浅析,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

本文主要向大家介绍了机器学习入门之机器学习:线性模型-多分类任务拆分之纠错输出码ECOC浅析,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

多分类任务通常转化为多个二分类任务,再对预测结果进行集成得出最终分类结果。

拆分为二分类任务通常有3种:一对一(OvO),一对其余(OvR)和多对多(MvM)。



OvO:

将N个类别两两配对,共N(N-1)/2个分类任务,每个分类任务一个类别作为正例,另一个作为反例,学习得到N(N-1)/2个分类器。新样本同时提交给所有分类器,得到N(N-1)/2个分类结果,把预测最多的类别作为最终结果。见下图:

OvR:

每次将一个类作为正例,其余所有类作为反例,训练N个分类器。新样本提交给所有分类器,若仅有一个分类器预测为正例,则该类标记作为最终结果,如上图。若有多个分类器标记为正例,则考虑预测置信度。

注:类别很多时,OvO的训练时间开销通常比OvR小(OvR每个分类器都使用全部样本)

MvM:

每次将若干个类别作为正例,其他作为反例,最常用“纠错错误码(ECOC)”,(ECOC编码对分类器错误有一定的容忍修正能力,即使某个分类器预测出错,也不一定会影响结果)

ECOC:

编码:将N个类别做M次划分,每次将一部分作为正例,其余作为反例,学习到M个分类器;

解码:新样本提交给M个分类器,得到M个结果,组成一个编码,将其和每个类别各自的编码进行比较,距离最小的类别作为最终结果。如下图:

图a中测试样例的编码和C3类的编码欧式距离最小,所以测试样本最终判定结果为C3类(采用欧式距离判别)

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道!

本文由 @小标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程