摘要:本文主要向大家介绍了机器学习入门之机器学习-5:DeepLN之CNN权重更新(笔记),通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。
本文主要向大家介绍了机器学习入门之机器学习-5:DeepLN之CNN权重更新(笔记),通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。
我想说:
学习dl不去深层的扒扒,没有理论的支撑是不行的,今天分享一篇笔记,另加读者的心得,很棒。
读者分享数据挖掘心得:
我跟你讲一下在实际项目中我们是怎么做数据挖掘的。1:定义业务问题,很多人认为机器学习越高大上的算法越厉害,其实不是这样的,每类算法都有特定的业务场景。机器学习主要分为有监督无监督和半监督,当拿到业务问题时,要看业务场景下哪类算法比较好。比如做风控我们会用决策树,做点击率预估我们会用LR。这里你要清楚每个算法的优缺点,比如为什么我要用决策树不用随机森林,为什么用LR不用SVM 2:根据模型做数据的收集和整合(比如爬虫,建立数据仓库,用户画像,使用spark做数据统计和清洗等等) 3:拿到数据以后,怎么建立有效的特征 因为数据不可能都是完整的,会有缺失值和异常值 这个时候需要根据业务做一些业务场景下的替代,比如用平均值代替缺失值,用中值代替异常值 4:数据特征的向量化表示 比如LR,LR这个模型要求输入的数据必须是0到1之间的,但是我们的数据不可能都是0到1之间的,这个时候就需要对数据进行向量化表示(比如离散化也叫做one hot encoding,归一化)文本数据使用(tf-idf word2vec)等等 5:建立有效的损失函数 把数据跑到LR中,需要一种方法来迭代数据的误差,比如Logloss function 我们的目的就是不断迭代求出误差的最小值 6:怎么快速求出模型 这里比如离线数据下我们会使用梯度下降算法迭代模型 实时数据下我们会使用ftrl算法迭代模型 7:模型的评估 比如使用AUC 8:模型的调整 比如过拟合我们会使用正则项,pca降维 这里比如会用交叉验证算出正则向的系数 其实大部分数据挖掘场景下都是这个套路。
下面是cnn权重更新详解:
本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道!
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号