小标
2019-03-26
来源 :
阅读 2886
评论 0
摘要:本文主要向大家介绍了机器学习入门之mahout 常见机器学习算法及分类,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。
本文主要向大家介绍了机器学习入门之mahout 常见机器学习算法及分类,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

最近一直在学习hadoop 一直没有梳理接触到的东西,常见算法分类:
推荐系统(推荐引擎):
基于用户的协同过滤算法UserCF 近邻算法,容易实现
基于物品的协同过滤算法ItemCF 速度快,容易实现分布式计算
SlopeOne算法 @Deprecated at mahout 0.8
KNN Linear interpolation item–based推荐算法 最近邻算法 @Deprecated at mahout 0.8
SVD推荐算法 奇异值分解, 需要降维, 大量预处理
Tree Cluster-based 推荐算法 树形聚类 大量预处理 @Deprecated at mahout 0.8
分类算法:
支持向量机(SVM)
逻辑回归(LR)
梯度下降法(SGD)
神经网络
随机森林(RF) ,天猫推荐算法大战中经常用到(RF + GBDT) 可并行 mapreduce
朴素贝叶斯(Naive Beyes),还有一种补充的贝叶斯算法 cbeyes,效果一般比beyes 要好, 可并行 mapreduce
聚类算法:
canopy clustering
kmeans clustering
层次聚类法
频繁模式挖掘
mahout(0.9) 最新版支持的常用算法
User and Item based recommenders
Matrix factorization based recommenders
K-Means, Fuzzy K-Means clustering
Latent Dirichlet Allocation
Singular Value Decomposition
Logistic regression classifier
(Complementary) Naive Bayes classifier
Random forest classifier
High performance java collections
A vibrant community
另外:注意 mahout 官网公告,mahout 已经不再支持新的算法了,请关注 最新的 spark。
原文:
The Mahout community decided to move its codebase onto modern data processing systems that offer a richer programming model and more efficient execution than Hadoop MapReduce. Mahout will therefore reject new MapReduce algorithm implementations from now on. We will however keep our widely used MapReduce algorithms in the codebase and maintain them.
We are building our future implementations on top of a DSL for linear algebraic operations which has been developed over the last months. Programs written in this DSL are automatically optimized and executed in parallel on Apache Spark.
Furthermore, there is an experimental contribution undergoing which aims to integrate the h20 platform into Mahout.
本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标人工智能机器学习频道!
喜欢 | 0
不喜欢 | 0
您输入的评论内容中包含违禁敏感词
我知道了

请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号