`

机器学习实战-1-基础

阅读更多

1.机器学习任务

名称 任务 监督学习
k-近邻算法 线性回归
朴素贝叶斯 局部加权线性回归
支持向量机 Ridge回归
决策树 Lasso最小回归系数估计
K-均值 最大期望算法
DBSCAN Parzen窗设计
     

 

2.如何选择合适的机器学习算法

(1)考虑使用机器学习算法目的

如果要预测目标变量值,可选监督学习算法;否则选非监督学习算法;选定了监督方法,需要进一步确定目标变量类型,离散类型可选择分类算法,连续类型选择回归算法

(2)考虑数据问题

了解数据的以下特征,特征值是离散的还是连续性的,特征值中是否包含缺失值,何种原因造成的缺失,数据中是否包含异常值,某个特征发生的频率等。

3.机器学习步骤

(1)收集数据

(2)准备输入数据

(3)分析输入数据:人工分析手中的数据,确保数据集中没有垃圾数据。

(4)训练算法

(5)测试算法

(6)使用算法

 

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics