1.机器学习任务
名称 | 任务 | 监督学习 |
k-近邻算法 | 线性回归 | 是 |
朴素贝叶斯 | 局部加权线性回归 | 是 |
支持向量机 | Ridge回归 | 是 |
决策树 | Lasso最小回归系数估计 | 是 |
K-均值 | 最大期望算法 | 否 |
DBSCAN | Parzen窗设计 | 否 |
2.如何选择合适的机器学习算法
(1)考虑使用机器学习算法目的
如果要预测目标变量值,可选监督学习算法;否则选非监督学习算法;选定了监督方法,需要进一步确定目标变量类型,离散类型可选择分类算法,连续类型选择回归算法
(2)考虑数据问题
了解数据的以下特征,特征值是离散的还是连续性的,特征值中是否包含缺失值,何种原因造成的缺失,数据中是否包含异常值,某个特征发生的频率等。
3.机器学习步骤
(1)收集数据
(2)准备输入数据
(3)分析输入数据:人工分析手中的数据,确保数据集中没有垃圾数据。
(4)训练算法
(5)测试算法
(6)使用算法
相关推荐
在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。 决策树是一种树...
和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上...
第三阶段:机器学习案例实战 使用Python分析科比生涯数据 案例实战-信用卡欺诈检测 Python文本数据分析 Kaggle竞赛案例-泰坦尼克获救预测 时间序列案例实战 TensorFlow框架 MNIST手写字体识别 Gensim中文词向量建模...
大家好,这是我在近期总结的 机器学习基础——Python内置函数实战(一),对于Python学习以及人工智能基础学习的朋友来说应该会比较有用。此为源代码,含有详细注释,博客中已经记录(建议结合博客阅读),需要的...
本课程主要讲解机器学习中所需要的Python语言基础知识。帮助学员通过基础的Python爬虫语言,从零开始逐步成为行业高手。
机器学习:基础概念查准率、查全率F1-Score、ROC、混淆矩阵机器学习实战:分类器性能考核方法:使用交叉验证测量精度性能考核方法:混淆矩阵精度和召回率ROC曲线训练一个随机森林分类器,并计算ROC和ROC AUC分数 ...
算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家入门机器学习。 学习收益: 1.掌握Python数据科学工具包,包括矩阵数据处理与可视化展示。 2.掌握机器学习算法原理推导,从数学上...
2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课 课程介绍: 从基本的软件安装到必备的Python扩展讲起,然后对机器学习算法一一讲解,同时配合编程实操的实现...
包括32*32尺寸的手写字数据集文件,含测试集和训练集 Keras深度学习通用框架 实现了基本的DNN和CNN 包括最优模型自动存储,学习率自动调节,模型测试,模型结果绘图
机器学习实战
机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较...
机器学习房价预测实战源码.zip机器学习房价预测实战源码.zip机器学习房价预测实战源码.zip机器学习房价预测实战源码.zip机器学习房价预测实战源码.zip机器学习房价预测实战源码.zip机器学习房价预测实战源码.zip机器...
机器学习_数学基础 机器学习_数学基础 机器学习_数学基础
本教程的目的是帮助几乎没有 Python 机器学习背景的新手成长为知识渊博的实践者,而且这个过程中仅需要使用免费的材料和资源即可。这个大纲的主要目标是带你了解那些数量繁多的可用资源。毫无疑问,资源确实有很多,...
前言致谢关于本书关于作者关于封面第一部分 分类第1章 机器学习基础1.1 何谓机器学习1.1.1 传感器和海量数据1.1.2 机器学习非常重要1.2 关键术语1
机器学习基础与项目实战的数据集以及代码
Spark2.x机器学习实战(算法篇:基于Kaggle竞赛数据集,六大算法模型构建),本课程主要讲解基于Spark 2.x的机器学习库,MLlib实现了常用的机器学习,如:聚类、分类、回归等6大算法,使用Kaggle竞赛数据集模型构建...