随着机器学习算法的普及,开发和优化这些算法的新工具也得到了发展。《机器学习基础》首先介绍了scikit-learn包,学习如何使用scikit-learn语法;学习监督模型和无监督模型之间的差异,以及为每个数据集选择适当算法的重要性;学习将无监督聚类算法应用到真实的数据集中,发现其中的规律,并在探索中解决无监督机器学习问题。其次,《机器学习基础》重点研究监督学习算法,学习如何使用scikit-learn包实现不同的监督算法以及如何开发神经网络架构;还将了解如何采用合乎逻辑的结果分析,并通过调节超参数来改善算法的性能。
《机器学习基础》理论讲解与练习实例相结合,并通过大量的活动指导读者进行真实数据集的模拟训练。学完《机器学习基础》将知道如何描述监督模型和无监督模型之间的差异,以及如何将一些流行的算法应用于现实生活中的数据集中,将获得诸多技能并有信心编写机器学习算法。
《机器学习基础》面向机器学习领域的新手和希望学习如何使用scikit-learn库开发机器学习算法的开发人员。读者需要具备Python编程方面的一些知识和经验,但不需要任何关于scikit-learn或机器学习算法的先验知识。
第1章绪论
1.1从两个问题谈起
1.2模型评估与模型参数选择
1.2.1验证
1.2.2正则化
1.3机器学习算法分类
1.3.1监督学习
1.3.2非监督学习
习题
第2章回归
2.1线性回归
2.2Logistic回归
习题
第3章LDA主题模型
3.1LDA简介
3.2数学基础
3.2.1多项分布
3.2.2Dirichlet分布
3.2.3共轭先验分布
3.3LDA主题模型
3.3.1基础模型
3.3.2PLSA模型
3.3.3LDA模型
3.4LDA模型应用实例
3.4.1配置安装
3.4.2文本预处理
3.4.3使用Gensim
习题
第4章决策树
4.1决策树简介
4.1.1一个小例子
4.1.2几个重要的术语及决策树构造思路
4.2离散型决策树的构造
4.3连续性数值的处理
4.4决策树剪枝
习题
第5章支持向量机
5.1分离超平面与最大间隔
5.2线性支持向量机
5.2.1硬间隔
5.2.2软间隔
5.3非线性支持向量机
5.3.1核方法
5.3.2常用的核函数
5.4操作实例: 应用MATLAB多分类SVM、二分类SVM、决策树
算法进行分类
5.4.1数据集选择
5.4.2数据预处理
5.4.3模型表现
5.4.4经验总结
习题
第6章提升方法
6.1随机森林
6.1.1随机森林介绍
6.1.2Bootstrap Aggregation
6.1.3随机森林训练过程
6.1.4随机森林的优点与缺点
6.2Adaboost
6.2.1引入
6.2.2Adaboost实现过程
6.2.3Adaboost总结
6.3随机森林算法应用举例
6.3.1MATLAB中随机森林算法
6.3.2操作实例1: 基于集成方法的IRIS数据集分类
6.3.3操作实例2: 基于ensemble方法的人脸识别
习题
第7章神经网络基础
7.1基础概念
7.2感知机
7.2.1单层感知机
7.2.2多层感知机
7.3BP神经网络
7.3.1梯度下降
7.3.2后向传播
7.4径向基函数网络
7.4.1精确插值与径向基函数
7.4.2径向基函数网络
7.5Hopfield网络
7.5.1Hopfield网络的结构
7.5.2Hopfield网络的训练
7.5.3Hopfield网络状态转移
7.6Boltzmann机
7.7自组织映射网络
7.7.1网络结构
7.7.2训练算法
7.8实例: 使用MATLAB进行Batch Normalization
7.8.1浅识Batch Normalization
7.8.2MATLAB nntool使用简介
习题
第8章深度神经网络
8.1什么是深度神经网络
8.2卷积神经网络
8.2.1卷积神经网络的基本思想
8.2.2卷积操作
8.2.3池化层
8.2.4卷积神经网络
8.3循环神经网络
8.3.1循环单元
8.3.2通过时间后向传播
8.3.3带有门限的循环单元
8.4MATLAB深度学习工具箱简介
8.5利用Theano搭建和训练神经网络
8.5.1Theano简介
8.5.2Theano的基本使用
8.5.3搭建训练神经网络的项目
习题
第9章聚类算法
9.1简介
9.1.1聚类任务
9.1.2基本表示
9.2KMeans算法
9.2.1算法简介
9.2.2算法流程
9.2.3KMeans的一些改进
9.2.4选择合适的K
9.2.5XMeans
9.3层次聚类
9.4聚类算法拓展
9.4.1聚类在信号处理领域的应用
9.4.2以语义聚类的形式展示网络图像搜索结果
习题
第10章寻优算法之遗传算法
10.1简介
10.1.1算法起源
10.1.2基本过程
10.1.3基本表示
10.1.4输入输出
10.1.5优缺点及应用
10.2算法原型
10.2.1初始化
10.2.2评估
10.2.3选择优秀个体
10.2.4交叉
10.2.5变异
10.2.6迭代
10.3算法拓展
10.3.1精英主义思想
10.3.2灾变
习题
第11章项目实践: 基于机器学习的监控视频行人检测与追踪系统
11.1引言
11.2相关算法与指标
11.2.1方向梯度直方图
11.2.2支持向量机
11.2.3结构相似性
11.2.4HaarLike特征
11.2.5级联分类器
11.2.6特征脸
11.3系统设计与实现
11.3.1视频处理模块
11.3.2图像识别模块
11.3.3目标追踪模块
11.4系统测试
11.4.1测试环境
11.4.2系统单元测试与集成测试
11.4.3性能测试
11.4.4系统识别准确率测试
11.5结语
qq:757040650
.....