数据科学入门基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念,详细展示了什么是数据科学。
通过阅读本书,你可以:
学到一堂Python速成课;
学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;
掌握如何收集、探索、清理、转换和操作数据;
深入理解机器学习的基础;
运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;
探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。数据科学入门目录
第1章 导论 1
第2章 Python速成 13
第3章 可视化数据 34
第4章 线性代数 45
第5章 统计学 53
第6章 概率 64
第7章 假设与推断 75
第8章 梯度下降 86
第9章 获取数据 94
第10章 数据工作 112
第11章 机器学习 130
第12章 k近邻法 139
第13章 朴素贝叶斯算法 152
第14章 简单线性回归 159
第15章 多重回归分析 164
第16章 逻辑回归 173
第17章 决策树 185
第18章 神经网络 196
第19章 聚类分析 208
第20章 自然语言处理 222
第21章 网络分析 237
第22章 推荐系统 249
第23章 数据库与SQL 257
第24章 MapReduce 270
第25章 数据科学前瞻 278