利用Python进行数据分析 PDF扫描版[MB]

摘要

利用Python进行数据分析 PDF扫描版[MB],由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

利用Python进行数据分析 内容简介:

还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?《利用Python进行数据分析》含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。
由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

·将IPython这个交互式Shell作为你的首要开发环境。
·学习NumPy(Numerical Python)的基础和高级知识。
·从pandas库的数据分析工具开始。
·利用高性能工具对数据进行加载、清理、转换、合并以及重塑。
·利用matplotlib创建散点图以及静态或交互式的可视化结果。
·利用pandas的groupby功能对数据集进行切片、切块和汇总操作。
·处理各种各样的时间序列数据。
·通过详细的案例学习如何解决Web分析、社会科学、金融学以及经济学等领域的问题。

利用Python进行数据分析 目录:
前言        1
第1章 准备工作        5
本书主要内容        5
为什么要使用Python进行数据分析        6
重要的Python库        7
安装和设置        10
社区和研讨会        16
使用本书        16
致谢        18
第2章 引言        20
来自bit.ly的1.usa.gov数据        21
MovieLens 1M数据集        29
1880—2010年间全美婴儿姓名        35
小结及展望        47
第3章 IPython:一种交互式计算和开发环境        48
IPython基础        49
内省        51
使用命令历史        60
与操作系统交互        63
软件开发工具        66
IPython HTML Notebook        75
利用IPython提高代码开发效率的几点提示        77
高级IPython功能        79
致谢        81
第4章 NumPy基础:数组和矢量计算        82
NumPy的ndarray:一种多维数组对象        83
通用函数:快速的元素级数组函数        98
利用数组进行数据处理        100
用于数组的文件输入输出        107
线性代数        109
随机数生成        111
范例:随机漫步        112
第5章 pandas入门        115
pandas的数据结构介绍        116
基本功能        126
汇总和计算描述统计        142
处理缺失数据        148
层次化索引        153
其他有关pandas的话题        158
第6章 数据加载、存储与文件格式        162
读写文本格式的数据        162
二进制数据格式        179
使用HTML和Web API        181
使用数据库        182
第7章 数据规整化:清理、转换、合并、重塑        186
合并数据集        186
重塑和轴向旋转        200
数据转换        204
字符串操作        217
示例:USDA食品数据库        224
第8章 绘图和可视化        231
matplotlib API入门        231
pandas中的绘图函数        244
绘制地图:图形化显示海地地震危机数据        254
Python图形化工具生态系统        260
第9章 数据聚合与分组运算        263
GroupBy技术        264
数据聚合        271
分组级运算和转换        276
透视表和交叉表        288
示例:2012联邦选举委员会数据库        291
第10章 时间序列        302
日期和时间数据类型及工具        303
时间序列基础        307
日期的范围、频率以及移动        311
时区处理        317
时期及其算术运算        322
重采样及频率转换        327
时间序列绘图        334
移动窗口函数        337
性能和内存使用方面的注意事项        342
第11章 金融和经济数据应用        344
数据规整化方面的话题        344
分组变换和分析        355
更多示例应用        361
第12章 NumPy高级应用        368
ndarray对象的内部机理        368
高级数组操作        370
广播        378
ufunc高级应用        383
结构化和记录式数组        386
更多有关排序的话题        388
NumPy的matrix类        393
高级数组输入输出        395
性能建议        397
附录A Python语言精要        401
 

Python OpenCV从入门到精通

《Python OpenCV从入门到精通》以在Python开发环境下运用OpenCV处理图像为主线,全面介绍OpenCV提供的处理图像的方法。全书共分为16章,包
阅读全文