精通Python爬虫框架Scrapy (Learning Scrapy中文版) 高清pdf版 - python电子书

摘要

精通Python爬虫框架Scrapy (Learning Scrapy中文版) 高清pdf版,本书是一套python3 scrapy教程，全面剖析网络爬虫技术的实现原理通过爬取示例演示Scrapy的应用，涵盖从桌面端爬取到移动端爬取，实时爬取在内的所有内容

Scrapy是使用Python开发的一个快速、高层次的屏幕抓取和Web抓取框架，用于抓Web站点并从页面中提取结构化的数据。《精通Python爬虫框架Scrapy》以Scrapy 1.0版本为基础，讲解了Scrapy的基础知识，以及如何使用Python和三方API提取、整理数据，以满足自己的需求。本书共11章，其内容涵盖了Scrapy基础知识，理解HTML和XPath，安装Scrapy并爬取一个网站，使用爬虫填充数据库并输出到移动应用中，爬虫的强大功能，将爬虫部署到Scrapinghub云服务器，Scrapy的配置与管理，Scrapy编程，管道秘诀，理解Scrapy性能，使用Scrapyd与实时分析进行分布式爬取。
本套教程适合软件开发人员、数据科学家，以及对自然语言处理和机器学习感兴趣的人阅读。
第1章 Scrapy简介1
第2章理解HTML和XPath10
第3章爬虫基础23
第4章从Scrapy到移动应用62
第5章迅速的爬虫技巧75
第6章部署到Scrapinghub94
第7章配置与管理102
第8章 Scrapy编程119
第9章管道秘诀145
第10章理解Scrapy性能173
第11章使用Scrapyd与实时分析进行分布式爬取199