最新消息: 新版网站上线了!!!

一个scarpy简易的spider爬虫蜘蛛

import scrapy

class kandian(scrapy.Spider):

   name = 'kandian'

   def start_requests(self):

       urls = [

           'http://kandian.youth.cn/index/detail?sign=jG7lmryP69yBbN6',

           'http://kandian.youth.cn/index/detail?sign=LgQZ4WplQxgDqPr',

       ]

       for url in urls:

           yield scrapy.http.Request(url=url,callback=self.parse)

   def parse(self, response):

       page = response.url.split('=')[-1]

       filename = 'kandian-%s.html' % page

       with open(filename,'wb+') as f:

           f.write(response.body)

       #self.log('Saved file %s' & filename)

  • Python OpenCV从入门到精通 Python OpenCV从入门到精通
  • Excel+Python飞速搞定数据分析与处理 Excel+Python飞速搞定数据分析与处理
  • Python标准库中文pdf版 Python标准库中文pdf版
  • Python灰帽子:黑客与逆向工程师的Python编程之道 pdf英文文字版附源文件 Python灰帽子:黑客与逆向工程师的Python编程之道 pdf英文文字版附源文件
  • Python基础教程(第2版)中文版 清晰版+300dpi高清pdf版 Python基础教程(第2版)中文版 清晰版+300dpi高清pdf版
  • Python学习手册 第3版(Learning Python, 3rd Edition) 中文版PDF版 Python学习手册 第3版(Learning Python, 3rd Edition) 中文版PDF版
  • Foundations of Agile Python Development 英文pdf版 Foundations of Agile Python Development 英文pdf版
  • Python编程金典 pdf版(49M) Python编程金典 pdf版(49M)
  • IT资讯更多

    新增家园更多

    看看曾经的大佬你就知道自己为啥穷 更多