文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
11.4 本章小结及要求
本章重点以爬取房天下二手房房源为例,讲解用 CrawlSpider 类编写爬虫的技巧,其中最关键的是编写 URL 的提取规则。本章还大体介绍了 Scrapy 的架构和数据流,这有助于读者理解 Scrapy 工作机制,有利于读者编写爬虫。本章对 Scrapy 架构的讲解内容偏重理论,这部分内容参考了 Scrapy 的官方文档说明。
本章的要求是读者用 CrawlSpider 类编写我爱我家二手房房源爬虫。读者可以与第 10 章中用 BasicSpider 类编写的我爱我家二手房房源爬虫作对比,通过对比,更能体会用 CrawlSpider 类编写整站数据爬虫,十分简洁,它允许用户用少量代码实现对全站数据的抓取。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论