文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
4.4 本章小结及要求
本章为读者演示了编写简单爬虫的整个过程和技巧。对于抓取多层网页、图片下载和使用多线程加快爬虫效率的方法也做了讲解。读者以后在处理多进程和多线程的时候,可以考虑 Python 的标准库 multiprocessing,它能大大简化使用多进程和多线程处理任务的工作量。
本章要求读者完成作业:爬取深圳 Q 房网出租房源的数据,主要包括出租房源的小区名称、特点、户型、面积、租金、登记经纪人姓名及房源图片。读者可以思考一下,如果还需要爬取这套房源登记经纪人的服务年限和历史成交套数,应该如何编写代码?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论