文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
2.4 本章小结及要求
本章介绍了 HTTP 请求的含义,讲解了 Requests 库的一些常见基础用法,读者现在如果不能全部记住这些方法也没有关系,后面的实例将实际使用这些方法爬取网页,同时后续章节将通过实例介绍 Reqeusts 库发送表单形式的数据、使用 IP 代理等其他高级用法。本章还简单讲解了 Urllib 库的基本用法,Urllib 库还有很多高级用法,读者可以查阅它的官方文档。由于 Reqeusts 库已经可以满足编写简单爬虫的大部分需求并且更简单、使用更方便,本书后面的章节在讲解实际爬取网站的技巧时,都会使用 Reqeusts 库,读者简单了解 Urllib 库的这部分内容即可,应重点了解 URL 解析这部分的用法,在构造爬虫 URL 的时候,有可能用到这部分工具。
本章要求读者学会 Requests 库的常见基础用法,能够在 Python 解释器中使用 Requests 库实现发送请求、将获取到的响应解码保存到本地计算机上,为下一步编写简单爬虫打好基础。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论