文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
5.4 本章小结及要求
本章首先讲解了网站的保持登录机制,并利用这种机制使用 Cookies 登录了豆瓣网站,然后重点讲解使用 Requests 库的 POST 方法登录网站的技巧,这与使用 Cookies 直接登录网站是两种不同的思路,但都能达到登录网站的目的。使用代码直接登录有时候会遇到验证码难以处理、登录用户名及密码被加密等情况。如果直接登录比较棘手,可以优先考虑使用登录后的 Cookies 登录。
本章要求读者使用 Cookies 登录知乎网站并爬取个人首页推送的前 5 条动态信息的题目和摘要,爬取过程中要注意为爬虫添加 User Agent 信息。若读者分析知乎网站登录的过程,会发现直接使用 Requests 登录很难实现,对于这种情况,可以借助第 7 章中讲到的 Selenium 模块实现知乎网站的登录。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论