返回介绍

5.4 本章小结及要求

发布于 2025-04-21 19:15:27 字数 367 浏览 0 评论 0 收藏

本章首先讲解了网站的保持登录机制,并利用这种机制使用 Cookies 登录了豆瓣网站,然后重点讲解使用 Requests 库的 POST 方法登录网站的技巧,这与使用 Cookies 直接登录网站是两种不同的思路,但都能达到登录网站的目的。使用代码直接登录有时候会遇到验证码难以处理、登录用户名及密码被加密等情况。如果直接登录比较棘手,可以优先考虑使用登录后的 Cookies 登录。

本章要求读者使用 Cookies 登录知乎网站并爬取个人首页推送的前 5 条动态信息的题目和摘要,爬取过程中要注意为爬虫添加 User Agent 信息。若读者分析知乎网站登录的过程,会发现直接使用 Requests 登录很难实现,对于这种情况,可以借助第 7 章中讲到的 Selenium 模块实现知乎网站的登录。

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。