简单python爬虫

简单python爬虫

情绪失控 发布于 2021-12-01 字数 350 浏览 824 回复 1

刚刚接触python,想学习一下爬虫。假设:

data_soup.find_all(attrs={"data-foo": "value"}) 

# [<div data-foo="value">one</div>,<div data-foo="value">two</div>]

然后我要怎么活取每个div里面的数据呢?   

for x in data:  。。。。。。。

 

如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

扫码加入群聊

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

可是我不能没有你 2021-12-01 1 楼

已解决:

import requests from bs4 import BeautifulSoup

response #f92672;">= requests.get(e6db74;">"http://www.cs.swust.edu.cn/index.php?mact=News,m0d722,default,1&m0d722number=25&m0d722category=%E6%96%B0%E9%97%BB%E5%8A%A8%E6%80%81&m0d722summarytemplate=newsPageList&m0d722pagenumber=2&m0d722returnid=36&m0d722returnid=36&page=36")
soup = BeautifulSoup(response.text)
#66d9ef;font-style:italic;">for x 66d9ef;font-style:italic;">in soup.findAll(#e6db74;">'div'cc7832;">,{#e6db74;">'class'f92672;">:#e6db74;">"newsSummarytitle"})f92672;">: 
#f92672;"> soup_str f92672;">= BeautifulSoup(str(x))
#66d9ef;">print(soup_str) 66d9ef;">print(soup_str.find('a').text)