python抓取百度结果的正则式应该怎么写
比如我搜cassia,搜到的结果如图
在程序中,我是这样写的
import urllib2 import re import HTMLParser import os url=r'http://www.baidu.com/s?ie=UTF-8&wd=cassia' content=urllib2.urlopen(url).read() regex = r'<div class="result(.*?)</div>' result = re.findall(regex,content) print result with open('/python/123.txt','w') as f: for ele in result: f.write(ele+"n")
抓到的结果总是空,这是怎么回事。正则式应该怎么写?
如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

评论(6)


发布评论
需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。