jsoup的connect方法获取的document写入本地html时候乱码怎么解决呢?
如题啊。爬网站的时候遇到的
Document doc = Jsoup.connect(url).timeout(5000).userAgent("Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)").get();
然后我写入本地
BufferedWriter bw = new BufferedWriter(new FileWriter(f, true)); bw.write(doc + "n"); bw.close();
打开后全是乱码。请问这个怎么解决呢?
ps:如果这个文件“f”是txt格式,打开是正常显示;如果是html格式,打开就是乱码,再用txt看timl源文件也是乱码。
我的eclipse设置是UTF-8格式。然后请问怎么把doc的格式统一一下啊?
如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

评论(6)

发布评论
需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。