jsoup的connect方法获取的document写入本地html时候乱码怎么解决呢?

jsoup的connect方法获取的document写入本地html时候乱码怎么解决呢?

高跟鞋的旋律 发布于 2021-11-25 字数 743 浏览 864 回复 6

如题啊。爬网站的时候遇到的

Document doc = Jsoup.connect(url).timeout(5000).userAgent("Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)").get();

然后我写入本地

BufferedWriter bw = new BufferedWriter(new FileWriter(f, true));
		bw.write(doc + "n");
		bw.close();

打开后全是乱码。请问这个怎么解决呢?

ps:如果这个文件“f”是txt格式,打开是正常显示;如果是html格式,打开就是乱码,再用txt看timl源文件也是乱码。

我的eclipse设置是UTF-8格式。然后请问怎么把doc的格式统一一下啊?

如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

扫码加入群聊

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(6

后知后觉 2021-12-01 6 楼

一般的都是没有问题的。

你曾走过我的故事 2021-12-01 5 楼

引用来自“CoderLeon”的评论

        bw.write(doc + "n");

直接写入doc对象吗?好像不对吧,doc.html()试试呢

风透绣罗衣 2021-12-01 4 楼

请给完整代码,反正我每次获取DOC然后更新HTML都没有乱码

兮颜 2021-11-30 3 楼

引用来自“不日小鸡”的评论

FileOutputStream fos = new FileOutputStream(file, false);

OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");

反正我这么写没有乱码

做个少女永远怀春 2021-11-30 2 楼

        bw.write(doc + "n");

直接写入doc对象吗?好像不对吧,doc.html()试试呢

千笙结 2021-11-30 1 楼

FileOutputStream fos = new FileOutputStream(file, false);

OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");

反正我这么写没有乱码