想必很多小伙伴在使用python爬虫的时候,会出现抓取到的结果乱码的情况,那么该如何解决呢?小编觉得应该是爬到内容中出现了中文,然后出现了中文乱码,小编就通过这篇文章来给大家介绍一个解决中文乱码的方法。
我们首先从URL开始下手,需要获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。
爬虫部分代码如下
`` r = requests.get('http://www.xxxxxxxxxxxxxxx.html') print(r.text) ```
初次试写python爬虫爬取网页小说,但是会出现中文乱码,很是尴尬。
解决办法如下:
先 r.encoding = r.apparent_encoding # 解决中文乱码
解码后再取text。结束。
以上就是小编给大家带来解决爬虫获取的内容乱码方法了,希望大家通过阅读小编的文章之后能够有所收获!如果大家觉得小编的文章不错的话,可以多多分享给有需要的人,大家如果认可我们优草派网站的话也可以多多支持和关注,以便大家了解更多的知识点。