优草派  >   Python

使用python爬虫获取的内容出现乱码怎么办?通过这篇文章教会你解决方法

陈立鑫            来源:优草派

想必很多小伙伴在使用python爬虫的时候,会出现抓取到的结果乱码的情况,那么该如何解决呢?小编觉得应该是爬到内容中出现了中文,然后出现了中文乱码,小编就通过这篇文章来给大家介绍一个解决中文乱码的方法。

使用python爬虫获取的内容出现乱码怎么办?通过这篇文章教会你解决方法

我们首先从URL开始下手,需要获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。

爬虫部分代码如下

``
r = requests.get('http://www.xxxxxxxxxxxxxxx.html')
print(r.text)
```

初次试写python爬虫爬取网页小说,但是会出现中文乱码,很是尴尬。

解决办法如下:

先 r.encoding = r.apparent_encoding # 解决中文乱码

解码后再取text。结束。

以上就是小编给大家带来解决爬虫获取的内容乱码方法了,希望大家通过阅读小编的文章之后能够有所收获!如果大家觉得小编的文章不错的话,可以多多分享给有需要的人,大家如果认可我们优草派网站的话也可以多多支持和关注,以便大家了解更多的知识点。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。
TOP 10
  • 周排行
  • 月排行