优草派  >   Python

如何解决python3中的requests解析中文页面出现乱码?requests库解析中文页面的方法

翟嘉慧            来源:优草派

很多小伙伴发现自己在使用requests库解析中文页面出现乱码怎么办,那么今天我就通过这篇文章有关“如何解决python3中的requests解析中文页面出现乱码?requests库解析中文页面的方法”来给大家详细讲解一下问题解决的方法,感兴趣的小伙伴可以试着使用今天讲解的方法去解决自己遇见的问题。

如何解决python3中的requests解析中文页面出现乱码?requests库解析中文页面的方法

一、关于requests库

1、使用requests前,你需要安装这个库,安装代码:pip install requests。之后进入今天的主题-----request。每一个请求方法都有一个对应的API,比如GET请求就可以使用get()方法

get 请求
import requests
html = requests.get(‘https://www.baidu.com’)
print(html.status_code)#查看状态码
print(html.url)
print(html.text)

2、使用requests对象在访问服务器的时候会返回一个响应对象,它会将字节码保存到content属性中,如果我们要访问的是另一个属性text时,它又会返回unicode对象,一般出现中文乱码的问题就在这里。

3、因为编码的形式是通过属性将字节码转换得来的,不能使一个响应对象去猜出来。

二、解决方法

可以直接使用字节码的形式,也可以把encoding设置成一个正确的形式,举个例子:下面我获取了一段有关gbk编码的网页,我需要通过以下的方法才能得到一个正确的编码格式。

import requests
url = "http://xxx.xxx.xxx"
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)

以上所述是今天给大家介绍的如何解决python3中的requests解析中文页面出现乱码?requests库解析中文页面的方法,希望对大家有所帮助。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。
TOP 10
  • 周排行
  • 月排行