在如今的大数据互通的时代,我们很多人的个人信息难免不会被自己一次登记或者注册从而被一些不法分子使用爬虫抓取。想必大家也经常莫名其妙收到各种骚扰电话、短信;这个时候很多学过python的小伙伴就会说,我可以使用python当中的md5进行加密呀!
要说如何使用进行md5进行加密解密,不如我们先来了解一下什么是md5加密解密。
md5密码它的基本意思就是通过md5的加密方式生成的密码(就像摩斯密码一样),解密也就是将自己已经加密的密码通过一些手段处理,将密码还原成原来的模样。一般python采用hashlib这个标准库来实现MD5的加密解密。
那么我们现在来一起看一下通过python来使用md5进行加密解密的方法:
(一)updata传数据;update(arg)传入arg对象来对hash的对象进行更新。但是这里值得注意的是,该方法只接受byte类型,不然执行的时候系统会报错。这就是要在参数前添加b来转换类型的原因。同时要注意,重复调用update(arg)方法,是会将传入的arg参数进行拼接,而不是覆盖。也就是说,m.update(a); m.update(b) 等价于m.update(a+b)。
(二)、利用hexdigest进行16进制转换; hexdigest()在英语中hex有十六进制的意思,因此该方法是将hash中的数据转换成数据,其中只包含十六进制的数字。
详细见下面案例:
>>> import hashlib >>> m = hashlib.md5() >>> m.update(b'123') >>> m.hexdigest() '202cb962ac59075b964b07152d234b70' # 或者可以这样(常见的写法,常用于图片的命名) >>> hashlib.md5(b'123').hexdigest() '202cb962ac59075b964b07152d234b70' # 也可以使用hash.new()这个一般方法,hashlib.new(name[, data]),name传入的是哈希加密算法的名称,如md5 >>> hashlib.new('md5', b'123').hexdigest() '202cb962ac59075b964b07152d234b70'
上面是针对于英文数据来进行md5加密,如果要对中文数据来加密,发现按照上面来写会报错,原因在于字符转码问题,要如下写:
>>> import hashlib >>> data = '你好' >>> hashlib.md5(data.encode(encoding='UTF-8')).hexdigest() '7eca689f0d3389d9dea66ae112e5cfd7'
此处先将需要加密的数据转换成UTF-8格式,然后使用网上工具对比下加密的结果,这个时候你会发现有的md5加密工具并不是使用UTF-8格式加密的。
经测试目前发现可以转为UTF-8、GBK、GB2312、GB18030,不分大小写(因为GBK/GB2312/GB18030均是针对汉字的编码,所以md5加密后结果一样)。例如:
>>> hashlib.md5('你好'.encode(encoding='UTF-8')).hexdigest() '7eca689f0d3389d9dea66ae112e5cfd7' >>> hashlib.md5('你好'.encode(encoding='GBK')).hexdigest() 'b94ae3c6d892b29cf48d9bea819b27b9' >>> hashlib.md5('你好'.encode(encoding='GB2312')).hexdigest() 'b94ae3c6d892b29cf48d9bea819b27b9' >>> hashlib.md5('你好'.encode(encoding='GB18030')).hexdigest() 'b94ae3c6d892b29cf48d9bea819b27b9'