把密码变成散列真能保证其唯一性吗？Python中hashlib模块的探究--粉丝服务平台-粉丝头条-fensifuwu.com

把密码变成散列真能保证其唯一性吗？Python中hashlib模块的探究

科技 12-25 来源： python高手养成

上一篇我们探讨了Python中的可哈希对象（参见是哈希不是嘻哈，你真的了解散列吗？理解Python中可哈希对象概念），我们知道了，这种可哈希对象从产生到对象销毁能保证其唯一性，它的值一般是不可变化的。并且，通过这种可哈希对象数值不能逆推出对象本身内容。那么，问题来了，这样的对象有什么用呢？本篇我们从Python内部和外部两种应用来探讨下这种可哈希对象的价值。

有哪些应用价值呢？

可哈希对象在Python内的应用

我们知道，set集合的特点是它的内部实现了一种排重操作，当数据交给集合set时，如果数据重复，那么这种重复数据是不会添加到set集合内的。问题来了，set怎么判断数据是否重复呢？

集合的内部实现机制

聪明的小伙伴一定猜到了，就是通过内部算法实现，判断数据的hash值是否相等。如果相等（它的内部算法可以保证这种数据唯一性，内部有哪些算法呢？后面会讲到），那么就是真的相等了（废话）。对于字典键的判断，应该也是这个原理。内部应该会有很多这种利用hash判断值唯一性的方法，今天就不赘述了，改天专题研究一下。

那么，Python中有没有类似的模块能实现这种hash操作呢？

hashlib模块

Python中hashlib模块内置了各种hash算法，文档中hashlib是这样解释的：

A common interface to many hash functions（许多散列函数的公共接口）

我们来看一下Python提供了哪些hash算法接口

print([item for item in dir(hashlib) if not item.startswith('_')])

>>>['algorithms_available', 'algorithms_guaranteed', 'blake2b', 'blake2s', 'md5', 'new', 'pbkdf2_hmac', 'scrypt', 'sha1', 'sha224', 'sha256', 'sha384', 'sha3_224', 'sha3_256', 'sha3_384', 'sha3_512', 'sha512', 'shake_128', 'shake_256']

提供的接口有很多，我们归类解释：

先看两个返回hash算法的接口

algorithms_available（可用算法）：当前运行的python解释器支持的hash算法的名称集合。

algorithms_guaranteed（算法保证）：所有平台的hashlib模块都支持的hash算法的名称集合。

比如，hashlib.algorithms_available看下当前Python解释器支持的算法名称，输出如下：

>>>

{'blake2b', 'blake2b512', 'blake2s', 'blake2s256', 'md4', 'md5', 'md5-sha1', 'mdc2', 'ripemd160', 'sha1', 'sha224', 'sha256', 'sha3-224', 'sha3-256', 'sha3-384','sha3-512', 'sha384', 'sha3_224', 'sha3_256', 'sha3_384', 'sha3_512', 'sha512', 'sha512-224', 'sha512-256', 'shake128', 'shake256', 'shake_128', 'shake_256', 'sm3', 'whirlpool'}

可以实现这么多算法，我们来看一下具体如何使用。

如何使用呢？