小白科普 | 加密演算法/ Encryption Algorithm

加密算法是一个函数，也可以视为是一把钥匙，通过使用一个加密钥匙，将原来的明文档或数据转化成一串不可读的密文代码。加密流程是不可逆的，只有持有对应的解密钥匙才能将该加密资讯解密成可阅读的明文。加密使得私密数据可以在低风险的情况下，通过公共网络进行传输，并保护数据不被协力厂商窃取、阅读。

比特币加密算法一共有两类：非对称加密算法（椭圆曲线加密算法）和哈希算法（SHA256，RIMPED160算法）。

比特币私钥(private key)，公钥(public key)，公钥哈希值(pubkeyhash)，比特币地址(address)
公钥和私钥由椭圆曲线加密算法生成，私钥可推出公钥而反之不能，这也是这篇文章后半部分要隆重介绍的部分。
有了私钥，你就可以对文本签名。别人拿了你的公钥就可以根据签名认证你是否拥有私钥。这就是证明你拥有存款的办法。
为了安全起见，公钥应该隐藏起来。所以对公钥进行哈希加密，生成公钥哈希值然后计算哈希值的比特币地址：
公钥哈希值=RIMPED160(SHA256(公钥))
比特币地址=*1*+Base58(0+公钥哈希值+校验码)
校验码=前四字节(SHA256(SHA256(0+公钥哈希值)))
可以看出，地址和公钥哈希值是等价的（可以互推）但公钥哈希值只能由公钥算出（不能逆推）。
验证的时候需要提供签名和公钥，算出公钥哈希值并和比特币支出脚本的公钥哈希值对比，最后再验证签名。这样就保证了公钥不会出现在支出脚本里。
（收入单提供签名，支出单提供公钥，或者收入单提供签名和公钥，支出单提供公钥哈希值，这两种验证办法是比特币的标准脚本）

哈希(Hash)算法
哈希算法（又称散列算法）不是加密解密算法，因为其加密的过程是不可逆的（你只能加密不能解密），也没有所谓的公钥私钥的概念。
哈希算法原理是将一段信息转换成一个固定长度的字符串。这个串字符串有两个特点：
1、如果某两段信息是相同的，那么字符串也是相同的。
2、即使两段信息十分相似，但只要是不同的，那么字符串将会十分杂乱随机并且两个字符串之间完全没有关联。
信息可以是一串数字，一个文件，一本书。。。。。。只要能编码成一串数字即可。
显然，信息有无数多种而字符串的种类是有限的（因为是固定长度），所以这种加密是不可逆的。

哈希算法的用途
1、验证两段信息是否相同。
A使用QQ给B传了一个文件，这个文件会在QQ的服务器上保存下来。如果C也传了这个文件给D，QQ会对比这个文件的哈希值和A传给B的文件的哈希值是否相同，如果相同则说明是同一个文件，C就不需要再一次上传文件给服务器。这就是所谓的秒传。
一个压缩包在传输的时候可能会有损坏。在压缩之前计算原文件的哈希值并放入压缩包中，待解压后再次计算解压文件的哈希值。对比压缩包中的哈希值则可以知道文件是否损坏。BT和迅雷下载中所谓的哈希验证也是同一道理。
2、验证某人是否信息持有者。
在一个论坛注册帐号，如果论坛把密码保存起来，因为无论坛多么安全都可能会被破解，所以密码总会有泄漏的可能性。
如果不保存密码而保存密码的哈希加密值。当你下次登陆论坛的时候，将你输入的密码的哈希值和你注册时密码的哈希值比对，如果相同则可以证明你就是密码持有者了。这样既保证了密码泄露的可能，又保证了验证持有者的功能。

哈希算法的破解
假如论坛被破解了，黑客获得了哈希值，但黑客只有哈希值依旧是不能登陆论坛的，他得算出用户的密码。
他可以随机产生密码一个一个试，如果算出的哈希值正好和这个哈希值相同，则说明这个密码可用。这就是所谓的猜密码。
显然，密码长度越长，密码越复杂，猜到的可能性就越低。如果有一种办法能增加这种猜到可能性，使其大到能够容忍的范围，则该哈希算法被破解了。
例如原本猜中的概率是1/10000000000000，现在增加到了1/1000。如果每猜一个密码需要1秒，按照之前的概率猜知道太阳毁灭都可能没猜中，但后者只需要1小时就足够了。
另外，由于信息的种类是无限的，所以你猜中的密码未必就是原先的密码，它们可能是碰巧哈希值相同而已，这就是所谓的碰撞。
如同增加猜中概率一样，如果能增加碰撞的概率，那么同样可以轻易登陆论坛（因为论坛也不知道原本的密码是什么，所以猜的密码和原密码不同也没关系，只要哈希值相同即可）。
一旦碰撞容易轻易产生，那么哈希算法就被破解了。前几年闹得沸沸扬扬的哈希算法破解就是这么回事，数学家通过一定办法增加了碰撞的概率。

哈希算法的大致加密流程
1、对原文进行补充和分割处理（一般分给为多个512位的文本，并进一步分割为16个32位的整数）。
2、初始化哈希值（一般分割为多个32位整数，例如SHA256就是256位的哈希值分解成8个32位整数）。
3、对哈希值进行计算（依赖于不同算法进行不同轮数的计算，每个512位文本都要经过这些轮数的计算）。
经过这样处理以后，哈希值就显得十分杂乱随机了。

非对称加密算法
非对称加密算法是世界上最重要的加密解密算法。
所谓非对称，是指加密和解密用到的公钥和私钥是不同的。
非对称加密算法依赖于求解一数学问题困难而验证一数学问题简单。

RSA算法
著名的RSA加密算法就是利用了对一个大整数进行因数分解困难，验证因子组成某个大整数容易的原理而编写的。
具体说，比如求143的因子，你可能需要进行11次除法才能得到143=11*13的结果。但是要验证11*13=143，则只需要一次乘法就够了。
如要破解RSA，只需要能够快速分解大整数即可，显然这是破解RSA最简单最快速的办法。但要分解大整数是极不容易的（数学上叫做NP-Hard问题），这也就是RSA能保证其不能被破解的原因。
反之，如果人类某天找到了快速分解大整数的办法（例如利用量子计算机进行计算），则RSA算法就立即被破解了。

RSA算法的大致原理
生成公钥和私钥：
1、生成一对大质数p,q，求出n=p*q和f=(p-1)*(q-1)。
2、生成一个随机数e，满足e<f且e,f互质。
3、求出e关于f的模逆d，即求出e*d=1 mod f。
设明文为m，密文为g。
用公钥n,e加密：m^e=g mod n
用私钥n,d解密：g^d=m mod n
证明解密后的明文就是原先的明文：
根据加密解密规则，将g=m^e mod n代入g^d=m mod n后，发现只要证明m^(e*d)=m mod n即可（同余运算的原理）。
由于e*d=1 mod f，所以只需证明m^(f+1)=m mod n即可。根据欧拉定理，f是欧拉函数所以得证。（具体的数学原理这里不再赘述）
显然，如果知道了f，就可以根据公钥n,e计算出d破解明文。要知道f，必须得知道p和q。要知道p和q，必须将n分解。所以RSA的破解依赖于整数分解。
如果对RSA算法感兴趣，可以看这两篇文章。
http://www.ruanyifeng.com/blog/2013/06/rsa_algorithm_part_one.html
http://www.ruanyifeng.com/blog/2013/07/rsa_algorithm_part_two.html

椭圆曲线加密算法
试想有一种乘法，可以在已知a,b的情况下计算出c=a*b，但已知c,a不能计算出b。
我们可以利用这种乘法进行加密解密。
设明文m，密文g1,g2。
用公钥a,c=a*b,r（随机数）加密：
g1=m+r*c
g2=r*a
用私钥a,b解密：m=g1-b*g2
证明：
g1-b*g2
=m+r*c-b*r*a
=m+r*c-r*c
=m
我们还可以利用这种乘法进行签名认证。
设原文m，签名g1,g2。
用私钥a,b,r（随机数）签名：
x=r*a
g1=SHA(m,x)
g2=r-g1*b
用公钥验证：
g2*a+g1*c
=(r-g1*b)*a+g1*c
=r*a-g1*b*a+g1*c
=r*a-g1*c+g1*c
=r*a
=x
计算SHA(m,x)是否和g1相等。
这就是加密解密层面上的椭圆曲线加密算法。

椭圆曲线加密算法的点乘运算
如何找到这样一种乘法是椭圆曲线加密算法的关键。通常的整数乘法是没法满足这样的要求的。乘法来源于加法，我们必须定义新的运算规则。
例如定义a!+b=a*b，a!*b=b^a，这里的!+和!*是新定义的加法和数量乘法，于是我们得到这样的结论：
加法交换律：a!+b=b!+a
加法结合律：(a!+b!)+c=a!+(b!+c)
加法零元素存在：a!+1=a*1=a，这里的1相当于普通加法中的0。
加法负元素存在：a!+b=a!+(1/a)=a*(1/a)=1
数量乘法单位元素存在：1!*b=b^1=b
数量乘法结合律：(a*b)!*c=c^(a*b)=c^(b*a)=c^b^a=a!*(c^b)=a!*(b!*c)
加乘法分配率：(k+l)!*a=k!*a+l!*a
加乘法分配率：k!*(a!+b)=k!*a!+k!*b
这样的加法和乘法满足了很多普通加法和乘法中的性质，但是却满足了一些特定条件，例如比原本的乘法更难根据a和c=a!*b=a^b求出b（需要对数运算）。
我们的目标是找到这样一种加法和乘法，使其满足前文所说的条件。数学家通过研究椭圆曲线找到了这一办法：
设平面上两点P(x1,y1)，Q(x2,y2)，则P+Q=R(x3,y3)，满足x3=k^2-2x1，y3=k(x1-x3)-y1，k=(3*x1)/(2y1)。定义k*P=P+P+P+....+P。
这样的一套（关于平面上点的）运算法则（加法和点乘）就满足这样的需求。
这和椭圆曲线有什么关系呢？事实上，如果P和Q都是曲线y^2=x^3+7上的点，那么P+Q=R也是椭圆曲线y^2=x^3+7上的点并且这三个点位于一条直线上。
这并不是巧合，而是逆推出来的。亦即当P和Q是曲线上的点的时候，那么直线PQ和曲线的交点是R，求出R的坐标为(x3,y3)。
使用椭圆曲线加密算法是因为它比RSA算法更快，并且能够实现和RSA算法类似的功能。
实际使用的时候，还需要将曲线和点离散化，并且把坐标系扩展。这涉及更多数学知识，如有兴趣可参考这篇文章：
http://www.pediy.com/kssd/pediy06/pediy6014.htm
关于比特币中椭圆曲线用到的参数，可参看这个：
https://en.bitcoin.it/wiki/Secp256k1

小白科普 | 加密演算法/ Encryption Algorithm

小白科普 | 加密演算法/ Encryption Algorithm

扫一扫手机访问

发表评论