我就只是想学一下怎么构造格…
参考:https://xz.aliyun.com/t/7163
这是一道巅峰极客线上赛的密码题,这个题目里师傅格构造起来挺友好的。
题目:
1 | from Crypto.Util.number import * |
generate
函数生成了4个参数p, f, g, h
,其中,
p
:是一个2048位的强素数
强素数定义:
另外还有述论上的定义,这里应该针对的是密码学
f
:一个1024位的随机数。
g
:一个768位的强素数。
h
:
这里用全等于号表示因为这里是模运算,同余p
而这个h
可以看到是在[0,p)这个区间内随机分布的一个数,所以基本是2000多位
encrypt
函数对明文(也就是flag)进行了加密:
- 先生成了一个1024位的随机数
r
- 然后加密:
我们再来看看给的参数:h, p, c
。
显然,如果我们知道了r
,那么就可以直接
解出flag。
但是这里的r
是一个随机(本质上是由os.urandom
函数)生成的1024-bit数,不可能求得出来的。
如果我们将同余式改写成等式
我们来估量一下k
的范围:
等式右边r
:1024-bit,h
:2000多bit,m
正常来说几百bit,所以r*h + m
大概3000多bit。
相加看最多位,相乘即约等于位数相加,1024+2000 约= 3024
等式左边c
:2000多bit,p
:2000多bit,因此k
大概也有1000多bit,相乘才可以等于右边,所以从k
出发也无法求解。
也就是我们无法在有限时间内快速地枚举k求m
所以想要求解,只能在剩下的两个未知参数f, g
上作文章了。
假如我们知道了f
,g
,利用目前已经知道的两个式子
我们可以将上式中的h
代入下式
现在假设我们已经知道了f, g
,那么只有r, m
未知;还是需要知道r
才能解出m
。
不过我们在式子两边同时乘上f
来试试看
可以得到:
我们这时候看看右边的内容
r
:1024-bitg
:768-bitm
:flag字符串转成数字,一个字符8bit,一般来说flag不会太长,所以基本上是小于1000bit的。f
:1024-bitp
:2048-bit
所以可以知道右边中
也就是直出直入,没有被模p
如果我们令
同样这也是模意义下的求解,需要找到比p小的,所以需要modp
而这时$c*f$大于$p$,我们这时就是看作是一个等式,不看同余式了,此时满足
也就是
于是我们在同余式中找到了一个等式
有了这个式子,就可以帮助我们直接绕过不可爆破求解的r,算出m
对上式子取模g
这样,r*g
这一项就直接消失了。
其中,a, f, g
均已知,求m
就很轻松了:
注意:
- 这里是在
mod g
下运算,还记得g
是一个768-bit的强素数么?这就保证了,虽然f
是个1024-bit的数,但是在mod g
下,f' = f - k*g
的逆元必定存在。- 此处的
f^-1
与h = f^-1 * g (mod p)
里的不是同一个东西。g
有768-bit,768/8=96,flag字符串一般来说不会超过96个字符长,因此m
比g
小,所以最终算出来的就是完完整整m
。
二三句都还挺正常挺好理解的,第一句话想了半天不知道怎么理解
吃个饭的时候突然想到可以这么理解
根据一开始维基百科的图,我们知道当$g
为强素数时,$g=a_3q_3-1
而在本题,$f
是个1024-bit的数,所以如果要逆元存在,就要满足$f*f^{-1}=1+kg
我一开始纠结的点在于这个k乘g,里面有个1,这样有个倍数k就消不了1
但是后面想到f>g
也就是存在k=1的情况,满足g=f*f^{-1}-1
此时我们知道~~f
对应$a_3$这个整数,那就存在这个f
的逆元
写完才觉得是狗屁不通,这个k是一定要存在的,但是后面我又想到可以换个思路
如果要满足这个逆元存在,也就是要满足$ff^{-1}=1+kg$存在,也就是$ff^{-1} -kg=1$
而我们根据线性方程定理
我们把f和g看做a和b,显然gcd(g,f)=1
那么就$f*f^{-1} -kg=1$方程必然有解,也就存在这个逆元
格基规约的利用
上述分析可以知道,我们只要能求出f,g,就能解密
而我们已知可以利用的式子只有:
我们如何从中求出f, g
呢?
这里就是格(Lattice)的范畴了。
先简单介绍一下lattice。
给定一组线性无关的基向量(basis)v1, v2, ..., vn
,那么这些基向量的所有线性组合(linear combinations)
所形成的集合,就叫做这组基向量所张成的空间(span)。
我们在二维平面内选取两个单位正交向量作为基向量$i=(1,0), j=(0,1)$
那么由这两组基向量的所有可能的线性组合张成的空间就是整个二维平面。
反过来,这个二维平面上的任何一点,都可以由这两组基底的一个线性组合来表示:
其实lattice的定义跟这个差不多。
给定一组线性无关的基向量v1, v2, ..., vn
,那么这些基向量的所有整系数线性组合
所形成的集合,就叫做这组基向量所张成的格(lattice),只不过此时的系数只能是整数,也就是说
从无数个连续的点变成了无数个离散的点。不同的基底,可能会张成不同的lattice。对原基底进行
整系数线性转换得到的新的基底,张成的lattice仍旧不变:
注意:同一个lattice有很多组基底。
在lattice里面,有两个知名的难题:
- SVP(最短向量问题,Shortest Vector Problem):给定lattice和基向量,找到lattice中的一个长度最短的非零向量。
- CVP(最近向量问题,Closest Vector Problem):给定lattice和基向量,以及一个不在lattice上的目标向量,找到lattice中一个距离目标向量最近的格向量。
在广义上的这两大难题已经被证明是NP-hard
。
这一题实质上就是一道求解SVP的题目。
虽说,SVP是NP-hard
的,但是本题的lattice维度很低,只有2维,所以还是很容易求解的。
实际上,LLL算法及其变种算法是目前已知在较低维度的lattice中求解SVP的最好的算法,但是在较
高维度中就比较乏力。
所以,并不是说NP-hard
就不可能求解。
那么,如何将本题看作成一个lattice中求解SVP的题目呢?
对于
也就是
我们可以构造一个由下面这个矩阵M中两个行向量(1,h)(0,p)所长成的lattice:
而这和行向量就相当于是这个格的其中一组基,但不是最短的
我们就是要通过格基规约,求解SVP问题,所以我们构造的格,要让想要求解的(f,g)在这个格上,且能通过LLL算法得到
下面我们要先证明向量(f,g)在这个lattice上
向量(f,g)
可以由两组基向量M
的某种整系数线性组合(f, -u)
来表示,因此向量(f,g)
就在这个lattice上
我们再来看看h, p, f, g
的大小。
h
:2000多bitp
:2048-bitf
:1024-bitg
:768-bit
相对于两个基底向量(1, h), (0, p)
来说,向量(f, g)
的长度要小得多得多:
根据欧几里得范式(其实就是求长度):
根据Gaussian heurstic可知,在这个lattice中最短向量的长度大概在sqrt(2^2048)=2^1024
左右。因此,很大概率上,这个(f, g)
就是这个lattice的最短向量。
可见,一开始参数的大小设置,是很关键的一点。
这个参数就是要保证这个
(f, g)
比自己小,不然就规约不了(没细究Gaussian heurstic是个啥)
跳过原文自己写的算法,(f, g)
就是一个在特定的2维lattice上的最短向量,直接LLL,
1 | h = 7257231567493321493497732423756001924698993879741072696808433246581786362611889417289029671240997843541696187487722285762633068287623369923457879458577466240950224087015909821079480431797917376609839097610864517760515986973340148901898582075413756737310797402537478388864632901178463429574227279668004092519322204990617969134092793157225082977967228366838748193084097651575835471869030934527383379794480007872562067799484905159381690179011192017159985260435844246766711550315143517066359521598424992244464723490166447105679062078049379153154659732304112563255058750656946353654402824529058734270363154894216317570784 |
也就是关键的 要让所要求的解 在我们想要的格以svp最短向量求解得到