随机化算法浅谈(2)

随机化算法浅谈(2)

上一篇我们谈到了求整数的因子的一种随机化的Polland算法,继续随机化算法的话题,我们讨论另外一类随机化算法——蒙特卡洛方法。

二、蒙特卡洛方法:M-R质性测试

相对于拉斯维加斯方法,随机化算法中还有一类叫作蒙特卡洛方法,它的基本思想是:每次运行随机生成问题的解,其中有一部分可以判断真假,另一部分不能判断真假,将不能判断的认为是可能错误的。由于每次生成问题的解都是相互独立的,所以生成次数越多,不能判断真假(可能错误的)概率就越小。所以蒙特卡洛方法需要一个描述错误解可接受概率的参数,于是算法的时间复杂度除了由问题实例的规模决定,也受至可接受概率参数的影响。

判断一个正整数是否是质数,这也是比较常见的问题。要判断N是否为质数,我们可以用\( [2,\sqrt{N}] \)中的所有整数取模,若所有数字都不被整除,则N是质数。有时我们可以跳过大于2偶数,只检查奇数来减少判断次数:

int isPrime(int N)
{
    if (N==2)
        return 1;
    if (N%2==0)
        return 0;
    int k=3;
    while(k*k <= N)
    {
        if (N%k==0)
            return 0;
        k+=2;
    }
    return 1;
}

这样正整数是否为质数的检验算法的时间复杂度为\(O(\sqrt{N})\)。然而,利用费马小定理,结合蒙特卡洛方法的思想,可以在\( \Theta(\log(n)) \)时间内检验正整数是否为质数。

  • 费马小定理:如果\(p\)是一个质数, \(a\) 是小于 \(p\) 的任意正整数,那么 \(a^p\) 与 \(a\) 是模 \(p\) 同余的(\(a^p\)与\(a\)同时对\(p\)取模,所得余数相同)。

也就是说:对于质数\(p\),有pow(a,p) % p == a % p ,两边约去一个a,则为: pow(a,p-1) % p ==1

我们要测试正整数\(N\)是否为质数,就可以利用 pow(a,N-1) % N,若得到不是1的结果,则立即可以断定\(N\)不是质数,但是若此式结果为1并不能下结论N就是质数,这时可以重新随机生成一个a再测试。如此进行多次,如果每次都得到结果为1,虽然此时仍不能下结论N一定是质数,但N是质数的概率已经非常非常高。值得一提的是,存在一类数字叫作Carmichael数,无论a取什么值都可以使 pow(a,N-1) % N 的值为1,但这类数字均不是质数,在[1,100000000] 之内有255个,其中最小的几个是 561, 1105, 1729, 2465。不过在对大数进行素性检测时,碰到这类Carmichael数的几率是极小的。

int fermatCheck(int N)
{
    int a=1+rand()%N;
    return (((long long)pow(a,N-1))%N == 1);
}

Miller与Rabin引入了二次探测定理,不再是每次完全随机生成a。

  • 二次探测定理:如果\(p\)是奇素数,则方程\(x^2\)对\(p\)取模等于1的解满足x1=1,x2%p=p-1

将费马小定理与二次探测定理结合起来,就是Miller-Rabin质性测试:如果pow(a,N-1)%N==1,首先看N-1是否为偶数,若是则令u=(N-1)/2,并检查是否满足二次探测定理,即pow(a,u)==1pow(a,u)%N==N-1

const int S = 9;
int MR_check(int N)
{
    if (N==2)  return 1;
    if (N%2==0)  return 0;
    int u = N-1;
    while(u%2==0)
    {
        u=u/2;
    }
    for(int T=0;T<S;T++)
    {
        int a= 2+rand()%(N-3);
        long long x=((long long)pow(a,u))%N;
        while(u<N)
        {
            long long y=x*x %N;
            if(y==1 && x!=1 && x!=N-1) return 0;
            x=y;
            u=u*2;
        }
        if(x!=1)  return 0;
    }
    return 1;
}

Miller-Rabin质性测试同样有一定的错误率,经过数学上的分析,单次Miller-Rabin质性测试的错误率为\(1/4\),进行S次的错误概率就是\(4^{-S}\),这里的S可根据需要自行设定。每次Miller-Rabin时间复杂度为\(O(\log(N))\),总共进行\(S\)次就是\(O(S \cdot \log(N))\),当\(S=9\)时,M-R质性测试的错误率已经低于\(0.0004%\)。相较于确定性算法,M-R质性测试的效率提升还是非常明显的。

参考文献

[1] Harold Abelson, Julie Sussman . Structure and Interpretation of Computer Programs[M].2004
[2] Joe Hurd. Verification of the Miller-Rabin Probabilistic Primality Test[C].The Journal of Logic and Algebraic Programming.2003.56:3-21
[3] 柳银萍 . 华东师大-算法第十四、十五讲_概率算法 [R] . 2011
[4] Miller Rabin_primality_test [OL] . https://en.wikipedia.org/wiki/Miller-Rabin_primality_test
[5] Matrix67. 数论部分第一节:素数与素性测试[OL]. 2007.6. http://www.matrix67.com/blog/archives/234

Comments are closed.