既然没有人还没有显示出真正的筛子或解释, 我会尝试。
基本方法是从2开始计数并消除2 * 2和2的所有更高倍数(即4,6,8 ...),因为它们都不是素数。 3在第一轮存活,所以它是总理,现在我们消除3 * 3和3的所有更高的倍数(即9,12,15 ...)。 4个被淘汰,5个幸存下来等。每个素数的平方是一个优化,利用了每个新素数的所有较小倍数将在前几轮被淘汰的事实。使用这个过程来计算和消除非素数时,只有素数会留下。
这是一个非常简单的版本,发现它不使用模数师或根:
def primes(n): # Sieve of Eratosthenes
prime, sieve = [], set()
for q in xrange(2, n+1):
if q not in sieve:
prime.append(q)
sieve.update(range(q*q, n+1, q))
return prime
>>> primes(100)
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73
79, 83, 89, 97]
上面的简单的方法是出奇的快,但不利用这一素数只能是奇数的事实。
这是一个基于生成器的版本,比我发现的任何其他版本都快,但在我的机器上n = 10 ** 8时达到Python内存限制。
def pgen(n): # Fastest Eratosthenes generator
yield 2
sieve = set()
for q in xrange(3, n+1, 2):
if q not in sieve:
yield q
sieve.update(range(q*q, n+1, q+q))
>>> timeit('n in pgen(n)', setup="from __main__ import pgen; n=10**6", number=10)
5.987867565927445
这里有一个稍微慢一些,但更多的内存高效发电机版本:
def pgen(maxnum): # Sieve of Eratosthenes generator
yield 2
np_f = {}
for q in xrange(3, maxnum+1, 2):
f = np_f.pop(q, None)
if f:
while f != np_f.setdefault(q+f, f):
q += f
else:
yield q
np = q*q
if np < maxnum:
np_f[np] = q+q
>>> timeit('n in pgen(n)', setup="from __main__ import pgen; n=10**6", number=10)
7.420101730225724
>>> list(pgen(10))
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47]
测试一个数是素数只是做:
>>> 539 in pgen(539)
False
>>> 541 in pgen(541)
True
下面是一些提示,以这种更高效的内存版本如何工作。它使用dict
来存储最小的信息,下一个非素数(作为关键字)及其因子(作为值)。由于在dict
中找到每个非素数,因此将其删除,并使用相同的因子值添加下一个非主键。
你的实现是错误的,请尝试运行一次,看看它是否产生正确的答案。检查我的答案的变化。 –