2010-07-16 91 views
5

在Perl中,要获得从“a”到“azc”的所有字符串的列表,只需要做的事情是使用范围运算符:什么是python相当于perl“a”..“azc”

perl -le 'print "a".."azc"' 

我要的是一个字符串列表:

["a", "b", ..., "z", "aa", ..., "az" ,"ba", ..., "azc"] 

我想我可以使用ordchr,循环一遍又一遍,这是简单的获得“A”到“Z”,例如:

>>> [chr(c) for c in range(ord("a"), ord("z") + 1)] 
['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z'] 

但我的情况稍微复杂一些,在这里。

感谢您的帮助!

回答

4

发电机版本:

from string import ascii_lowercase 
from itertools import product 

def letterrange(last): 
    for k in range(len(last)): 
     for x in product(ascii_lowercase, repeat=k+1): 
      result = ''.join(x) 
      yield result 
      if result == last: 
       return 

编辑: @ihightower要求在评论:

如果我想从'b'打印到'azc',我不知道该怎么办。

所以你想从'a'以外的东西开始。开始前值只是丢弃任何东西:

def letterrange(first, last): 
    for k in range(len(last)): 
     for x in product(ascii_lowercase, repeat=k+1): 
      result = ''.join(x) 
      if first: 
       if first != result: 
        continue 
       else: 
        first = None 
      yield result 
      if result == last: 
       return 
+0

是啊!绝对好(不能投票,因为我只有11的声望,但声音正确!) – 2010-07-16 12:16:13

+0

伟大的答案麦克! – ninetwozero 2013-01-17 11:06:29

+0

可能是很好的答案......但是,如何使用这个......作为一个新手......如果我想从'b'打印到'azc',我不知道该怎么办。我从字母“b”重复字母“azc”。功能可能不错,但作为初学者,我不知道如何使用它来完成实际的工作和打印。 – ihightower 2013-05-13 15:32:25

2

在itertools中使用产品调用,在字符串中使用ascii_letters。

from string import ascii_letters 
from itertools import product 

if __name__ == '__main__': 
    values = [] 
    for i in xrange(1, 4): 
     values += [''.join(x) for x in product(ascii_letters[:26], repeat=i)] 

    print values 
+0

它应该是'ascii_lowercase',而你还没有占到在“AZC”停止。 – 2010-07-16 11:44:33

+0

嗯,谢谢,在这里我可以有一个从字符串列表到zzz。所以我会做第二个循环来将项目从第一个循环复制到第二个循环,并在遇到“结束”字符串时停止。 我会用完整的代码示例回答我的问题。非常感谢 ! – 2010-07-16 11:49:33

0
def strrange(end): 
    values = [] 
    for i in range(1, len(end) + 1): 
     values += [''.join(x) for x in product(ascii_lowercase, repeat=i)] 
    return values[:values.index(end) + 1] 
+0

与此有关的主要问题:1)使用'xrange'而不是'range'。由于'range'是一个生成器,并且不会预先生成结果列表,所以'xrange'不再有'range'的优势。因此'xrange'不推荐使用,而IIRC,甚至不使用Python 3. 2)当你可以刚刚使用'list.index()'和slice操作时,从'values'构造'endvalues'。3)这不是如何将问题标记为在SO上回答的问题。 – 2010-07-16 12:15:59

+2

@Mike,Python 2.7中仍然需要'xrange',它在不到2周前发布。 'range'仍然返回一个列表。 – 2010-07-16 12:21:33

+0

我已经更新了这个使用切片和索引()。还删除了包装文字。 – 2010-07-16 12:28:53

4

一个建议完全基于迭代器:

import string 
import itertools 

def string_range(letters=string.ascii_lowercase, start="a", end="z"): 
    return itertools.takewhile(end.__ne__, itertools.dropwhile(start.__ne__, (x for i in itertools.count(1) for x in itertools.imap("".join, itertools.product(letters, repeat=i))))) 

print list(string_range(end="azc")) 
1

这里有一个更好的方式来做到这一点,但你需要一个转换功能:

for i in xrange(int('a', 36), int('azd', 36)): 
    if base36encode(i).isalpha(): 
     print base36encode(i, lower=True) 

而且这里是你的函数(谢谢Wikipedia):

def base36encode(number, alphabet='ABCDEFGHIJKLMNOPQRSTUVWXYZ', lower=False): 
    ''' 
    Convert positive integer to a base36 string. 
    ''' 
    if lower: 
     alphabet = alphabet.lower() 
    if not isinstance(number, (int, long)): 
     raise TypeError('number must be an integer') 
    if number < 0: 
     raise ValueError('number must be positive') 

    # Special case for small numbers 
    if number < 36: 
     return alphabet[number] 

    base36 = '' 
    while number != 0: 
     number, i = divmod(number, 36) 
     base36 = alphabet[i] + base36 

    return base36 

我加上了小写转换选项,以防万一你想这样做。

1

我全身接受的答案才能够启动中,比小写使用其他:

from string import ascii_lowercase, ascii_uppercase 
from itertools import product 

def letter_range(first, last, letters=ascii_lowercase): 
    for k in range(len(first), len(last)): 
     for x in product(letters, repeat=k+1): 
      result = ''.join(x) 
      if len(x) != len(first) or result >= first: 
       yield result 
       if result == last: 
        return 
print list(letter_range('a', 'zzz')) 
print list(letter_range('BA', 'DZA', ascii_uppercase))