您试图解开到这两个变量拆分列表确切的代码。
url, count = line.split()
如果没有空间或两个或更多空间会怎么样?剩下的话会去哪里?
data = "abcd"
print data.split() # ['abcd']
data = "ab cd"
print data.split() # ['ab', 'cd']
data = "a b c d"
print data.split() # ['a', 'b', 'c', 'd']
您可以分配
with open(urls_file_path, "r") as f:
for idx, line in enumerate(f, 1):
split_list = line.split()
if len(split_list) != 2:
raise ValueError("Line {}: '{}' has {} spaces, expected 1"
.format(idx, line.rstrip(), len(split_list) - 1))
else:
url, count = split_list
print url, count
随着输入文件之前,实际检查的长度,
http://google.com 2
http://python.org 3
http://python.org 4 Welcome
http://python.org 5
这个程序产生,
$ python Test.py
Read Data: http://google.com 2
Read Data: http://python.org 3
Traceback (most recent call last):
File "Test.py", line 6, in <module>
.format(idx, line.rstrip(), len(split_list) - 1))
ValueError: Line 3: 'http://python.org 4 Welcome' has 2 spaces, expected 1
继@abarnert's comment,您可以使用partition
功能这样
url, _, count = data.partition(" ")
如果有一个以上的空间/没有空间,那么count
将分别持有该字符串或空字符串的其余部分。
如果您正在使用Python 3.x中,你可以做这样的事情会在first
和second
分别和列表的其余部分分配此
first, second, *rest = data.split()
前两个值将被分配到rest
,在Python 3.x
你能显示确切的代码行,在哪个错误被引发? – thefourtheye
你做错了什么。 (对不起,但没有看到你做什么,我不能提供更好的答案。) – glglgl
它实质上意味着当输入字符串中有多个空格时,您不处理个案。 – gravetii