2013-07-04 41 views
-1

我有一个制表符分隔的文件,我试图从中提取特定的信息。本质上,我想搜索每一行,找到一个标识符,然后计算出现在文本中的次数。我通过文字要循环和存储在字典中的信息..在python中识别和计算文本

这是我到目前为止有:

c_count = {"c1":0, "c2":0, "c3":0, "c4":0, "c5":0} 

analysis = open("myInputFileName") 

for x in c_count: 
    if line in analysis == x 
     c_count[x] = c_count[x] + 1 

     print c_count 

我得到的错误:

if line in analysis == x 
         ^
SyntaxError: invalid syntax 

我在做什么错误..? 谢谢!

回答

0

你错过了:

if line in analysis == x: 
         ^
         | 

尝试是这样的:

c_count = {"c1":0, "c2":0, "c3":0, "c4":0, "c5":0} 
with open("myInputFileName") as analysis: 
    for line in analysis:   #read lines one by one 
     line = line.strip()   #strip white-spaces 
     if line in c_count:   #if line is found in c_count, increase it's count 
      c_count[line] += 1 
+0

这将是在任何情况下,错误的测试。 –

+0

ahhh非常感谢你。这个例子非常有帮助。对于新手的错误感到遗憾 - 我只是刚刚开始学习python。 – user2545406

+0

@ user2545406很高兴帮助。 :)如果它适合你,请随时[接受答案](http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work/5235#5235)。 –