2012-05-29 747 views
3

我有一个包含值为2000,00的文件。删除文件中的空格和空行使用Python

但它包含2000,00后的空格和空行。

我想删除所有的空格和空行,如果有人能够给出一些想法,我已经尝试了很多方法,但没有成功。

一种方法我累是如下

# Read lines as a list 
fh = open("transfer-out/" + file, "r") 
lines = fh.readlines() 
fh.close() 
# Weed out blank lines with filter 
lines = filter(lambda x: not x.isspace(), lines) 
# Write "transfer-out/"+file+".txt", "w" 
fh = open("transfer-out/"+file, "w") 
#fh.write("".join(lines)) 
# should also work instead of joining the list: 
fh.writelines(lines) 
fh.close() 
+1

没有的Python:'猫input.txt中| egrep -v'^ \ s * $'> output.txt' – eumiro

+1

这会留下数字后的空格。也许增加一个'tr':'cat input.txt | egrep -v'^ \ s * $'| tr -d''> output.txt' –

回答

5

strip()移除的前缘和后空格字符。

with open("transfer-out/" + file, "r") as f: 
    for line in f: 
     cleanedLine = line.strip() 
     if cleanedLine: # is not empty 
      print(cleanedLine) 

然后,您可以将脚本重定向到文件python clean_number.py > file.txt,例如。

+0

分解那些重复的“strip()”调用,并且您将获胜。 :-) – NPE

+0

是的,先生!更新。 –

+0

@ Jill-Jênnie这个“转出/”命令是什么意思? – Lucas

1

,你想这应该工作:

file(filename_out, "w").write(file(filename_in).read().strip()) 

编辑:虽然前面的代码在Python 2.x的工作,这是行不通的巨蟒-3(见@gnibbler评论)对于这两个版本中使用这样的:

open(filename_out, "w").write(open(filename_in).read().strip()) 
+0

我认为你的意思是'打开''不'文件'在这里。 –

+0

不,我的意思是文件。我更喜欢文件,但根据文档(http://docs.python.org/library/functions.html?highlight=file#file)打开是prefferable :-( – Jiri

+0

@BurhanKhalid,'文件'是一个不赞同的' open',它存在于Python2中,因为'open'是一个奇怪的名字,用于子类化'file'或者与'isinstance'一起使用,它不再存在于Python3中 –

2

另外一个与列表理解:

clean_lines = [] 
with open("transfer-out/" + file, "r") as f: 
    lines = f.readlines() 
    clean_lines = [l.strip() for l in lines if l.strip()] 

with open("transfer-out/"+file, "w") as f: 
    f.writelines('\n'.join(clean_lines)) 
+0

你应该添加一个连接:'f.writelines('\ n'.join(clean_lines))''。 –

+0

@ Jill-JênVieVie谢谢! –

1

改变你的'线'线来使用下面的发电机,它应该做的伎俩。

lines = (line.strip() for line in fh.readlines() if len(line.strip())) 
+0

'如果len(line.strip())'可以替换为'if line.strip()' – eumiro

+0

是的,很好的调用。 –

0

功能的:)

import string 
from itertools import ifilter, imap 

print '\n'.join(ifilter(None, imap(string.strip, open('data.txt')))) 
# for big files use manual loop over lines instead of join 

用法:

$ yes "2000,00 " | head -n 100000 > data.txt 
$ python -c "print '\n'*100000" >> data.txt 
$ wc -l data.txt 
200001 data.txt 
$ python filt.py > output.txt 
$ wc -l output.txt 
100000 output.txt 
+0

对不起,我很愚蠢的阅读你的代码!我必须从文件夹访问我的文件并从中删除空格和空行! – Sara

+0

而且还有一件事情把数据写回同一个文件 – Sara