2017-06-08 54 views
-1

我正在处理其他人在Excel中被篡改的CSV文件,因此以某种方式在文件末尾包含其他逗号(分隔符)中间文件和不完整行。忽略尾部逗号中间文件,忽略尾部不完整行

自然熊猫/ Python的CSV阅读器无法处理这些文件。

我想知道是否有人知道现有的解决方案是为了解决这些烦人的功能。我很欣赏从头开始编写解决方案的非常重要的建议。

举例说明:

CSV file contents: 

header1, header2 
1,1 
2,3 
5,8,, 
1 
1 
+1

什么内容应该是什么? – stamaimer

回答

0
def preprocess(filename): 
    with open(filename, 'r', encoding="utf-8") as csvfile:  
     for line in csvfile.readlines[1:]: 
      if ',' in line: 
       yield list(map(int, line.split(',')[0:2]))