我需要使用存储在文件中的数据创建数据框。为此,我想使用read_csv
方法。但是,分隔符不是很规则。某些列由制表符分隔(\t
),其他用空格分隔。此外,某些列可以由2或3或更多空格分隔,甚至可以由空格和制表符组合(例如3个空格,两个制表符和1个空格)。如何使read_csv中的分隔符更加灵活wrt空格?
有没有办法让大熊猫正确处理这些文件?
顺便说一句,如果我使用Python,我没有这个问题。我用:
for line in file(file_name):
fld = line.split()
它的作品完美。它不关心字段之间是否有2或3个空格。即使是空格和制表符的组合也不会导致任何问题。熊猫可以做同样的事吗?
你也可以使用'skipinitialspace'跳过初始空间 – jarondl 2014-12-04 14:28:00