2016-03-03 39 views
-1

我用读普查ACS文件到IPython的笔记本在大块:如何TextFileReader对象导出为txt

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000) 

然后,我挑选了一些列我想保持和使用进行分析。现在我想将pusb导出到txt或csv文件,但`pusb.to_csv(etc ...不起作用,我该怎么做?有没有办法连接我读过的块, ?!再一个数据帧提前

感谢

回答

0

你可以试试功能concat

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000) 
print pusb 
#<pandas.io.parsers.TextFileReader object at 0x00000000150E0048> 
df = pd.concat(tp, ignore_index=True) 

我认为是必要的附加参数ignore index运作concat,因为避免了指数的口是心非

我尝试更好的解释:

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000) 

函数read csv由大块 - docs和输出TextFileReader,不DataFrame

您可以检查这个迭代的对象:

for chunk in pusb: 
    print(chunk) 

然后你需要concat块到一个大DataFrame - 使用concat

Concatenating objects

+0

ValueError:无连接的对象 – Josh

+0

尝试检查'在pusb中的块:print(chunk)' – jezrael

+0

它不会返回一个错误,但我并不真正了解它做了什么(并且看起来没有成为输出)。你介意给菜鸟解释一下吗? – Josh