是否有内置的方式可以使用read_csv
在不知道提前行长的情况下只读取文件的第一行n
?我有一个需要很长时间阅读的大文件,偶尔只需要使用第一行,例如20行来获取它的一个样本(并且不想加载完整的内容并将它放在头上)。读取大熊猫数据帧的前几行的方法
如果我知道我可以做类似footer_lines = total_lines - n
的行的总数并将其传递给skipfooter
关键字arg。我目前的解决方案是将第一n
线,Python和StringIO的手动将其抢来的大熊猫:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
这并不是说不好,但有一个更简洁,“pandasic”的方式与关键字做到这一点(?)或者其他的东西?
要了解如何加载最后的_N_行结帐[this SO post](http://stackoverflow.com/questions/17108250/efficiently-read-last-n-rows-of-csv-into-dataframe) – zelusp 2016-09-27 03:09:09
你的意思是“pandastic”吗? :) – 2018-01-15 07:08:22