我有一个包含51,347行的数据集。当使用熊猫导入数据并将分隔符设置为“|” ,我输了394排。使用分隔符导入时,大熊猫缺少行=“|”
import pandas as pd
df = pd.read_csv("Basin11.txt", sep='|', error_bad_lines=False,
dtype={'Start Date': str, 'Greater Than/Less Than': str,
'Parameter Code': float, 'Start Time': str, 'Start Depth': float, 'Composite Category': str,
'Composite Type': str})
print(len(df.index))
如果删除在SEP变量,数据将不加载为多个列,但将加载的行的适当数量。它似乎只是这个文件的一个问题。 Basin11.txt File
有谁知道我为什么会丢失数据?
我会想象大约394行有“自由”的文字列正在翻译|翻译|翻译,而error_bad_lines = False默默地忽略那些行 – Boud
我试过删除error_bad_lines = False,但它对长度没有影响。除了sep ='|'之外,我们单独删除了每个参数,但没有任何效果。 – Will