我是熊猫新手,我试图在Dataframe中加载csv。我的数据缺少代表的值? ,我试图用标准的Missing值替换它 - NaN熊猫如何更换?与NaN - 处理非标准缺失值
请帮助我解决这个问题。我尝试阅读熊猫文档,但我无法遵循。
def readData(filename):
DataLabels =["age", "workclass", "fnlwgt", "education", "education-num", "marital-status",
"occupation", "relationship", "race", "sex", "capital-gain",
"capital-loss", "hours-per-week", "native-country", "class"]
# ==== trying to replace ? with Nan using na_values
rawfile = pd.read_csv(filename, header=None, names=DataLabels, na_values=["?"])
age = rawfile["age"]
print age
print rawfile[25:40]
#========trying to replace ?
rawfile.replace("?", "NaN")
print rawfile[25:40]
不过令人惊讶的是参数'read_csv'没有工作。当价值实际上是'我有一个看似失败'? '我只是在标记'?'作为NaN。 – cphlewis 2015-03-25 06:27:00
你在那个专栏或其他地方有'?'吗? – EdChum 2015-03-25 08:49:28
奇怪的是,'read_csv'没有选择这个值,你可以发布原始输入数据来重现你的错误,它可能不仅仅是单个字符在该列 – EdChum 2015-03-25 08:51:09