我有一个csv文件是通过将Tableau表导出到csv生成的,但我无法设法在Python中打开它。读取csv文件到熊猫失败
我试图使用pd.read_csv但失败。
import pandas as pd
#path to file
path = "tableau_crosstab.csv"
data = pd.read_csv(path, encoding="ISO-8859-1")
这适用于文件中读取,但结果只是一个数字,每行一个字符,并在帧的头部一些奇怪的字符行。
ÿþd
o
m
a
i
等等。当我尝试导入Excel中的文件,我必须选择选项卡作为分隔符,但是当我索引树,在这里它失败
import pandas as pd
#path to file
path = "tableau_crosstab.csv"
data = pd.read_csv(path, encoding="ISO-8859-1", sep='\t')
CParserError:错误符号化数据。 C错误:第7行预计1字段,锯2
我曾尝试打开带有编解码器的文件,然后它说编码是'cp1252',但使用它作为编码也失败了。
我也尝试使用utf-8来阅读它,并且也失败了。 我正在想出如何解决这个问题。
下面是其中一个副本,如果该文件是,如果有人可以看看链接 http://www.mediafire.com/file/6dtxo2deczwy3u2/tableau_crosstab.csv
它的工作对我来说太。谢谢!所以从看看你能明白编码是'utf-16'? – Siesta
是的,如果你看维基百科页面:https://en.wikipedia.org/wiki/Byte_order_mark#Byte_order_marks_by_encoding,你会看到十六进制值和显示的字符,你习惯看到这些并在一段时间后识别它们 – EdChum