我从以下书中例子Python的数据分析。特别是,从第9章开始的2012年选举数据库。数据位于一个大的csv文件中,用逗号分隔。但是文件的每一行都有一个额外的尾随分隔符,这似乎混淆了pandas.read_csv
。蟒蛇大熊猫 - 尾随分隔符混淆read_csv
它把多余的分隔符,就好像有一个额外的列。所以还有一个比标题要求更多的列。然后pandas.read_csv
将第一列作为行标签。总体效果是,列和标题不再对齐 - 第一列变为行标签,第二列以第一个标题命名,等等。
这很烦人。任何想法如何告诉pandas.read_csv
做正确的事情?我找不到一个。
伟大的书,顺便说一句。
很高兴知道这本书有一个github回购。谢谢,韦斯。 – edwardw
我只是想说这个问题发生在其他地方。我刚刚从NOAA气候网站下载了一些天气数据,每个CSV文件的末尾都有一个逗号。我想出了与上面列出的相同的解决方法。这很烦人,并花了我一段时间来找出为什么read_csv()不起作用。 – user2072880