2016-09-06 63 views
2

我想在我的数据框中“描述”Pandas中的函数,但它只显示一列而不是我在CSV文件中导入的四列。请注意,我正在使用Jupyter来执行此操作。DataFrame.describe方法忽略了一些列

下面是显示DataFrame的外观以及describe的结果的输出。有谁知道为什么我在使用describe时没有回到所有列?它与我的文件有什么关系,这是一个简单的CSV文件?

hist.head() 

    Year Month  Overall  Mobile 
0 2016 July 76,762,352 65,908,711 
1 2016 June 76,523,713 65,465,770 
2 2016 May 77,057,451 65,297,809 
3 2016 April 76,722,596 64,739,144 
4 2016 March 78,258,917 66,287,421 

hist.describe()  
       Year 
count 67.000000 
mean 2013.313433 
std  1.634931 
min 2011.000000 
25% 2012.000000 
50% 2014.000000 
75% 2015.000000 
max 2016.000000 

回答

4

当数据帧包含至少一个数值列,df.describe()只描述的数值列(多个)。这意味着您的其他栏不会被视为数字。您可以通过键入df.dtypes(它将返回其他列的对象)来确认。

DataFrame中的问题是千位分隔符。您可以通过pd.read_csv(filename, sep=';', thousands=',')正确读取它。 sep部分只是基于千位分隔符的猜测。您可能需要根据您的文件进行更改。

+0

谢谢我试过,但它似乎也没有工作。我想在此发布另一个屏幕截图,但它看起来不会让我看到。 hist.head()给我2016年,7月,“76,762,352”,“65,908,171”,“10.9 ...对于一行,这不是它应该看起来如何。” – youngchea

+0

你可以[编辑](http:// stackoverflow。 com/posts/39352696/edit)你的文章包含你的CSV文件的几行? – ayhan

+0

这不是什么head()在做什么? – youngchea