2014-01-22 30 views
0

对于noobish问题的道歉...sklearn附带的iris.csv数据集中是否隐藏了数据?

我正在玩sklearn附带的虹膜数据集。当我输入:

iris.feature_names 

它输出:

['sepal length (cm)', 
'sepal width (cm)', 
'petal length (cm)', 
'petal width (cm)'] 

什么我不明白的是它是越来越那些话。我在Excel中打开了虹膜CSV,我找不到任何这些词的引用。

我错过了什么?

这是CSV所有这可见在Excel中:

150,4,setosa,versicolor,virginica 
5.1,3.5,1.4,0.2,0 
4.9,3.0,1.4,0.2,0 
4.7,3.2,1.3,0.2,0 
4.6,3.1,1.5,0.2,0 
5.0,3.6,1.4,0.2,0 
5.4,3.9,1.7,0.4,0 
4.6,3.4,1.4,0.3,0 
5.0,3.4,1.5,0.2,0 
4.4,2.9,1.4,0.2,0 
4.9,3.1,1.5,0.1,0 
5.4,3.7,1.5,0.2,0 
4.8,3.4,1.6,0.2,0 
4.8,3.0,1.4,0.1,0 
4.3,3.0,1.1,0.1,0 
5.8,4.0,1.2,0.2,0 
5.7,4.4,1.5,0.4,0 
Etc... 

回答

4

如果你看一下the sourcedatasets.load_iris()功能 - 这,如果你使用IPython中你可以很容易做到使用datasets.load_iris?? - 你可以看看发生了什么。在函数的最后一部分 - 它的读取和处理的iris.csviris.rst文件后 - 你看

return Bunch(data=data, target=target, 
      target_names=target_names, 
      DESCR=fdescr.read(), 
      feature_names=['sepal length (cm)', 'sepal width (cm)', 
          'petal length (cm)', 'petal width (cm)']) 

等等这些功能名称在功能硬编码,而不是在csv

+0

当我尝试使用“??”语法在Ipython我得到这个:'code'iris = datasets.load_iris()?? 文件“”,第1行 iris = datasets.load_iris()?? ^ SyntaxError:无效语法 – user3213857

+0

@ user3213857:尝试'datasets.load_iris ??',而不是'iris = datasets.load_iris()??'。 – DSM