2016-09-23 69 views
13

我想了解PySpark中DataFrame的大小/形状。我没有看到可以做到这一点的单一功能。PySpark 2.0 DataFrame的大小或形状

在Python我可以做

data.shape() 

是否有PySpark类似的功能。这是我目前的解决办法,但我正在寻找一个元素一个

row_number = data.count() 
column_number = len(data.dtypes) 

列数的计算是不理想......

+0

的数量? – GwydionFR

回答

1

我觉得没有像星火data.shape类似的功能。但我会用len(data.columns)而不是len(data.dtypes)

+1

,只是给你的列数。那么行数呢? – JanLauGe

7
print((df.count(), len(df.columns))) 
10

df.count(),用于在功能将这个行