在数据帧变换系列（熊猫/ Python）的其中列有各系列的

我与大熊猫工作的水平和我使用的GROUPBY：在数据帧变换系列（熊猫/ Python）的其中列有各系列的

group = df_crimes_query.groupby(["CrimeDateTime", "WeaponFactor"]).size() 
group.head(20) 


CrimeDateTime WeaponFactor 
2016-01-01  FIREARM   11 
       HANDS   26 
       KNIFE    3 
       OTHER   11 
       UNDEFINED  102 
2016-01-02  FIREARM   10 
       HANDS   21 
       KNIFE    8 
       OTHER    6 
       UNDEFINED  68 
2016-01-03  FIREARM   12 
       HANDS   13 
       KNIFE    6 
       OTHER    5 
       UNDEFINED  73 
2016-01-04  FIREARM   11 
       HANDS   10 
       KNIFE    1 
       OTHER    3 
       UNDEFINED  84 
dtype: int64

类型的它是一个系列：

type(group) 

pandas.core.series.Series

我想关于这样的数据帧：

CrimeDateTime FIREARM  HANDS KNIFE OTHER UNDEFINED 
2016-01-01  11   26  3  11  102 
2016-01-02  10   21  8  6  68 
2016-01-03  12   13  6  5  73 
2016-01-04  11   10  1  3  84

我想为我绘制5蒂姆使用这个数据帧e系列之后，每种类型（火警，手等）。我尝试过，在网上搜索，但没有成功。

的代码是在我的GitHub（在部分称为测试）：https://github.com/rmmariano/CAP386_intro_data_science/blob/master/projeto/crimes_baltimore/crimes_baltimore.ipynb

我有其他的测试代码，但是我已经删除是最清楚的。

有人有什么想法吗？

来源

2017-09-02 rmmariano

选项1
简单和缓慢

pd.crosstab(df.CrimeDateTime, df.WeaponFactor) 

WeaponFactor FIREARM HANDS KNIFE OTHER UNDEFINED 
CrimeDateTime           
2016-01-01   11  26  3  11  102 
2016-01-02   10  21  8  6   68 
2016-01-03   12  13  6  5   73 
2016-01-04   11  10  1  3   84

选项2
更快，酷！

pd.get_dummies(df.CrimeDateTime).T.dot(pd.get_dummies(df.WeaponFactor)) 

      FIREARM HANDS KNIFE OTHER UNDEFINED 
2016-01-01  11  26  3  11  102 
2016-01-02  10  21  8  6   68 
2016-01-03  12  13  6  5   73 
2016-01-04  11  10  1  3   84

选项3
下一级别功夫熊猫！

i, r = pd.factorize(df.CrimeDateTime.values) 
j, c = pd.factorize(df.WeaponFactor.values) 
n, m = r.size, c.size 
b = np.bincount(j + i * m, minlength=n * m).reshape(n, m) 

pd.DataFrame(b, r, c) 

      FIREARM HANDS KNIFE OTHER UNDEFINED 
2016-01-01  11  26  3  11  102 
2016-01-02  10  21  8  6   68 
2016-01-03  12  13  6  5   73 
2016-01-04  11  10  1  3   84

来源

2017-09-02 05:50:51 piRSquared

令人惊叹。太棒了，先生。 – Dark

这是功夫熊猫:) – Vaishali

非常感谢，它很棒：D – rmmariano

你会得到使用所需的结果

df_crimes_query.groupby(["CrimeDateTime", "WeaponFactor"]).size().unstack().reset_index()

来源

2017-09-02 03:30:46 Vaishali

非常感谢：D – rmmariano

相反GROUPBY，您可以使用数据透视表即

df.pivot_table(index='CrimeDateTime',columns='WeaponFactor',values='count')

基于在笔记本你的代码，如果你有这样

一个数据帧的

 
    CrimeDateTime WeaponFactor count 
0  2016-01-01  FIREARM  11 
1  2016-01-01  HANDS  26 
2  2016-01-01  KNIFE  3 
3  2016-01-01  OTHER  11 
4  2016-01-01 UNDEFINED 102 
5  2016-01-02  FIREARM  10 
6  2016-01-02  HANDS  21 
7  2016-01-02  KNIFE  8 
8  2016-01-02  OTHER  6 
9  2016-01-02 UNDEFINED  68 
10 2016-01-03  FIREARM  12 
11 2016-01-03  HANDS  13 
12 2016-01-03  KNIFE  6 
13 2016-01-03  OTHER  5 
14 2016-01-03 UNDEFINED  73 
15 2016-01-04  FIREARM  11 
16 2016-01-04  HANDS  10 
17 2016-01-04  KNIFE  1 
18 2016-01-04  OTHER  3 
19 2016-01-04 UNDEFINED  84

输出：

df.pivot_table(index='CrimeDateTime',columns='WeaponFactor',values='count')

 
WeaponFactor FIREARM HANDS KNIFE OTHER UNDEFINED 
CrimeDateTime           
2016-01-01   11  26  3  11  102 
2016-01-02   10  21  8  6   68 
2016-01-03   12  13  6  5   73 
2016-01-04   11  10  1  3   84 
In [595]:

来源

2017-09-02 04:11:47 Dark

谢谢Bharath：D – rmmariano

在数据帧变换系列（熊猫/ Python）的其中列有各系列的

回答

相关问题