2017-10-16 26 views
1

聚合值我有一个数据框下面值Python的:如何在数据帧

Text        State 
This is a beutiful day    California 
But I am stuck with code   New York 
It's too hard      California 
Can somebody please help me   Florida 
I am new to python     Florida 
How should I solve this problem  New York 
Day is turning bad     New York 
I am getting exhaused    California 
Need some help      New York 

我需要在文本状态计算情感分析明智的。我该如何汇总文本状态,然后进行情感分析。

df = df.groupby(df.columns.difference(['Text'])) 
result = pd.DataFrame(df['State'].unique(), columns=df.columns) 

我想这样做,首先聚合文本,但它不工作。需要一些关于聚合的建议,以及如何使用数据框中的循环执行情感分析。

回答

1

您可以使用lambda函数对文本进行分组,文本和连接使用提供的分隔符。

`delimiter = ' ' 
df2 = df.groupby('State')['Text'].apply(lambda x: "%s" % delimiter.join(x)).reset_index() 
print (df2)` 

添加reset.index()将转换成你需要的数据帧

+1

'申请(delimiter.join)'就足够了。 –

+0

谢谢,它工作。您是否也可以建议我现在应该如何对'df2'数据框的每一行进行情绪分析? – Alex

+0

以及如何对文本列进行预处理和取消以移除所有停用词,标点符号和数字 – Alex