2016-03-30 56 views
0

我想要在熊猫中分割一列文本。基于多个字符串在熊猫中分列一列

此列包含单词'Alpha','Beta'。 我需要在这些单词之后拆分这一列,这些单词以及之前的所有内容都需要在一列中进行分割,并且之后的所有内容都将放在一个新列中。

我尝试这样做:

split_df = df.str.split('ALPHA ').apply(pd.Series) 

但后来我失去了一切,你可以通过split正则表达式r'Alpha|Beta' ALPHA

回答

1

IIUC之前 - 这意味着AlphaBeta

print df 
      text 
0 aaa Alpha bbb 
1 ddd Alpha ccc 
2 uuu Beta vvv 

split_df = df['text'].str.split(r'Alpha|Beta').apply(pd.Series) 
split_df.columns = ['before','after'] 
print split_df 
    before after 
0 aaa  bbb 
1 ddd  ccc 
2 uuu  vvv 
相关问题