1
我试图在熊猫数据框中进行字符串替换。需要循环单个列,所以它基本上是一个系列的替代品:熊猫系列中的部分字符串替换
In [105]: df = pd.DataFrame([['0 - abc', 1, 5], ['0 - abc - xyz', 2, 3]], columns=['col1','col2','col3'])
In [106]: df
Out[106]:
col1 col2 col3
0 0 - abc 1 5
1 0 - abc - xyz 2 3
In [107]: for col in df.columns:
...: df[col] = df[col].replace(to_replace='".*"|^0', value=df['col3'], inplace=False, regex=True)
...:
In [108]: df
Out[108]:
col1 col2 col3
0 5 1 5
1 3 2 3
代替上述DF的,我期待的结果:
In [110]: df_result
Out[110]:
col1 col2 col3
0 5 - abc 1 5
1 3 - abc - xyz 2 3
也就是说,在“0 - ABC ',只有开头的'0'应该被替换为'5'而不是整个字符串。
我在正则表达式中错过了什么?在熊猫中是否有替代方法来完成这种字符串替换?谢谢。
谢谢@COLDSPEED!是的,我的用例需要有'|' (或)条件在正则表达式。 –
@ D.prd当然。根据需要修改。但主要的解决方案是'.astype'。 –
是的,做@COLDSPEED,再次感谢你! –