我有一个名为'Raw'的熊猫df列,其格式不一致。该字符串包含看起来像:Python使用正则表达式提取pandas列中字符串的部分
'(1T XXX, Europe)'
'(2T YYYY, Latin America)'
'(3T ZZ/ZZZZ, Europe)'
'(4T XXX XXX, Africa)'
在“原始”的字符串相一致的唯一的事情是,他们以数字开头,包括中间+空格逗号,它们包含圆括号好。现在
,我想在我的数据帧创建两个额外列(型号和地区):
- “模式”将包含字符串的开始,即第一个括号和逗号之间的一切
- “区”将包含字符串的结尾,即逗号后的空格,最后括号
我怎么做,使用正则表达式之间的一切吗?