我有名字的数据帧被解析:在大熊猫的数据帧与标点符号标识行
**FIRST_NAME**
Jon
Colleen
William
Todd
J.-
&Re Inc
123Trust
我创建一个列标志的名称,如果它是好还是坏:
df['BAD']=pd.Series(np.zeros(1),index = df.index)
**FIRST_NAME** **BAD**
Jon 0
Colleen 0
William 0
Todd 0
J-Crew 0
&Re Inc 0
123Trust 0
如果FIRST_NAME包含标点,数字或空格,我想更新BAD = 1。
**FIRST_NAME** **BAD**
Jon 0
Colleen 0
William 0
Todd 0
J-Crew 1
&Re Inc 1
123Trust 1
这里是我的代码:
punctuation = '!"#$%&\'()*+,-./:;<=>[email protected][\\]^_`{|}~ 1234567890'
i=0
while i <int(len(dfcopy)):
for p in punctuation1:
if (df['Bad'][i]==1):
df['Bad'][i]=1
elif(p in list(df.iloc[i,1])and df['Bad'][i]==0):
df['Bad'][i]=1
else:
df['Bad'][i]=0
i=i+1
有没有办法更快地做到这一点?
谢谢!我用“set”来使用你的第二个解决方案。 – jgaw 2014-10-27 19:20:24