如果要过滤字符串在列值中的那些行,可以使用类似data.sample_id.str.contains('hph')
(之前回答:check if string in pandas dataframe column is in list或Check if string is in a pandas dataframe)的内容。pandas字符串包含查找:NaN导致值错误
但是,我的查找列包含emtpy单元格。因此,str.contains()
产生NaN
值,我得到索引值的错误。
`ValueError: cannot index with vector containing NA/NaN values``
什么工作:
# get all runs
mask = [index for index, item in enumerate(data.sample_id.values) if 'zent' in str(item)]
有一个比这更优雅且快速的方法(类似于str.contains()
)?