所以我处于违反直觉的情况,我想获得一些建议。 大部分我只是做一些字符串匹配,使用提取的字符串作为我的正则表达式的模式。虽然一般情况下,我可以用模糊正则表达式搜索做得很好,但偶尔会遇到这种情况: 比方说,我从一些数据(Python正则表达式包)中提取了以下模式。 pattern = 'the quick brown fox jumps over the lazy dog'
现在,我需要有与之相匹
我有两个数据帧,每个数据帧具有不同数量的行。下面是每个数据几排设置 df1 =
Company City State ZIP
FREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101
CITYARCHRIVER 2015 FOUNDATION St. Louis MO 63102
在Excel中我有一个艺术家,歌曲,版本列表。 此列表包含超过15000条记录。 问题是该列表包含一些“重复”记录。我说“重复”,因为它们不完全匹配。有些人可能会有一些错字,我想解决这些问题并删除这些记录。 因此,例如一些记录: ABBA - Mamma Mia - Party
ABBA - Mama Mia! - Official
每个破折号表示一个单独的列(SO 3列A,B,C都填写)