string-matching

    0热度

    1回答

    我有一个非常有趣的问题。 我有一组字符串,我想知道如何最好地匹配这些字符串组合在另一个字符串对最大化函数。 就是一个例子。说我有一组: ['aabbcaa', 'bbc'] 和我有串 'fgabbcdaabbcaaef' ,为此可能的匹配为: fga[bbc]daadaa[bbc]aaef 或 fga[bbc]daad[aabbcaa]ef 现在,给定一个简单的最大化函数,我会说t

    1热度

    1回答

    我有HTML链接的列,例如返回结果, Sheet 1, Column A: a href="http://junk.com"> a href="http://example.com"> a href='/relative-link/' target=''> 我想比较字符串的列表答:在另一张纸上,并返回B:B中的值。 因此,例如,我的另一片名单可能为:

    1热度

    1回答

    我有一个问题,我们可以通过将e.d值除以两个字符串的长度来规范levenshtein编辑距离吗? 我在问这个,因为如果我们比较两个不等长的字符串,那么两者的长度之间的差异也会被计算在内。 例如: ed('has a','has a ball')= 4 and ed('has a','has a ball is is round')= 15 如果我们增加字符串的长度,即使它们相似,编辑距离也会增加。

    1热度

    4回答

    我的目标是检测2个字符串是否相同,但顺序不同。 Example "hello world my name is foobar" is the same as "my name is foobar world hello" 我已经试过的是将两个字符串拆分成列表并在循环内进行比较。 text = "hello world my name is foobar" textSplit = text.

    1热度

    1回答

    程序的任务是检查字符串s2是否是给定长度相等的s1和s2的另一个字符串(s1 + s1)的子字符串。例如:[s1,s2] = [“abc”,“bca”]应该返回true,而[s1,s2] = [“abc”,“bac”]应该返回false。 并且两个字符串的长度限制是10^5。使用(s1+s1).find(s2) == string::npos约需0.1秒完成。 我实现它在一个复杂的O(n * m)

    0热度

    1回答

    之前,提交假设我们有一个hosts文件: 10.10.10.10 test1.domain test1 20.20.20.201 test2.domain test2 30.30.301.30 test3.domain test3 40.40.40.40 test4.domain test4 注意的IP地址与3个位数主机标识符,考虑到这一点,每条线的结构略有不同,因为具有2位数的那些线在

    1热度

    2回答

    我有一个包含URL格式列表的REST文档。 /com/shop/product/{product_id} /com/shop/{shop_id} /com/city/{city_name}/shop/{shop_id}/details 等。 和动态的URL类似于下面 /com/shop/product/0ab12h /com/shop/j8khdj /com/city/bangalor

    1热度

    1回答

    由于数据在遗留系统中存储错误,因此我使用R和agrep()来匹配公司名称列表 - 因为数据在传统系统中存储错误 - 没有第四种常规格式,公司在同一级别上录制作为客户,这意味着每个新客户都有一个新的公司条目,这导致一家公司拥有许多不同的公司名称 - 这在很多情况下都能正常工作。 有时,特别是对于短字符串,我得到的 - 至少对我来说 - 奇怪的比赛,例如(ABC是第一家名称): ABC ABAXIS

    1热度

    1回答

    目前,我正在使用Pythons BeautifulSoup Library来检索报纸文章的网页。这些文章存储在对象“细节”中。 然后我有几个存储在对象“行”中的各种街道名称。现在我想搜索“行”中包含的街道名称的文章。 如果其中一个街道名称是其中一篇文章的一部分,我想在数组中保护街道名称。 如果没有匹配项目(所选文章不包含任何街道名称),那么数组中应该有一个空元素。例如,假设对象“线”由(“Abbe

    0热度

    1回答

    我需要解决此问题。 我需要从两个数据框构建一个完整的数据框,但如果需要,只包含来自第二个数据框的某些信息。 例: DF1: MATERIAL_N° Description DATE DUE 0 123123300 Lightbulb X 01/05/2018 1 220466 Lightbulb Y 04/04/2018 2 220000 Lightbulb Z 07/07/2018