如何在R中对单词(非字符)Level进行Levenshtein距离测量?句级R中的Levenshtein距离
参见以下:
预期结果1)
# levenshtein operations needed: Delete*2 --> 2 operations
array1 <- c("word", "car")
array2 <- c("word", "pool", "beer", "car")
我正在寻求的功能levenshtein()
,从而返回上面的例子中的2的距离:
levenshtein(array1, array2)
--> 2
预期成果2)
# levenshtein operations needed: Delete and insert --> 2 operations
array1 <- c("word", "car", "pool")
array2 <- c("word", "pool", "car")
我正在寻找一个功能levenshtein()
,从而返回上面的例子中的2的距离:
levenshtein(array1, array2)
--> 2
我发现: Word-level edit distance of a sentence 但我没有找到工作尼德曼 - 翁施implentation国债收益率预期的结果,如上所述。
喜卡尔,感谢您的答复。我不确定你的答案是否会返回两个例子的距离?如果不清楚,我会对该示例进行编辑。 – ThanksGuys
我不明白你在问我在想什么。你是否正在寻找array2中所有出现的组合编辑距离为2的事件,例如'insertions + deletions = 2'?这里的实际目标是什么?按照计划@ThanksGuys? –