这里区分两个句子是我的数据的一个例子识别/由R
ID地址
Table1:User table
id address
1 mont carlo road,CA
2 mont road,IS
3 mont carlo road1-11,CA
Table 2(The output I wanna get)
Similarity Matrix
id 1 2 3
1
2 3
3 1 3
1~3 very similar~very dissimilar
我的问题是如何通过地址来识别在表1的情况之间的相似性,然后输出结果,如R中的表2所示的相似矩阵。重点是如何计算R中两个句子之间的比较,然后设置一个尺度来衡量一对之间的相似度,最后输出一个矩阵。
http://stackoverflow.com/questions/6704499/algorithm-to-compare-similarity-of-english-sentences – KFB 2014-10-17 05:31:15
@KFB谢谢你的建议。我正在寻找一个详细的方法/算法R. – user3566160 2014-10-17 05:35:51
看到我的答案与RecordLinkage这个问题:http://stackoverflow.com/questions/26405895/how-can-i-match-fuzzy-match-strings-from-两个数据集#26408600 – lawyeR 2014-10-17 10:24:00