我想统计某个大学课程在数千个条目列表中出现的次数。问题是课程并不总是拼写相同。例如,Computer Engineering
可以拼写为Computers Engineering
。什么是测试2个字符串是否非常相似的正确,优雅的方法?比较字符串的相似之处?
0
A
回答
2
我会尝试使用stemming canonize字符串。这个想法是 - 给每个字符串的标准化形式,和两个不同的字符串,代表相同的单词很可能有相同的佳能形式(例如,Computer
和Computers
将具有相同的加农炮形式,你会得到一个匹配)。
Porter stemming algorithm经常用于经典化。
一个选择 - 是分级彼此间的距离琴弦,建议Levenshtein Distance可以帮你用它,但个人 - 我宁愿册封。
+0
我已经使用了Jaro-Winkler距离,我通过Google搜索Levenshtein距离发现了这个距离,效果很好。 – MaiaVictor
相关问题
- 1. C#比较相似的字符串
- 2. 字符串比较,返回最相似
- 3. Python字符串比较相似性
- 4. C# - 比较字符串相似
- 5. 字符串与最相似字符串的比较
- 6. 如何比较2个具有相似字符的字符串?
- 7. 红宝石比较两个字符串的相似百分比
- 8. 字符串比较算法,相关性,多少“相似”2个字符串
- 9. 比较长字符串并返回相似度和百分比
- 10. Macro VBA - 比较两个字符串中的相似数字
- 11. 如何比较字符串数组并计算相似的字
- 12. 最好的方法来比较2个相似的字符串?
- 13. Python比较两个字符串的相似性列表
- 14. 比较两个英文字符串的相似性
- 15. 比较两个字符串并返回最相似的一个
- 16. 比较两个字符串的相似性在Python
- 17. 比较字符串数组的相似性
- 18. R - 比较类似但不相同的字符串
- 19. 如何比较python中两个相似的句子字符串?
- 20. 比较两个向量字符串的相似性C++
- 21. 字符串比较似乎无效
- 22. 比较字符串近似匹配
- 23. 与整数比较相比,为什么字符串比较如此之快?
- 24. 比较数组之间的相似性
- 25. 比较字符串的长度相等
- 26. 比较批处理中的字符串
- 27. 字符串之间的比较出错
- 28. C#字符串“相似性”比较测试
- 29. 两个字符串之间的相似
- 30. 一组字符串之间的百分比相似度
http://en.wikipedia.org/wiki/Levenshtein_distance –