我试图找到一种方法来搜索文本字段以识别可能类似的行,以便我可以确定它们是否应该合并重复。例如,如果数据我看起来像这样:Oracle查找类似但不完全匹配的重复记录
MyText_Column
-
鲍勃
- 鲍比
- 罗伯特
- 简
- 詹尼
- 珍妮 乔
- 约翰
- 乔纳森
一个GROUP BY将无法工作,因为没有值是完全一样的,但如果我能有一个查询,将返回的可能性的列表,一排类似会很好。也许有一个更好的布局,但我所想象的是这样一个结果:
查询结果
搜索比较Likely_Match
- 鲍勃·鲍比96%
- 鲍勃·罗伯特12%
- Bob Jane 0%
- Bob Janey 0%
- ... ..
- 简詹尼87%
- 简珍妮69%
- 简乔12%
然后用类似的结果,我可以由似然和目视扫描排序,以确定该结果是重复或不。